Núcleo Interinstitucional de Lingüística Computacional
 
An Interinstitutional Center for Research and Development in Computational Linguistics

ReGra

A Grammar Checker for Brazilian Portuguese

Prizes
Peão da Tecnologia
(Fundação Parque de Alta Tecnologia de São Carlos) (1998)

Prêmio Inovação Tecnológica (Alcatel/Brasil). (1999)

Magazine Article

Revista Inovação (Ano 3 - No. 1 - Jan./Fev. 2007) (Instituto INIEMP)

 

Starting Time: 1993

  Current Status:
    (2001-2003) Extending rules for checking style errors; redesigning the parser to minimize false positives interventions.
    Supported by Itautec-Philco S.A. and FAPESP

Goals
    To implement a robust grammar checker for Brazilian Portuguese, which covers most of the most frequent grammar errors.

ReGra's Features
    Extensive tagged lexicon of about 1.5 million words, including proper names, acronyms, abbreviations. It is the first to provide readability scores for texts in Brazilian Portuguese. Testing with the most extensive corpus of written Brazilian Portuguese containing over 40 million words.

Result
    The most complete grammar checker for Brazilian Portuguese, which is available as an integral part of the Microsoft Word and the wordprocessor REDATOR by Itautec-Philco.

Other results
    Brazilian Portuguese Grammar Description Online.

Team (2002)
   Maria das Graças Volpe Nunes (coordinator)
   Osvaldo Novais de Oliveira Jr.
   Ronaldo Teixeira Martins (computational linguist in charge)
   Ricardo Hasegawa (programmer in charge)
   Lucia Helena M. Rino
   Jorge Marques Pelizzoni
   Ariani Di Felippo
   Vanessa Filié

Finantial Support
    Itautec-Philco: since 1993;
    FAPESP (PITE, Proc. 97/02608-1; Proc. 00/10688-0): 1997-1998; 2001-2003;
    Finep (PADCT-CE, Proc. 88-98-059100-02-01); 1999-2001.

  Contact
    Maria das Graças Volpe Nunes: gracan@icmc.usp.br

Related Publications

Martins, R.t. (2002) PROBI: um corpus de teste para o revisor gramatical ReGra. NILC-TR-02-10, 7p.download zip file

Rino, L. H. M.; Martins, R. T.; Marchi, A. R.; Kuhn, D. C. S.; Pinheiro, G. M.; Pardo, T. A. S.; Di Felippo, A.; Nunes, M. G. V. Projeto TraSem: A investigação teórica sobre o problema da ambigüidade categorial. Série de Relatórios do NILC. NILC-TR-01-1, Abril 2001, 42p.download zip file

Pinheiro, G. M.; Rino, L. H. M.; Martins, R. T.; Di Felippo, A.; Fillié, V. M.; Hasegawa, R.; Nunes, M. G. V. Projeto TraSem: A investigação empírica sobre o problema da ambigüidade categorial. Série de Relatórios do NILC. NILC-TR-01-2, Abril 2001, 23p.,download zip file

Jesus, M.A.C.; Nunes, M.G.V. Autômatos Finitos e Representação de Grandes Léxicos: Aplicação a um Léxico de Português Brasileiro. V Encontro para o processamento computacional da Língua Portuguesa Escrita e Falada (PROPOR'2000). Atibaia, SP, 20 a 22 Novembro 2000.download zip file

Nunes, M.G.V.; Oliveira Jr., O.N. O processo de desenvolvimento do Revisor Gramatical ReGra. Anais do XXVII SEMISH (XX Congresso Nacional da Sociedade Brasileira de Computação), Volume 1, p.6 (resumo). Artigo Completo na Versão em CD-Rom. PUC-PR, Curitiba, Julho 2000.download zip file

Montilha, G; Nunes, M.G.V. Testes Comparativos entre Revisores Gramaticais de Português. (NILC-TR-00-9). Junho 2000, 32p.download zip file

Nunes, M.G.V.; Martins,R.T.; Hasegawa, R.; Haber, R.R.; Montilha, G. Relatório dos Testes Comparativos entre Diferentes Versões do Revisor Gramatical ReGra. (NILC-TR-00-8). Junho 2000, 08p.download zip file

Kuhn, D.; Abarca, E.; Nunes, M.G.V. Corpus NILC - Situação em Maio/2000. (NILC-TR-00-7). Junho 2000, 32p. download zip file.download zip file

Jesus, M.A.C.; Nunes, M.G.V. Representação de Léxicos Através de Autômatos Finitos. Relatórios Técnicos do ICMC-USP, 110 (NILC-TR-00-5). Março 2000, 49p.download zip file

Bonfante, A.G.; Nunes, M.G.V. Métodos Empíricos para Correção Gramatical de Línguas Naturais. Relatórios Técnicos do ICMC-USP, 108 (NILC-TR-00-4). Março 2000, 63p.download zip file

Pardo, T.A.S.; Rino, L.H.M.; Nunes, M.G.V. Documentação e Atualização do ReGra. Relatórios Técnicos do ICMC-USP, 109 (NILC-TR-00-3) Março 2000, 10p.download zip file

Bonfante, A.G.; Nunes, M.G.V. Connectionist Learning Apllied to a Brazilian Portugueses Grammar Checking. 5th Natural Language Processing Pacific Rim Synposium (NLPRS99) , November 5-7, 1999 Beijingm P.R. China. NLPNN'99 Natural Language Processing and Neural Networks.

Nunes, M.G.V.; Kuhn, D.; Marchi, A.R.; Nascimento, A.C.; Aluísio, S.; Oliveira Jr., O.N. Novos Rumos para o ReGra: extensão dorevisor gramatical do português do Brasil para uma ferramenta de auxílio à escrita. Proceedings do IV Encontro para o Processamento Computacional da Língua Portuguesa Escrita e Falada, PROPOR'99, Évora, Portugal, 21 e 22/09/99, p. 167-182.download zip file

Martins, R.T.; Montilha, G.; Rino, L.H.M.; Nunes, M.G.V. Dos Modelos de Resolução da Ambigüidade Categorial: O Problema do SE. Proceedings do IV Encontro para o Processamento Computacional da Língua Portuguesa Escrita e Falada, PROPOR'99, Évora, Portugal, 21 e 22/09/99, p. 115-128.download zip file

Martins, R.T.; Hasegawa, R.; Nunes, M.G.V.; Montilha, G.; Oliveira Jr., O.N.; Linguistic issues in the development of ReGra: a Grammar Checker for Brazilian Portuguese.Natural Language Engineering, Volume 4 (Part 4 December 1998): p287-307; Cambridge University Press.download zip file

Bonfante, A. and Nunes,M.G.V. Correção Gramatical da crase usando Redes Neurais. III Encontro para o Processamento Computacional da Lingua Portuguesa Escrita e Falada. PUCRS, Porto Alegre, Brasil, November 3 and 4, 1998..download zip file

Bonfante, A.G., Nunes, M.G.V. Redes Neurais e Correção Gramatical do Português: um estudo de caso. III Congresso Brasileiro de Redes Neurais. Florianópolis, Julho 1997, pp. 262-267. download ps file.download zip file

Zavaglia, C. A Construção de um Dicionário de Máquina como Suporte para Revisores Ortográfico e Gramatical. Anais do XXVI Seminário do Grupo de Estudos Lingüísticos (GEL). Campinas-SP, 1997, pp. 157-162.

Martins, R.T. Análise Sintática Automática para Revisores Gramaticais. Anais do XXVI Seminário do Grupo de Estudos Lingüísticos (GEL). Campinas-SP, 1997, pp. 163-168.

Hernandez, J.M.C. O Tratamento Computacional dos Erros mais Freqüêentes Manifestados em Textos Produzidos por Alunos Universitários e de Segundo Grau. Anais do XXVI Seminário do Grupo de Estudos Lingüísticos (GEL).Campinas-SP, 1997, pp. 169-174.

Ghiraldelo, C.M. A Importância de um Banco de Textos para a Elaboração de um Revisor Gramatical. Anais do XXVI Seminário do Grupo de Estudos Lingüísticos (GEL). Campinas-SP, 1997, pp. 176-180.

Nunes, M.G.V. et alii. (In Portuguese) The design of a Lexicon for Brazilian Portuguese: Lessons learned and Perspectives. Proceedings of the II Workshop on Computational Processing of Written and Speak Portuguese. CEFET-PR, Curitiba, 23 a 25/10/96, pp. 61-70.

Nunes, M.G.V. et alii. (In Portuguese) Development of a parser for Brazilian Portuguese.Proceedings of the II Workshop on Computational Processing of Written and Speak Portuguese. CEFET-PR, Curitiba, 21 a 22/10/96, pp. 71-80.

Nunes, M.G.V. et alli. A Construção de um Léxico da Língua Portuguesa do Brasil para suporte à Correção Automática de Textos. Relatórios Técnicos do ICMC-USP, 42. Setembro 1996, 36p.download zip file

Martins, T.B.F.; Ghiraldelo, C.M.; Nunes, M.G.V.; Oliveira Jr., O.N. Readability Formulas Applied to Textbooks in Brazilian Portuguese. Notas do ICMSC-USP, Série Computação, nro. 28, 1996, 11p.

Nunes, M.G.V. et alli. Style and Grammar Checkers for Brazilian Portuguese. Notas do ICMSC-USP, Série Computação, nro. 25, 1996, 14p.

Oliveira Jr., O.N.; Nunes, M.G.V. et alli. (In Portuguese) Development of a Grammar Checker for Brazilian Portuguese.Proceedings of the II Congress on Informatics and Telecomunication of Mato Grosso. Cuiabá, MT, September 1995, pp. 01-14.

Hasegawa, R.; Martins, R.T.; Nunes, MG.V. ReGra 2002: Características e Desempenho. NILC-TR-02-8, ICMC-USP, Junho 2002, 14p. download zip file