Unitex | Projeto Relex Brasil | NILC
Unitex-PB
Recursos Lexicais | Gramáticas de Resolução de Ambigüidade
Bibliotecas de Acesso a Léxicos | Programa de Compactação de Léxico | Programa Dicionário
Busca no Dicionário | Anotador Morfossintático

Projeto Unitex-PB

small logo


Título:
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB
Autor: Marcelo Caetano Martins Muniz
Email do Autor:
muniz@icmc.usp.br
Orientadora: Maria das Graças Volpe Nunes
Email do Orientador: gracan@icmc.usp.br
Início do Trabalho: março de 2002
Término: fevereiro de 2004

Resumo:

A escassez de recursos lingüístico-computacionais é um dos maiores entraves para o avanço das pesquisas, e conseqüente desenvolvimento de sistemas, na área de Processamento de Língua Natural (PLN) no Brasil. Este trabalho documenta a construção de uma série recursos lingüístico-computacionais para português brasileiro seguindo os formalismos utilizados pela ferramenta de processamento de córpus Unitex. Foram construídos léxicos computacionais, regras de resolução de ambigüidades e bibliotecas para acesso a léxicos compactados, assim como algumas ferramentas para validar esses recursos.

 Sobre | Mapa do Site | Licença | Contato | © 2004 Núcleo Interinstitucional de Lingüística Computacional