Unitex | Projeto Relex Brasil | NILC
Unitex-PB
Recursos Lexicais | Gramáticas de Resolução de Ambigüidade
Bibliotecas de Acesso a Léxicos | Programa de Compactação de Léxico | Programa Dicionário
Busca no Dicionário | Anotador Morfossintático

Bibliotecas de acesso a Léxicos

small logo

Um dos objetivos desse projeto foi desenvolver uma biblioteca de acesso e manipulação a léxicos compactados no padrão DELA, independente do Unitex, para que qualquer aplicação de PLN possa utilizá-los.

Para desenvolver essa biblioteca, o código fonte do Unitex foi estudado, uma vez que a ferramenta Unitex é distribuída sob a licença GPL e todos podem ver e modificar seu código fonte dentro das condições da licença.

A partir desse estudo foi criada uma biblioteca de programação independente do Unitex, com simples funções de acesso e manipulação a dicionários compactados. Ela possui três funções: carregar o dicionário na memória, realizar a busca por uma palavra e remover o dicionário da memória.

Foram desenvolvidas 3 versões desta biblioteca: uma em ANSI C/C++; uma DLL dessa biblioteca que pode também ser acessada por programas em Java via JNI (Java Native Interface); e uma outra versão dessa biblioteca totalmente em Java.

- Download versão C++
- Download versão C++ & JNI
- Download versão Java

 

 Sobre | Mapa do Site | Licença | Contato | © 2004 Núcleo Interinstitucional de Lingüística Computacional