Um dos objetivos desse projeto foi desenvolver uma biblioteca de acesso e
manipulação a léxicos compactados no padrão DELA, independente do Unitex, para
que qualquer aplicação de PLN possa utilizá-los.
Para desenvolver essa biblioteca, o código fonte do Unitex foi estudado, uma
vez que a ferramenta Unitex é distribuída sob a licença GPL e todos podem ver
e modificar seu código fonte dentro das condições da licença.
A partir desse estudo foi criada uma biblioteca de programação independente
do Unitex, com simples funções de acesso e manipulação a dicionários
compactados. Ela possui três funções: carregar o dicionário na memória, realizar a busca por
uma palavra e remover o dicionário da memória.
Foram desenvolvidas 3 versões desta biblioteca: uma em ANSI C/C++; uma DLL dessa biblioteca que pode também ser acessada por
programas em Java via JNI (Java Native Interface); e uma outra versão dessa
biblioteca totalmente em Java.
- Download versão C++
- Download versão C++ & JNI
- Download versão Java