Núcleo Interinstitucional de Lingüística Computacional
Interinstitutional Center for Research and Development in Computational Linguistics


The Core Thesaurus of Brazilian Portuguese


Project Timeline: 1998-2001

Current Status: Being updated and extended to the Wordnet.Br.



It is a well known fact that users of thesauruses are not searching for exact matches. They already have a perfectly usuable word, but for a number of reasons, they choose not to use that particular one. They are searching for suggested ways in which to express their thoughts. The Core Thesaurus of Brazilian Portuguese (TeP for short) is being crafted and updated to help the users in this particular language-use task by giving them instant access to thousands of synonyms and antonyms for thousands of entries.



Designed to work as an add-in to Windows® word processors, spreadsheets, e-mail programs, internet browsers and most other applications, its outstanding feature is to allow the users to find the right word fast, while they´re working. A specially designed and user-friendly graphic computer interface was implemented so as to allow the linguist and the lexicographer to enter, browse, and check the entries for their accuracy and consistency during the thesaurus compilation and update processes.



An Electronic Thesaurus and its unique source database: the TeP Source Database with thousands of sets of synonyms and antonyms which are shared by the general purpose lexical database Diadorim.


Team (2001)

Bento Carlos Dias da Silva - UNESP (coordinator)

Mirna Fernanda de Oliveira -UNESP

Helio Roberto de Moraes - UNESP

Ricardo Hasegawa - USP

Daniela A. de Amorim - UNESP

Christie Gibertoni Paschoalino - UNESP

Maria das Graças Volpe Nunes - USP


Finantial Support

PADCT/Finep - Itautec-Philco (1998-2001)



Bento Carlos Dias da Silva: bento@fclar.unesp.br 


Related Publications

DIAS-DA-SILVA, B. C.; MORAES, H. R.; OLIVEIRA, M. F. Groundwork for the Development of the Brazilian Portuguese Wordnet. In: RANCHHOD, E.; MAMEDE, N. J. (org.) Lecture Notes in Artificial Intelligence Vol. 2389: Advances in Natural Language Processing. Berlin: Springer-Verlag , 2002. p.189-196.

DIAS-DA-SILVA, B. C.; OLIVEIRA, M.F. Inclusão de informação pragmático-discursiva na base lexical de um thesaurus eletrônico. Estudos Lingüísticos, 31, 2002. Cd-rom 6p.

DIAS-DA-SILVA, B. C.; FELIPPO, A. Di Concepções de léxico e o processamento automático das línguas naturais. In: Resumos do 50º Seminário do GEL, São Paulo, 2002. 1p. Cd-rom.

DIAS-DA-SILVA, B. C.; OLIVEIRA, M. F.; HASEGAWA, R.; NUNES, M. G. V.; PACHOALINO, C.; AMORIM, D. A. Base do Thesaurus Eletrônico do Português do Brasil. Relatório Técnico, CPRT-UNESP, 2001. 10p.

MORAES, H.R.; DIAS-DA-SILVA, B.C. A questão da representação lingüístico-computacional da sinonímia e antonímia na compilação de um thesaurus eletrônico. Revista de Iniciação Científica da Unesp, v.2, São José do Rio Preto, 2001. 10p.

DIAS-DA-SILVA, B. C. et al. O TeP: construção de um thesaurus eletrônico para o português do Brasil. In: Progrma e Resumos do II Congresso Internacional da ABRALIN, Fortaleza, 2001, p.337.

MORAES, H.R.; DIAS-DA-SILVA, B.C. Filtragem da informação léxico-semântica na compilação de um thesaurus eletrônico. In: Resumos de Ciências Humanas do XIII Congresso de Iniciação Científica da UNESP, Bauru, 2001, p.290.

DIAS-DA-SILVA, B. C.; OLIVEIRA, M.F. Estrutura do léxico: modelo lingüístico-computacional de representação das relações de semânticas. Estudos Lingüísticos, v. 30, 2001. Cd-rom 6p.

DIAS-DA-SILVA, B.C.; OLIVEIRA, M.F.; MORAES, H.R.; HASEGAWA, R.; AMORIM, D.; PASCHOALINO, C.; NASCIMENTO, A.C. A construção de um thesaurus eletrônico para o português do Brasil. In: International Joint Conference 7th Iberoamerican Conference on Artificial Intelligence, 15th Brazilian Conference on Artificial Intelligence and V PROPOR, 2000, Atibaia. Anais…, Atibaia: IBERAMIA-SBIA-PROPOR, 2000, p. 1-11.

DIAS-DA-SILVA, B.C. Bridging the gap between linguistic theory and natural language processing. In: Bernard Caron (ed.) Proceedings of the 16th International Congress of Linguists,  16, 1997, Paris/Oxford: ELSEVIER SCIENCE-PERGAMON, 1998. Paper 0425; 10p.; ISBN 0 08 043 438X.


