Núcleo Interinstitucional de Lingüística Computacional
An Interinstitutional Center for Research and Development in Computational Linguistics

ExPorTer

Evaluation of Terminology Authomatic Extraction Methods for Portuguese Texts

 

Starting Time: 2002

Current Status
Ongoing project which is part of a MSc program (2002-2004).

Goals
To investigate, implement and evaluate Statistical, Linguistical and Hybrid Terminology Extraction Methods for Portuguese Texts.

Project's Features
Use of a corpus of authentic texts of Brazilian Portuguese from Industrial Ceramic.

Expected Results
To construct tools for extracting terms from the choosen corpus using the Statistical, Linguistical and Hibrid approaches.


Team (2001/2002)
Maria Fernanda Teline (MSc Student)
Sandra Maria Aluísio (supervisor)

Finantial Support
CNPq: since 2003

Contact
Maria Fernanda Teline mteline@icmc.usp.br

Related Publications
Teline, M.F. Avaliação de Métodos de Extração Automática de Terminologia para textos em Português. São Carlos, SP, Fevereiro 2004. Dissertação de Mestrado.
download pdf

Teline, M.F.; Almeida, G.M.B.; Aluísio, S.M. Extração Manual e Automática de Terminologia: Comparando Abordagens e Critérios. Published in: I Workshop em Tecnologia da Informação e da Linguagem Humana (I TIL). São Carlos, SP, Outubro 2003.

Teline, M.F.; Manfrin, A.M.P.; Aluísio, S.M. Extração Automática de Termos de Textos em Português: Aplicação e Avaliação de Medidas Estatísticas de Associação de Palavras. Série de Relatórios do NILC. NILC-TR-03-10, Outubro, 2003. Também disponível como Relatório Técnico do ICMC Nº 261. Download File

Voltar
Voltar