Núcleo Interinstitucional de Lingüística Computacional
An Interinstitutional Center for Research and Development in Computational Linguistics


Portuguese - English Word Alignment


Starting Time: 2002

Status: Concluded in 2004

    To investigate, implement and evaluate some algorithms of word alignment of bilingual texts - Portuguese and English - including empirical and linguistic based methods.

Project's Features
    Use of a corpus of authentic abstracts of Brazilian Portuguese and English scientific texts in the computing domain, CorpusPE.


Team (2002-2004)
    Aline Maria da Paz Silva (MSc Student)
    Maria das Graças Volpe Nunes (supervisor)

Finantial Support
    CAPES: 2002-2004

    Maria das Graças Volpe Nunes: email gracan@icmc.usp.br

Related Project

    Potuguese-English Sentence Alignment (PESA)


    Sentence and Word Aligners

Related Publications


Caseli, H. M.; Nunes, M. G. V. Alinhamento Sentencial e Lexical de Córpus Paralelos: Recursos para a Tradução Automática. Estudos Lingüísticos, v. 34, São Paulo, p.356-361, 2005. ISSN 1413 0939. PDF


Caseli, H.M.; Silva, A.M.P.; Nunes, M.G.V. Evaluation of Methods for Sentence and Lexical Alignment of Brazilian Portuguese and English Parallel Texts. In A.L.C. Bazzan and S. Labidi (eds.) Proceedings of the Seventeenth Brazilian Symposium on Artificial Intelligence (SBIA 2004), LNAI 3171, p.184-193. São Luis, Maranhão, Brazil, September 2004. PDF

Silva, A.M.P.; Nunes, M.G.V. Using Multiword Lists for Lexically Aligning Brazilian Portuguese and English Texts.Série de Relatórios do NILC. NILC-TR-04-02, March 2004. 8 p. PDF

Caseli, H.M; Nunes, M.G.V. Corpus paralelo e corpus paralelo alinhado: propriedades e aplicações. Estudos Lingüísticos, v. 33, Taubaté, p.581-586, 2004. ISSN 1413 0939. PDF


Silva, A.M.P.; Nunes, M.G.V. Extração Automática de Multipalavras. Série de Relatórios do NILC. NILC-TR-03-11, Novembro 2003. 23 p. PDF


Caseli, H.M.; Feltrim, V.D.; Nunes, M.G.V. TagAlign: Uma ferramenta de pré-processamento de textos. Série de Relatórios do NILC. NILC-TR-02-09, Junho 2002. ZIP

Caseli, H.M.; Nunes, M.G.V. A construção dos recursos lingüísticos do projeto PESA. Série de Relatórios do NILC. NILC-TR-02-07, Junho 2002. ZIP


Martins, M.S; Caseli, H.M.; Nunes, M.G.V. A construção de um corpus de textos paralelos inglês-português. Série de Relatórios do NILC. NILC-TR-01-05, Setembro 2001. ZIP



Last updated: 20/07/2005