|
|
Text Aligners
Related Projects
Potuguese-English Sentence Alignment (PESA)
Potuguese-English Word Alignment (PEWA)
The Visual Sentence Aligner (VisualTCA)
The Visual Word Aligner (VisualLIHLA)
Goals
To build tools to align parallel texts at
sentence and word (or multiword units) level aiming at producing
linguistic resources for severel Natural Language Processing
applications.
Team
Helena de Medeiros Caseli (MSc/PhD Student 2001-2005 and post-PhD 2008)
Maria das Graças Volpe Nunes (supervisor 2001-2005)
Mikel L. Forcada (foreign supervisor 2004-2005)
Aline Maria da Paz Silva (MSc Student 2002-2003)
Thiago Alexandre Salgueiro Pardo (supervisor 2007)
Felipe Gomes (Graduate Student 2007)
Finantial Support
CAPES: 2001-2005
FAPESP: 2004-2007
PIBIC/CNPq: 2007
Contact
Helena de Medeiros Caseli
Thiago Alexandre Salgueiro Pardo
Selected Publications (by topics)
Caseli, H.M.; Silva, A.M.P.; Nunes, M.G.V. Evaluation of Methods for Sentence and Lexical Alignment of Brazilian Portuguese and English Parallel Texts. In A.L.C. Bazzan and S. Labidi (eds.) Proceedings of the Seventeenth Brazilian Symposium on Artificial Intelligence (SBIA 2004), LNAI 3171, p.184-193. São Luis, Maranhão, Brazil, September 2004. PDF
Caseli, H. M.; Nunes, M. G. V. Alinhamento Sentencial e Lexical de Córpus Paralelos: Recursos para a Tradução Automática. Estudos Lingüísticos, v. 34, São Paulo, p.356-361, 2005. ISSN 1413-0939. PDF
Gomes, F.T; Pardo, T.A.S.; Caseli, H.M. VisualTCA: Uma Ferramenta Visual On-line para Alinhamento Sentencial de Textos Paralelos. In Anais do XXVII Congresso da Sociedade Brasileira de Computação - V Workshop em Tecnologia da Informação e da Linguagem Humana (TIL). p.1729-1732. Rio de Janeiro - RJ, Brazil, 2007. PDF
Caseli, H.M.; Nunes, M.G.V. Evaluation of Sentence Alignment Methods on Portuguese-English Parallel Texts. Scientia, Unisinos, v. 14, n. 2, p.223-238, 2003. PDF
Caseli, H.M. Alinhamento sentencial de textos paralelos português-inglês. Dissertação de Mestrado. ICMC-USP, Abril, 2003. PDF
Caseli, H.M.; Nunes, M.G.V. Evaluation of Sentence Alignment Methods for Brazilian Portuguese and English Parallel Texts. In IV Encontro Nacional de Inteligência Artificial (ENIA). Campinas, São Paulo, August 2003. ZIP
Caseli, H.M.; Nunes, M.G.V. Sentence Alignment of Brazilian Portuguese and English Parallel Texts. In Argentine Symposium on Artificial Intelligence (ASAI 2003). Buenos Aires, Argentine, September 2003. ZIP
Caseli, H.M.; Nunes, M.G.V. Alinhamento sentencial de textos paralelos: implementação e avaliação de métodos empíricos para o português do Brasil. Série de Relatórios do NILC. NILC-TR-02-19, Outubro 2002. ZIP
Caseli, H.M.; Nunes, M.G.V.; Forcada, M.L. Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts. Procesamiento del Lenguaje Natural, v. 35, Granada, Spain, p.237-244, 2005. ISSN 1135-5948 (and in Proceedings of the XXI Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN). Granada, Spain, September 2005). Also in Cadernos de Computação, v. 6, n. 2, ICMC-USP, p.149-163, October 2005. PDF
Caseli, H.M.; Nunes, M.G.V.; Forcada, M.L. LIHLA: A lexical aligner based on language-independent heuristics. In Proceedings of the V Encontro Nacional de Inteligência Artificial (ENIA 2005), p. 641-650. São Leopoldo-RS, Brazil, July 2005. PDF
Caseli, H.M.; Nunes, M.G.V.; Forcada, M.L. LIHLA: Shared task system description. In Proceedings of the ACL Workshop on Building and Using Parallel Texts, p. 111-114. Ann Arbor, United States, Juny 2005. PDF
Caseli, H.M.; Scalco, M.A.G.; Nunes, M.G.V. Manual para marcação de alinhamentos lexicais. Série de Relatórios do ICMC, 256 (NILC-TR-05-09), Abril 2005. 21 p. ZIP ZIP English version
Caseli, H.M; Nunes, M.G.V. Corpus paralelo e corpus paralelo alinhado: propriedades e aplicações. Estudos Lingüísticos, v. 33, Taubaté, p.581-586, 2004. ISSN 1413-0939. PDF
Caseli, H.M.; Nunes, M.G.V. A construção dos recursos lingüísticos do projeto PESA. Série de Relatórios do NILC. NILC-TR-02-07, Junho 2002. ZIP
Martins, M.S; Caseli, H.M.; Nunes, M.G.V. A construção de um corpus de textos paralelos inglês-português. Série de Relatórios do NILC. NILC-TR-01-05, Setembro, 2001. ZIP
Caseli, H.M.; Feltrim, V.D.; Nunes, M.G.V. TagAlign: Uma ferramenta de pré-processamento de textos. Série de Relatórios do NILC. NILC-TR-02-09, Junho 2002. ZIP
Hofland, K. 1996. A program for aligning English and Norwegian sentences. In S. Hockey, N. Ide, and G. Perissinotto, editors, Research in Humanities Computing, pages 165 178, Oxford. Oxford University Press.
|