5º Workshop em Tecnologia da Informação e da Linguagem Humana

TIL'2007


 

Programação

Instruções gerais aos autores
Todas as apresentações orais serão realizadas na sala 4014 do IME (no Grande Campus da Praia Vermelha). A sala contará com computador e projetor multimídia. Cada apresentação deverá ter no máximo 20min, sendo os 10min seguintes reservados para perguntas.
Serão disponibilizados painéis para fixação dos pôsteres. Cada pôster deve ter aproximadamente 70cm de largura e 100cm de altura.

 

Quinta-feira (5/julho)

 

8:30 - 9:00h

Abertura do TIL 2007

 

9:00 - 10:00h

Sessão Técnica 1 - “Tradução Automática”

Chair: Thiago A. S. Pardo

9:00h

Automatic induction of translation lexicons from aligned parallel corpus

Helena de M. Caseli, Maria das Graças V. Nunes

9:30h

A Language Modelling Tool for Statistical NLP

Daniel Bastos Pereira, Ivandré Paraboni

 

10:00 - 10:15h

Intervalo para café

 

10:15 - 12:15h

Palestra convidada - Os desafios na construção do dicionário histórico do português do Brasil

Maria T. C. Biderman

Coordenadora: Violeta Quental

 

Resumo da palestra: O Dicionário Histórico do Português do Brasil é uma obra pioneira que deve preencher uma lacuna na cultura brasileira, visto como não existe nenhum dicionário que se ocupe da formação do vocabulário do Português Brasileiro. Nossa meta é a produção de um dicionário com cerca de 10 mil verbetes que analise e descreva o vocabulário do Português Brasileiro nos séculos XVI, XVII e XVIII. Na palestra, serão apresentados os desafios para a construção deste dicionário, mais especificamente, a construção de um corpus informatizado de referência sobre o Brasil colonial a partir de documentos da época, a seleção das unidades léxicas desse corpus que integrarão o dicionário e o manejo de informações heterogêneas, de diversas épocas, critérios filológicos não uniformes, distintas tradições e regiões e muitas variações gráficas.

 

Sobre a palestrante: Professora Titular da Faculdade de Ciências e Letras, UNESP, Campus de Araraquara - Pós-Graduação em Lingüística e Língua Portuguesa. Doutora e Livre-docente em Lingüística e Filologia Românica, Universidade de São Paulo. Pesquisadora do Conselho Nacional de Pesquisas (CNPq) (desde 1990 até hoje). Assessora científica de: Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), CNPq, CAPES. Orientação de mestrados concluídos (6) e doutorados concluídos (12) nas áreas de Lexicologia, Lexicografia e Terminologia. Autora dos dicionários: Dicionário Contemporâneo de Português, Editora Vozes, 1982; Dicionário Didático de Português, Editora Ática, 1998; Dicionário Ilustrado de Português, Editora Ática, 2005; Dicionário do Estudante, Editora Globo, 2005. Docente da disciplina Lexicologia e Lexicografia no programa de Pós-Graduação em Lingüística e Língua Portuguesa, FCL, UNESP, Campus de Araraquara. Vários pós-doutorados em grandes universidades e instituições de pesquisa nos Estados Unidos (Stanford University, University of California at Berkeley, New York University, Princeton University, University of Texas), Inglaterra (Birmingham University, Oxford University), França (Université de Namcy- Institut de la Langue Française, 2 vezes), Italia (Università di Pisa – Istituto di Linguistica Computazionale), Espanha (Universitat Pompeu Fabra – Istituto di Linguistica Aplicada, Universidad Complutense), Portugal (Universidade de Lisboa – Centro de Linguistica da Universidade de Lisboa, 5 vezes), com bolsas de instituições nacionais, estrangeiras e internacionais [National Academy of Sciences, Organisation of American States, Fullbright Commission, 2 vezes; British Council, Generalitat (Governo da Catalunha); Fundação Calouste Gulbenkian, 4 vezes]. As bolsas nacionais foram concedidas por: CNPq, FAPESP e CAPES.

 

12:15 - 13:30h

Intervalo para almoço

 

13:30 - 15:30h

Sessão Técnica 2 - “Léxico, Ontologia e Taxonomia”

Chair: Renata Vieira

13:30h

Subsídios para a Elaboração Automática de Taxonomias

Maria Cláudia de Freitas, Violeta Quental

14:00h

Uma análise da avaliação dos resultados da medida de Similaridade Semântica (SiSe) entre ontologias em português

Juliano Baldez de Freitas, Vera Lúcia Strube de Lima

14:30h

Estrutura Ontológica e Unidades Lexicais: uma aplicação computacional no domínio da Ecologia

Claudia Zavaglia, Leandro Henrique Mendonça de Oliveira, Maria das Graças V. Nunes, Sandra M. Aluísio

15:00h

A representação da semântica dos adjetivos em ontologias jurídicas: informação importante ou secundária?

Anderson Bertoldi, Rove Chishman, Paulo Quaresma

 

15:30 - 15:45h

Intervalo para café

 

15:45 - 16:45h

Sessão Técnica 3 – "Recuperação de Informação”

Chair: Vera Strube de Lima

15:45h

A methodology for automatic indexing using noun phrases

Renato Rocha Souza, Koti S. Raghavan

16:15h

Extracting Visions from Textual Requirements Documents

Miriam Sayão, Carlos A. Prolo

 

 

Sexta-feira (6/julho)

 

8:00 - 10:00h

Sessão Técnica 4 - “Classificação e Agrupamento de Textos”

Chair: Maria das Graças V. Nunes

8:00h

Intelligent Classification of Economic Activities from Free Text Descriptions

Elias Oliveira, Patrick Marques Ciarelli, Wallace F. Henrique, Lucas Veronese, Felipe Pedroni, Alberto F. De Souza

8:30h

Classificação de textos baseada em ontologias de domínio

Sandro J. Rigo, José Palazzo M. de Oliveira, Cristiano Barbieri

9:00h

Categorização de Textos da Língua Portuguesa com Árvores de Decisão, SVM e Informações Lingüísticas

Cassiana Fagundes da Silva, Renata Vieira

9:30h

Um Estudo sobre Categorização Hierárquica de uma Grande Coleção de Textos em Língua Portuguesa

Silvia Maria Wanderley Moraes, Vera Lúcia Strube de Lima

 

10:00 - 10:15h

Intervalo para café

 

10:15 - 11:15h

Sessão Técnica 5 - “Sintaxe, Semântica e Aplicações”

Chair: Lucia H. M. Rino

10:15h

Combining Rule-based and Statistical Methods for Named Entity Recognition in Portuguese

Eduardo Ferreira, João Balsa, Antônio Branco

10:45h

Evaluation of a grammar of French determiners

Éric Laporte

 

11:15 - 12:15h

Sessão de Pôsteres

SpeakerID – Toolkit para Processamento e Modelagem de Características de Alto Nível para Reconhecimento Automático de Locutor

Cristian Keil de Abreu, André Gustavo Adami

Automatic Semantic Role Annotation for Portuguese

Eckhard Bick

Towards an Automatic Strategy for Acquiring the WordNert.Br Hierarchical Relations

Ariani Di Felippo, Bento Carlos Dias da Silva

Etiquetagem de Palavras para o Português do Brasil

Miriam L. Domingues, Eloi L. Favero, Ivo P. Medeiros

Reconhecimento automático de expressões idiomáticas em corpus – algumas experiências

Graça Fernandes, Jorge Baptista

VisualTCA: Uma Ferramenta Visual On-line para Alinhamento Sentencial de Textos Paralelos

Felipe Tassario Gomes, Thiago Alexandre Salgueiro Pardo, Helena de Medeiros Caseli

Adaptação de um Sistema de Diálogo ao Domínio Bilhética

Porfírio P. Filipe, Nuno N. Mamede

CoGrOO – Um Corretor Gramatical acoplável ao OpenOffice

Jorge Kinoshita, Laís N. Salvador, Carlos E. D. Menezes

OntoEditor – Uma ferramenta Web para edição de ontologias

Leandro Henrique Mendonça de Oliveira, Sandra Maria Aluísio, Gladis Maria de Barcelos Almeida

An Ontology-Based Utterance Interpretation in the Context of Intelligent Assistance

Emerson Cabrera Paraiso, Jean-Paul A. Barthès

Matrizes fraseológicas em artigos de Medicina: um estudo com vistas ao desenvolvimento de ferramenta automática de apoio à tradução

Viviane Possamai, Maria José B. Finatto

Uso de Informações Semânticas na Identificação de Anáforas Indiretas e Associativas

Luiz Carlos Ribeiro Jr., Sandra Collovini, Patrícia N. Gonçalves, Vinicius Muller, Renata Vieira

 

12:15 - 13:30h

Intervalo para almoço

 

13:30 - 15:30h

Palestra convidada - Para além da tradução automática: convergências interdisciplinares

Mike Dillinger
Local: Auditório Principal

Coordenadora: Claudia Oliveira

 

Resumo da palestra: Há 50 anos, vê-se a tradução automática como “a tecnologia do futuro”: uma tecnologia extremamente útil com um potencial de muitíssimo sucesso financeiro. No entanto, nunca houve o “estouro” da TA no mercado global, nem de outras tecnologias de PLN. Nesta palestra analisam-se as razões da difusão limitada da TA como estudo de caso das dificuldades de adoção de qualquer tecnologia da linguagem. Do lado comercial, vê-se uma dificuldade nítida de encaixar as tecnologias existentes em problemas de tradução do dia a dia. Do lado técnico, vê-se um grande isolamento de profissionais em tradução automática que limita o acesso a soluções existentes para vários de seus problemas. Um panorama de várias abordagens à tradução automática e problemas conexos embasa a conclusão de que todas as tecnologias necessárias para sistemas eficazes de TA já existem, embora espalhadas por distintas áreas de investigação. Para demonstrar a real importância da TA, então, torna-se necessário efetuar uma convergência interdisciplinar enfocada em otimizar situações práticas do dia a dia. Sabemos quais são os problemas das tecnologias atuais, sabemos quais são as melhores soluções. O desafio do momento é colaborar.

 

Sobre o palestrante: Atualmente Presidente da Association for Machine Translation in the Americas (AMTA), Diretor de Lingüística da Spoken Translation, Inc. em Berkeley, California e Consultor independente em Tecnologias de Tradução para clientes da Forbes 1000. Autor de Impementing Machine Translation: a Best Practice Guide publicada pela Localization Industry Standards Association e de muitos outros trabalhos. Desenvolveu sistemas de tradução automática com Logos Corporation, GlobalWords Technologies, Spoken Translation, e o Projeto UNL. Foi Professor Titular de Lingüística na UFMG e lecionou na Europa, Asia, e nas Américas, em quatro línguas.

 

15:30 - 15:45h

Intervalo para café

 

15:45 - 16:45h

Sessão Técnica 6 - “Discurso e Aplicações”

Chair: Sandra M. Aluísio

15:45h

Summ-it: Um corpus anotado com informações discursivas visando à sumarização automática

Sandra Collovini, Thiago I. Carbonel, Juliana Thiesen Fuchs, Jorge César Coelho, Lucia Helena Machado Rino, Renata Vieira

16:15h

Validação Preliminar da Teoria das Veias para o Português e Lições Aprendidas

Thiago I. Carbonel, Jorge M. Pelizzoni, Lucia Helena Machado Rino

 

16:45 - 18:15h

Encerramento do TIL 2007 e Reunião da Comunidade

 

 

[Voltar]