Acesso aos Artigos


A princípio, o que motivou um pequeno grupo de pesquisadores a realizar o 1º. Workshop em Tecnologia da Informação e da Linguagem Humana foi a busca de aproximação das comunidades consideradas correlatas, para a troca de conhecimento, familiarização com as pesquisas e a busca de viabilização de soluções comuns, quando possível. Desse modo, procurávamos “encurtar” os caminhos de nossas pesquisas, identificando melhor a interface entre Informática e Lingüística. Ao mesmo tempo, buscávamos uma identidade própria dessa comunidade no Brasil, visando também maior interação com empresas, dada a possibilidade de atuação bastante variada que nos apresenta a Informática.

Assim surgiu o TIL, cuja sigla incorpora o nome “Tecnologia da Informação e da Linguagem Humana” em seu “T”, “I” e “L”, assim como na sugestão de um “homenzinho” em seu logo.

 

Particularmente relevante para nós, nesse contexto, está o processamento automático do português, em suas variações expressas pelos trabalhos apresentados. Este evento teve, assim, por principal objetivo, fomentar a interação entre os participantes, conjugando as propostas de manipulação computacional das línguas naturais, de modelagem da linguagem humana, quer lingüística, quer computacional e de busca de recursos para a comunicação eletrônica, de um modo geral.

 

Nossas expectativas em relação ao TIL incluíram os seguintes aspectos: motivar e ampliar o número de interessados na interface entre Lingüística e Tecnologia da Linguagem Humana; discutir em que medida a Lingüística contribui (ou pode contribuir) para o desenvolvimento de modelos híbridos (lingüísticos e computacionais) para o processamento automático da informação veiculada por línguas naturais; discutir em que medida a Computação pode ser incorporada às tarefas de comunicação, do ponto de vista de manipulação da linguagem humana. Desse modo, procuramos abranger várias comunidades de interesse, sobretudo aquelas ligadas às áreas cuja interface remete à Ciência da Computação, pensando em todos os aspectos da interação com o computador; à Lingüística e/ou Letras, que têm a língua natural como objeto de estudo e a informática, muitas vezes, como instrumento de validação de suas teorias; à Ciência da Informação, que busca recursos ou modelos de busca de informações; e outras áreas afins, como as que de um modo ou outro remetem às Ciências Humanas.

Foram submetidos 42 trabalhos, os quais foram julgados por 32 avaliadores no total, sendo que cada trabalho foi avaliado por 2 revisores. Os seguintes temas foram submetidos: realidade virtual, competências conversacionais, construção de dicionários, raciocínio não-monotônico, extração de informação na WEB, representação do conhecimento, ontologias, recuperação de informação, ensino mediado por computador, mineração de textos, inclusão digital e informática geral, processamento textual e processamento de línguas naturais. Particularmente, esta ultima área abrangeu trabalhos em parsing, recuperação de informação, geração de textos, sumarização automática, tradução automática, indexação e busca. Foram aceitos para apresentação 36 trabalhos considerados de bom nível, ou seja, 86% dos trabalhos submetidos, o que, sem dúvida, favoreceu a participação expressiva das comunidades que se pretendia atrair. Devido à impossibilidade de termos todos esses trabalhos como palestras, foram classificados para apresentação oral e publicação em 10 páginas 14 deles, ficando os restantes para apresentação na forma de pôsteres e publicação em 4 páginas. Também se deve notar a formação do Comitê de Programa e da escolha dos demais revisores: ela se baseou na interdisciplinaridade dos assuntos em foco. Fizeram-se representar, assim, as comunidades de Lingüística, Ciência da Informação, Banco de Dados, Inteligência Artificial, Lingüística Computacional, Terminologia, Letras e Informática, de um modo geral. A eles, nosso muito obrigada pela valiosa colaboração.

 

Os trabalhos selecionados para apresentação em forma oral ou em forma de pôsteres abrangeram as seguintes áreas, cuja representatividade e ilustrada na Figura 1:

 

Representação do Conhecimento & Ontologias (KR & Ont)

Processamento de Línguas Naturais (PLN)

Recuperação de Informação, Indexação e Busca (RI)

Processamento Textual (ProcText)

Ensino mediado por computador (EnsComp)

Mineração de textos (TM)

Inclusão Digital/Informática geral (Informat)

 

Figura 1: Número de apresentações/Tema

Interessante também é notar a grande variedade de instituições: 21 trabalhos de instituições distintas foram apresentados, correspondendo às 7 mais representativas ilustradas na Figura 2 (UNESP-A é UNESP-Araraquara). As demais instituições participantes foram as seguintes: UECE & UFBA, UNINOVE (Marilia), ESDC (Escola Superior de Direito Constitucional – Brasília), UnB, UCB & CTS (Centro Técnico Superior), UFPI, UNISINOS-RS, UFSCar, UNESP/IBILCE-Rio Preto, IME & PUC-RJ, IME-USP, USP-Ribeirão Preto, UNICAMP e UEM.

 

Figura 2: Número de apresentações/Instituição

 

A diversidade dos trabalhos apresentados, assim como das áreas de formação de seus participantes, comprova que o TIL atingiu seu objetivo: tivemos 110 inscrições, resultando em 80 participantes, efetivamente.

 

Também significativo foi o número de inscritos por instituição, como mostra a Figura 3. Outros inscritos (com uma inscrição cada) envolveram o IBICT, a UFGo, a PUC-RJ, a BIREME, a SOF (Sempre-Viva Organizacao Feminista), a UFPI, a UNIVEM, a Positivo Informatica, a UNICAMP, a UNIFESP, a UFMG e o ICMC-Biblioteca. Vale notar que as inscrições assim discriminadas correspondem a participantes sem apresentação de trabalhos, evidenciando o grande interesse pelo evento, num total de 28 instituições inscritas (não necessariamente participantes).

Figura 3: Número de inscritos por Instituição

Durante o evento, intersecções interessantes entre as diversas áreas, assim como possíveis vínculos de pesquisa e aspectos interdisciplinares tornaram-se evidentes. Foram também abordados dois temas de interesse da comunidade: a questão de padrões de qualidade QUALIS (CAPES) e a questão da ISO para padrões de referencia de anotação de anáforas, conforme palestra convidada ministrada por Renata Vieira (UNISINOS-RS).

 

Foi também discutida a continuidade do TIL, lembrando que há outros eventos correlatos, como o PROPOR – Processamento Automático do Português, cuja ocorrência se dá alternadamente em Portugal e no Brasil, devendo ser em 2006 a próxima edição, no Brasil. Visando manter o vínculo proporcionado pelo TIL’2003, será criada uma lista de discussão. Também em foco está a criação de uma revista científica eletrônica, para a divulgação de trabalhos na área interdisciplinar de Tecnologia da Informação e da Linguagem Humana.

Lucia H. M. Rino

Presidente do Comitê de Programa

 


Acesso aos Artigos