sexta-feira, 17 de outubro de 2014

PROPOR contribui para expansão da área de processamento computacional da língua portuguesa

Principal evento brasileiro da área de processamento computacional da língua portuguesa, PROPOR reuniu na USP, em São Carlos, pesquisadores brasileiros e estrangeiros dedicados a estudar o processamento da língua portuguesa

Riley, do Google, falou sobre os mecanismos de reconhecimento de voz

Quem já utilizou um smartphone para realizar uma busca na internet, empregando um mecanismo de reconhecimento de voz, e conseguiu alcançar um bom resultado, costuma pensar que os desafios científicos relacionados a esse campo do conhecimento foram resolvidos. Mas durante a Conferência Internacional de Processamento Computacional da Língua Portuguesa, PROPOR 2014, o pesquisador sênior do Google, Michael Riley, explicou que ainda há muitas questões a serem respondidas nessa área, uma das frentes de estudo em processamento computacional da língua.

“Vou dar três exemplos de situações em que esses mecanismos de reconhecimento de voz não funcionam muito bem: quando você está em seu carro e há muito barulho; quando você fala naturalmente, usando a linguagem que emprega no dia a dia; e quando você tem sotaque estrangeiro”, afirmou. Com o objetivo de discutir como resolver esses e outros desafios, pesquisadores do Brasil e do exterior se reuniram em São Carlos durante a segunda semana de outubro. Reconhecido como o principal evento brasileiro da área de processamento computacional da língua portuguesa, o PROPOR também contou com a presença do pesquisador Andreas Stolcke, da Microsoft Research.

“Esse é um assunto internacional, pois é necessário realizar esse processamento em todas as línguas. Muitos problemas interessantes de pesquisa só vêm à superfcie quando consideramos as estruturas de diferentes línguas”, revelou Stolcke. Na opinião dele, o maior desafio nesse campo do conhecimento é lidar com a variedade linguística. “As pessoas têm níveis de educação diferentes e isso influencia na sua maneira de falar. Então, os modelos computacionais que criamos precisam ser capazes de abarcar toda essa variedade”, completou. 

Segundo um dos coordenadores do PROPOR, Thiago Pardo, professor do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos, a área está em expansão no Brasil e, com o crescimento da tecnologia da informação e a evolução da computação, tem aumentado a demanda por produtos dessa linha de pesquisa, como tradutores automáticos, sumarizadores de texto, sistemas de processamento de fala e ferramentas computacionais de auxílio à escrita e à leitura, como o revisor gramatical do Word, que surgiu a partir de pesquisas desenvolvidas no ICMC.

“Os pesquisadores dessa área lidam tanto com o texto escrito quanto com o texto falado e, por isso, esse evento reuniu pessoas formadas em computação, em linguística, em engenharia elétrica e em muitas outras esferas do saber. Foi um fórum multidisciplinar rico, com muito assunto para discutir”, contou Pardo.

Os coordenadores do evento: Thiago Pardo e Maria das Graças Nunes, do ICMC
Já a professora Sara Candeias, do Centro de Desenvolvimento da Linguagem da Microsoft de Lisboa, Portugal, explicou que o evento é também uma oportunidade de aproximar o ambiente acadêmico das empresas. Ela ressaltou a importância da parceria que existe com o ICMC, em especial com a professora Sandra Aluísio, a qual possibilita realizar um trabalho de co-orientação junto a alunos de doutorado. 

“Queremos formar um grupo de linguistas, engenheiros e pessoas com conhecimento em processamento da língua para trazer ao Brasil os estudos que temos desenvolvido em Portugal”, disse Candeias. Ela convidou os profissionais interessados em fazer parte desse grupo a entrarem em contato pelo e-mail t-sacand@candeias.com

Premiação – Durante o PROPOR, foi entregue o prêmio de melhor trabalho de mestrado a Fernando Nóbrega, atualmente aluno de doutorado do ICMC. Em sua dissertação Desambiguação lexical de sentidos para o português por meio de uma abordagem multilíngue mono e multidocumento, Nóbrega foi orientado por Thiago Pardo. O trabalho está disponível na biblioteca digital de teses e dissertação da USP: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-28082013-145948

Texto e fotos: Denise Casatti - Assessoria de Comunicação do ICMC

Mais informações
Assessoria de Comunicação do ICMC: comunica@icmc.usp.br
Telefone: (16) 3373.9666