Sala de Imprensa ICMC-USP: processamento computacional da língua portuguesa

sexta-feira, 17 de outubro de 2014

PROPOR contribui para expansão da área de processamento computacional da língua portuguesa

Principal evento brasileiro da área de processamento computacional da língua portuguesa, PROPOR reuniu na USP, em São Carlos, pesquisadores brasileiros e estrangeiros dedicados a estudar o processamento da língua portuguesa

Riley, do Google, falou sobre os mecanismos de reconhecimento de voz

Quem já utilizou um smartphone para realizar uma busca na internet, empregando um mecanismo de reconhecimento de voz, e conseguiu alcançar um bom resultado, costuma pensar que os desafios científicos relacionados a esse campo do conhecimento foram resolvidos. Mas durante a Conferência Internacional de Processamento Computacional da Língua Portuguesa, PROPOR 2014, o pesquisador sênior do Google, Michael Riley, explicou que ainda há muitas questões a serem respondidas nessa área, uma das frentes de estudo em processamento computacional da língua.

“Vou dar três exemplos de situações em que esses mecanismos de reconhecimento de voz não funcionam muito bem: quando você está em seu carro e há muito barulho; quando você fala naturalmente, usando a linguagem que emprega no dia a dia; e quando você tem sotaque estrangeiro”, afirmou. Com o objetivo de discutir como resolver esses e outros desafios, pesquisadores do Brasil e do exterior se reuniram em São Carlos durante a segunda semana de outubro. Reconhecido como o principal evento brasileiro da área de processamento computacional da língua portuguesa, o PROPOR também contou com a presença do pesquisador Andreas Stolcke, da Microsoft Research.

“Esse é um assunto internacional, pois é necessário realizar esse processamento em todas as línguas. Muitos problemas interessantes de pesquisa só vêm à superfcie quando consideramos as estruturas de diferentes línguas”, revelou Stolcke. Na opinião dele, o maior desafio nesse campo do conhecimento é lidar com a variedade linguística. “As pessoas têm níveis de educação diferentes e isso influencia na sua maneira de falar. Então, os modelos computacionais que criamos precisam ser capazes de abarcar toda essa variedade”, completou.

Segundo um dos coordenadores do PROPOR, Thiago Pardo, professor do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos, a área está em expansão no Brasil e, com o crescimento da tecnologia da informação e a evolução da computação, tem aumentado a demanda por produtos dessa linha de pesquisa, como tradutores automáticos, sumarizadores de texto, sistemas de processamento de fala e ferramentas computacionais de auxílio à escrita e à leitura, como o revisor gramatical do Word, que surgiu a partir de pesquisas desenvolvidas no ICMC.

“Os pesquisadores dessa área lidam tanto com o texto escrito quanto com o texto falado e, por isso, esse evento reuniu pessoas formadas em computação, em linguística, em engenharia elétrica e em muitas outras esferas do saber. Foi um fórum multidisciplinar rico, com muito assunto para discutir”, contou Pardo.

Os coordenadores do evento: Thiago Pardo e Maria das Graças Nunes, do ICMC

Já a professora Sara Candeias, do Centro de Desenvolvimento da Linguagem da Microsoft de Lisboa, Portugal, explicou que o evento é também uma oportunidade de aproximar o ambiente acadêmico das empresas. Ela ressaltou a importância da parceria que existe com o ICMC, em especial com a professora Sandra Aluísio, a qual possibilita realizar um trabalho de co-orientação junto a alunos de doutorado.

“Queremos formar um grupo de linguistas, engenheiros e pessoas com conhecimento em processamento da língua para trazer ao Brasil os estudos que temos desenvolvido em Portugal”, disse Candeias. Ela convidou os profissionais interessados em fazer parte desse grupo a entrarem em contato pelo e-mail t-sacand@candeias.com

Premiação – Durante o PROPOR, foi entregue o prêmio de melhor trabalho de mestrado a Fernando Nóbrega, atualmente aluno de doutorado do ICMC. Em sua dissertação Desambiguação lexical de sentidos para o português por meio de uma abordagem multilíngue mono e multidocumento, Nóbrega foi orientado por Thiago Pardo. O trabalho está disponível na biblioteca digital de teses e dissertação da USP: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-28082013-145948

Texto e fotos: Denise Casatti - Assessoria de Comunicação do ICMC

Mais informações

Site do evento: http://nilc.icmc.usp.br/propor2014/

Assessoria de Comunicação do ICMC: comunica@icmc.usp.br

Telefone: (16) 3373.9666

terça-feira, 23 de setembro de 2014

USP em São Carlos sedia principal evento da área de processamento computacional da língua portuguesa

Pela primeira vez, PROPOR 2014 acontecerá no ICMC de 6 a 9 de outubro

Você sabia que o revisor gramatical do português brasileiro, distribuído no pacote Office, da Microsoft, foi desenvolvido no Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos? Para criar uma ferramenta como essa, é preciso pesquisar a área de processamento computacional da língua portuguesa. Este ano, São Carlos sediará o principal evento científico desse campo do conhecimento: a Conferência Internacional de Processamento Computacional da Língua Portuguesa, PROPOR 2014.

Com o objetivo de se tornar um fórum para a troca de ideias e a realização de parceiras entre pesquisadores dedicados a estudar o processamento automático da língua portuguesa, o evento deverá reunir cerca de 100 participantes de 6 a 9 de outubro no auditório Fernão Stella de Rodrigues Germano, no ICMC. “Ao reunir especialistas em um fórum como esse, promovemos a divulgação do que há de ponta na área, o contato entre pesquisadores e o estabelecimento de trabalhos colaborativos”, ressalta o coordenador da Conferência, Thiago Pardo, professor do ICMC.

Entre os principais convidados internacionais que participarão do PROPOR 2014 estão: Michael Riley, pesquisador sênior do Google e doutor pelo Massachusetts Institute of Technology (MIT); Andreas Stolcke, pesquisador do Microsoft Research e doutor pela Universidade da Califórnia; e Advaith Siddharthan, da Universidade de Aberdeen (Reino Unido).

As inscrições para a Conferência podem ser realizadas pelo site https://centraldesistemas.sbc.org.br/ecos/propor2014 ou no local do evento. As taxas de inscrição variam de R$ 290,00 (estudantes membros da Sociedade Brasileira de Computação - SBC) a R$ 600,00 (pesquisadores não associados à SBC).

De volta ao revisor gramatical – A história da criação do revisor gramatical do português brasileiro, que hoje é distribuído no pacote Office, da Microsoft, começa em 1993, juntamente com a criação do Núcleo Interinstitucional de Linguística Computacional (NILC), sediado no ICMC. Foi quando a empresa Itautec procurou o ICMC para resolver um desafio: desenvolver um sistema de revisão gramatical do português para ser executado com o editor de textos Word da Microsoft.

A primeira versão do revisor gramatical, anterior à licença cedida pela Itautec à Microsoft, foi lançada no mercado em 1994. Várias outras a sucederam, sempre sofisticando e aperfeiçoando o produto. Até 2008, o NILC forneceu assistência à Microsoft por meio de um convênio entre a USP e a Itautec que vigorou por 15 anos.

Hoje, uma grande equipe multidisciplinar, formada por linguistas e cientistas da computação, atua no NILC, um dos principais polos de pesquisa voltados ao processamento computacional da língua portuguesa, que agrega pesquisadores de diversas unidades da USP, da Universidade Federal de São Carlos (UFSCar), da Universidade Estadual Paulista (Unesp), da Universidade Estadual de Maringá, do Instituto Federal de São Paulo, da Empresa Brasileira de Pesquisa Agropecuária e da Universidade de Sheffield, na Inglaterra.