Agência FAPESP – Prever eventos climáticos com boa antecedência e precisão proporciona melhorias diretas na produção agrícola. Contudo, tal previsão depende da análise de enormes volumes de dados coletados por satélites, radares e sensores. A tecnologia avança, mas a quantidade e a complexidade das informações desafiam meteorologistas e agrometeorologistas.
Divulgação |
Para aperfeiçoar as ferramentas disponíveis, pesquisadores do Departamento de Ciências de Computação do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC/USP), em São Carlos (SP), deram início, em 2009, ao projeto AgroDataMine – Desenvolvimento de métodos e técnicas de mineração de dados para apoiar pesquisas em mudanças climáticas com ênfase em agrometeorologia, com apoio do Instituto Microsoft Research-FAPESP de Pesquisas em Tecnologia da Informação.
Desde então, a equipe vem integrando dados complexos e heterogêneos – como imagens de satélites, séries temporais de índices meteorológicos e modelos climáticos –, medidos em terabytes (trilhões de bytes).
“Utilizamos e desenvolvemos tecnologias inovadoras e algoritmos matemáticos para encontrar correlações entre os dados, apontando maneiras de identificar eventos extremos, como grandes volumes de chuvas”, explicou Agma Juci Machado Traina, professora do ICMC/USP e coordenadora da pesquisa, à Agência FAPESP.
Três novas ferramentas computacionais já estão em funcionamento. O software SatImagExplorer extrai séries temporais de índices meteorológicos a partir de imagens de satélites, faz análises de agrupamentos e classificações. Com isso, permite avaliar os dados de determinada região em certo período de tempo.
Outro programa, o ClimFractal Analyzer, identifica correlações a partir de modelos climáticos ou de dados reais. E o TerrainViewer é uma ferramenta que permite a visualização de imagens de satélites em três dimensões.
Os programas estão à disposição dos pesquisadores do ICMC/USP e dos parceiros envolvidos no AgroDataMine: a Embrapa Informática Agropecuária (unidade da Empresa Brasileira de Pesquisa Agropecuária), o Centro de Pesquisas Meteorológicas e Climáticas Aplicadas à Agricultura da Universidade Estadual de Campinas (Cepagri/Unicamp), o Departamento de Computação da Universidade Federal de São Carlos (UFSCar), a Universidade Federal do ABC (UFABC), a Carnegie Mellon University (CMU, nos Estados Unidos) e o Grupo de Bases de Dados e Imagens (GBdI), do próprio ICMC/USP.
“Os parceiros contribuíram com o desenvolvimento de técnicas, a orientação de alunos, a validação dos resultados e o fornecimento de dados coletados por satélites, radares e sensores de superfície”, disse Traina.
Mineração de dados
O principal desafio do projeto foi selecionar informações relevantes em meio a dados tão heterogêneos e volumosos. “Focamos no Estado de São Paulo, trabalhando com regiões que são pequenas ou grandes produtoras de cana-de-açúcar e buscando correlações entre as taxas de produção e índices climáticos reais ou simulados”, disse Traina.
O primeiro passo, realizado na Embrapa, foi o georreferenciamento de imagens obtidas por satélites – organizadas e sobrepostas de modo a apresentarem a mesma posição geográfica. Com isso, a equipe começou a formar bases de imagens e de dados.
A segunda etapa envolveu a contraposição entre as informações do sensoriamento remoto (por satélites) e do sensoriamento de superfície (por sensores de medidas como precipitação e temperatura, do Cepagri/Unicamp).
A partir de tal contraposição tomaram forma as chamadas séries temporais, organizadas na terceira e última etapa do trabalho. “Fizemos as separações entre as séries trabalhando com algoritimos de correlação, busca de padrões e regras de associação”, disse Traina.
Para tanto, os pesquisadores recorreram à mineração de dados (conjunto de métodos e técnicas cujo objetivo é explorar as informações em busca de regularidades que não podem ser diretamente extraídas).
“Conforme mineramos, corroboramos uma série de suspeitas que os especialistas ainda não tinham conseguido provar. Uma delas é a tendência de determinado ano ser atípico, com fenômenos La Niña ou El Niño – até então identificados somente a posteriori”, disse Traina.
Outra abordagem importante foi a da teoria dos fractais, consagrada pelo matemático francês Benoît Mandelbrot, nos anos 1970. Trata-se de uma área da Matemática que mede e classifica situações complexas não baseadas na geometria tradicional, estudando as propriedades e o comportamento dos fractais (objetos auto-similares e independentes de escala).
Nos trabalhos do AgroDataMine, a teoria apoiou o mapeamento da distribuição dos dados, a identificação de padrões e de exceções temporais e o acompanhamento de séries múltiplas, como as que envolvem simultaneamente medidas de chuva e de temperaturas mínimas e máximas.
“Dessa forma, identificamos, por exemplo, como os eventos La Niña e El Niño influenciam os extremos de chuva, o que pode contribuir com o monitoramento agrícola das principais culturas de São Paulo – cana-de-açúcar e café”, explicou Traina.
Visualização da informação
Ramo da Ciência da Computação também envolvido no projeto, a visualização da informação tem por objetivo o desenvolvimento de técnicas que auxiliem na análise e na compreensão de dados valendo-se, para tanto, de recursos de apresentação visual.
Nesse sentido, uma das apostas do AgroDataMine foi o uso da plataforma Kinect, da Microsoft. “Buscávamos uma interação simples e natural dos usuários – que não são especialistas em computação – com os sistemas desenvolvidos. Sem a necessidade de utilizar dispositivos como mouses, o Kinect permite navegar por imagens de alta resolução, projetadas em grandes telas, usando apenas o movimento das mãos”, contou Traina.
Além de 19 cientistas da computação, participaram diretamente do projeto profissionais das áreas de Meteorologia, Engenharia Agrícola, Engenharia Agronômica e Cartografia.
A origem desses esforços remete à tese de doutorado “Integrating time series mining and fractals to discover patterns and extreme events in climate and remote sensing databases”, apresentada em 2010 por Luciana Alvim Santos Romani, pesquisadora da Embrapa Informática Agropecuária, então sob orientação da professora Agma Traina no ICMC/USP.
Até o momento, o AgroDataMine já rendeu 18 publicações e participações em conferências nacionais e internacionais. Também houve formação de novos recursos humanos para a área, com dois projetos de iniciação científica, três de mestrado e três de doutorado, todos com Bolsas da FAPESP.
“O mesmo time pretende dar continuidade a estudos e pesquisas no tema”, afirmou Traina. Por enquanto, as ferramentas computacionais seguem como produtos acadêmicos. No futuro, se integrados a sistemas mais robustos, com a parceria de empresas, a comercialização dos programas tem o potencial de resultar em previsões mais rápidas e certeiras, melhor preparo para enfrentar extremos climáticos e maiores chances de minimizar impactos nas produções agrícolas.
Por: Por Noêmia Lopes - Agência FAPESP
(Publicado em 29/julho - disponível em http://agencia.fapesp.br/17620)