À medida que o novo coronavírus continua a se espalhar pelo mundo, vimos a proliferação de uma série de gráficos mostrando a evolução do covid-19 e curvas que ilustram o que poderia acontecer no futuro. Além de aterrorizante, o cenário apresenta uma série de desafios adicionais para os cientistas da computação: como extrair conhecimento útil dessa quantidade gigantesca de informações que circulam na Internet sobre a pandemia, aproveitando os recursos tecnológicos à nossa disposição?
Esse é um desafio que os pesquisadores do Instituto de Matemática e Informática (ICMC) da USP, em São Carlos, já enfrentam. Eles obtiveram bons resultados usando técnicas de inteligência artificial aplicadas à mineração de dados nas áreas de agronegócio e educação, por exemplo. Para isso, desde 2014, eles desenvolvem uma ferramenta chamada Websensors, que usa inteligência artificial para analisar eventos extraídos de textos de notícias, como informações sobre o que aconteceu, como, quando, onde e quem está envolvido.
Agora, eles estão comprometidos em coletar eventos que mencionem o novo coronavírus ou a doença da covid-19. O objetivo é usar essas informações como conhecimento complementar para incorporá-las aos modelos de previsão existentes. Um exemplo é a previsão da curva de contaminação pandêmica, que pode ser ajustada considerando os eventos desse tópico. Além disso, esse conhecimento adicional será importante para apoiar especialistas na identificação futura de iniciativas bem-sucedidas e mal sucedidas de combate ao vírus, que serão muito úteis nas próximas epidemias que enfrentaremos.
“Quando analisamos a evolução futura da curva de contaminação da doença e levamos em consideração apenas os dados sobre infecções que ocorreram no passado, temos uma visão limitada do problema. Se é possível enriquecer essa visão, adicionando informações extraídas da previsão de fontes confiáveis, acreditamos que poderemos aumentar nossa visão e, quem sabe, construir modelos preditivos mais próximos da realidade “, explica Solange Rezende, que coordena o projeto juntamente com o professor Ricardo Marcacini, ambos do Laboratório de Inteligência Computacional do ICMC. A iniciativa também inclui a participação de dois doutorandos, quatro de mestrado e três pesquisadores colaboradores, como Rafael Geraldeli Rossi, ex-aluno do ICMC e professor da Universidade Federal de Mato Grosso do Sul.
Web, um poderoso sensor
Vamos imaginar que hoje você conheceu um viajante no tempo que perguntou a ele: qual é a maneira mais rápida e confiável de entender o que está acontecendo no mundo em tempo real? É provável que sua resposta seja: fique on-line. Sim, de fato, é através da web que temos acesso a fontes de informações confiáveis e seguras de todo o mundo, em vários idiomas. É por isso que muitos pesquisadores começaram a usar informações da Web da mesma maneira que já usamos sensores para medir, por exemplo, temperatura, umidade, quantidade de chuva, velocidade e direção dos ventos em um só lugar. . São os dados capturados por esses sensores ao longo do tempo, a variação de temperatura, umidade, chuva e vento, que permitiram aos cientistas construir modelos para prever o tempo futuro.
Agora, pense que as informações que circulam na Web também podem funcionar como esses sensores e não apenas ajudar um viajante do tempo a entender nossa realidade, mas também permite que os pesquisadores desenvolvam novos modelos para prever o futuro. “Isso ocorre porque os computadores podem processar uma grande quantidade de informações e encontrar padrões no que aconteceu no passado e podem ser repetidos no futuro”, explica Marcacini.
No caso da covid-19, os links da Web são capturados através de uma plataforma internacional chamada GDELT. Os pesquisadores do ICMC coletam itens de notícias que tratam especificamente da doença ou do coronavírus, desde que sejam provenientes de fontes confiáveis e os pré-processem. Nesta fase, usando várias técnicas, como processamento de linguagem natural, os textos são transformados em um conjunto de sinais. É como se houvesse uma tradução da linguagem humana para uma linguagem que as máquinas possam entender.
Esses sinais são inseridos no circuito de uma rede neural. Como no cérebro humano, no qual são processados os sinais que captamos através de nossos sentidos, a rede neural analisa as características extraídas dos textos coletados e atribui a cada um um peso diferente, de acordo com a frequência mais alta ou menos do que o recurso aparece na coleção. É comparável ao trabalho que nossos neurônios realizam depois que os olhos capturam várias imagens diferentes e identificaremos o que eles têm em comum. Mas lembre-se de que, neste caso, estamos falando de encontrar padrões em um número gigantesco de textos, um trabalho impossível de ser feito manualmente e que pode resultar em conhecimento valioso, como já foi mostrado em vários estudos.
Em todo o mundo, de 19 a 24 de março, o plataforma criada pelo grupo de pesquisadores do ICMC capturou um total de 26.713 notícias georreferenciadas, citando covid-19 ou coronavírus. Esse processo de coleta é contínuo. Ao combinar essas informações com os dados oficiais de contaminação (coletados pelo Johns Hopkins CSSE Data Repository), os cientistas desenvolveram um modelo para prever a curva de contaminação para os próximos sete dias (veja abaixo, em amarelo). Observe que essa curva é mais pronunciada do que a observada em modelos epidemiológicos que consideram apenas dados de contaminação (em verde). “Somando os eventos, de fato, há um ajuste para cima, com a previsão de mais casos, embora seja necessário fazer a reserva de que ainda temos poucos dados no Brasil para validar estatisticamente essa análise preditiva”, reflete Marcacini.
Aplicação na agricultura e combate ao abandono escolar
Desde 2014, os pesquisadores do ICMC vêm trabalhando para desenvolver o conhecimento e a tecnologia chamados Websensors que estão sendo usados hoje no projeto covid-19. Ao longo dos anos, vários estudos foram realizados com o apoio das principais agências de fomento à pesquisa do país.
Um dos desafios que mobilizou a equipe é explicar o comportamento passado e prever o comportamento futuro da produtividade na agricultura e agricultura no Brasil, que será uma das frentes de ação do novo Centro de Pesquisa em Engenharia de Inteligência Artificial. A educação é outra área na qual os pesquisadores do ICMC já desenvolveram aplicativos premiados, usando tecnologias e conhecimentos sobre mineração de eventos. Em 2018, por exemplo, os pesquisadores criaram uma plataforma para analisar informações históricas sobre o comportamento virtual dos alunos, para evitar a desistência de cursos a distância.
SIGA A INCLINAÇÃO NAS REDES SOCIAIS