Análise de Dados e Aplicações

A linha Análise de Dados e Aplicações engloba tanto os aspectos relacionados à estrutura de dados, armazenamento e localidade de dados quanto o processo de produção de informação e extração de conhecimento a partir dos dados. A pesquisa nessa linha envolve estruturas de dados e algoritmos para apoiar o processo de extração de conhecimento a partir de dados, bem como na aplicação e desenvolvimento de funções para pré-processamento, análise de dados e pós-processamento de dados. Nessa linha é apropriado estabelecer um tratamento datacêntrico a esses processos que, comumente, correspondem a experimentos in-silico.

Essa linha de pesquisa tem uma grande sinergia com o domínio do problema abordado e apresenta um caráter fortemente multidisciplinar. As áreas de aplicações associadas à linha são comumente observadas nos eixos governamental, científico e empresarial. No eixo governamental, podem-se destacar aplicações nas áreas de planejamento, saúde, transportes, educação e comunicação. No eixo científico, destacam-se as aplicações em astronomia, sísmica, saúde e fármacos. No eixo empresarial, destacam-se o desenvolvimento de softwares para o mercado de Tecnologia da Informação e suas aplicações em marketing, redes sociais, sistemas multimídia e cidades inteligentes. Todos esses domínios trazem consigo diferentes tecnologias presentes na área de produção e consumo de grandes volumes de dados que podem ser exemplificadas a partir da Internet das Coisas (IoT), redes de sensores e aplicações interativas.

Nesse dilúvio de dados, as características e demandas particulares das aplicações trazem inúmeros desafios no gerenciamento de grandes volumes de dados. No que tange ao processamento de grandes volumes de dados, tem-se a necessidade premente de utilizar processamento de alto desempenho (PAD) para viabilizar a análise de dados em larga escala. Há importantes desafios no estabelecimento dessas análises, comumente modeladas como workflows. Nesses workflows, as atividades e os dados estão direcionados à execução em algum ambiente de PAD (e.g., clusters, grades, nuvens).

As diferentes aplicações, ao mesmo tempo que se apresentam como pesquisa aplicada, muitas vezes proporcionam a oportunidade de elaboração de novos arcabouços teóricos em pesquisa básica, de caráter mais geral, para a solução desses problemas práticos. A pesquisa básica ocorre tanto ao estabelecer representações que sejam agnósticas ao meio em que serão executados, como também na elaboração de novas funções mais adequadas ao tratamento e à extração de conhecimento a partir de diferentes fontes de dados e que tenham um amplo espectro de uso.

Aprendizado de Máquina e Otimização

As atividades desta linha de pesquisa envolvem o estudo, a proposta, o desenvolvimento de modelos computacionais em otimização e computação científica, bem como a aplicação de técnicas de aprendizado de máquina na descrição de problemas complexos desde a Ciência da Computação até vários domínios, como Biologia, Engenharia, Finanças, Saúde e Logística.

De modo geral, pode-se dividir a busca por soluções em dois caminhos, métodos que utilizam informações obtidas através de estudos teóricos e métodos que usam de dados históricos para “aprender” como lidar com cenários futuros, os chamados modelos orientados a dados. 

No primeiro caminho temos a Modelagem Computacional que abrange a Otimização e a Computação Científica, que são áreas que buscam desenvolver ferramentas para apoiar na tomada de decisão ou auxiliar na compreensão de fenômenos reais. Tais áreas se utilizam de modelos matemáticos e do desenvolvimento de algoritmos eficientes para resolver problemas teóricos e aplicados, bem como no uso de técnicas de computação em alto desempenho. Dentre as técnicas de interesse desta área podemos destacar técnicas de Inteligência Computacional como Algoritmos Genéticos, Colônias de Formigas, dentre outras. No contexto das aplicações destacam-se, mas não se restringem, os problemas envolvendo Cidades Inteligentes, Indústria 4.0 e Internet das Coisas.

Pertencente ao segundo caminho, o Aprendizado de Máquina (AM), subárea da Inteligência Artificial, investiga como as máquinas podem aprender alguma tarefa depois de receber um conjunto de experiências (na forma de dados históricos). Duas subáreas de AM são de particular interesse para nosso grupo de pesquisa: Aprendizado Profundo e Aprendizado por Reforço. Nestas áreas estamos interessados em como simular o comportamento do cérebro humano, bem como no desenvolvimento de técnicas que permitam o comportamento racional de agentes de software. São de interesse desta área os problemas envolvendo reconhecimento de padrões, visão computacional, processamento de linguagem natural, bem como planejamento e escalonamento de tarefas, jogos e muitos outros.

A natureza multidisciplinar desta linha de pesquisa permite que pesquisadores e estudantes envolvidos adquiram um treinamento sólido e amplo devido à aplicabilidade em vários domínios e ao conhecimento das várias facetas dos problemas abordados.