Resumo: Neste trabalho, apresentarei (mais) um eficiente algoritmo guloso para o problema de agrupamento não supervisionado de dados (clusterização). Este algoritmo oferece ao cientista de dados a flexibilidade de escolha da função objetivo para o agrupamento, otimizando tanto a popular soma das distâncias ao quadrado (k-means), que assume que todos os grupos possuem a mesma variância, quanto funções alternativas que melhor se adaptam à variância de cada grupo.
Biografia: Rodrigo Franco Toso, Ph.D., obteve seu bacharelado em Ciência da Computação pela Universidade Federal de Lavras (UFLA), mestrado em Ciência da Computação pela Universidade Federal Fluminense (UFF) e doutorado em Ciência da Computação pela Rutgers, The State University of New Jersey, nos Estados Unidos. Desde 2017, é Cientista Sênior na Microsoft em Redmond, Washington, Estados Unidos, trabalhando nas áreas de aprendizado de máquina e otimização multi-objetivo aplicadas a problemas de relevância e monetização em mecanismos de busca.