Defesa de dissertação (08/12/2025): Fernando Henrique de Jesus Fraga da Silva
Discente: Fernando Henrique de Jesus Fraga da Silva
Título: Aprendizado por Reforço Profundo Aplicado à Negociação Intradiária de Múltiplas Ações
Orientadores: Eduardo Bezerra da Silva (orientador) e Pedro Henrique González Silva (coorientador)
Banca: Eduardo Bezerra da Silva (Cefet/RJ), Pedro Henrique González Silva (UFRJ), Aline Marins Paes Carvalho (UFF) e Glauco Fiorott Amorim (Cefet/RJ)
Dia/Hora: 08/12/2025 às 15h
Resumo: O mercado de ações é um ambiente dinâmico e volátil, no qual empresas de capital aberto negociam frações de seu valor, sujeitas a variações contínuas de preço influenciadas por fatores econômicos, políticos e sociais. Antecipar essas variações é uma tarefa complexa, especialmente no contexto da negociação intradiária, em que as decisões de compra e venda precisam ser tomadas em intervalos de tempo muito curtos, com base em dados que mudam rapidamente. Nesse cenário, o Aprendizado por Reforço (AR) surge como um paradigma promissor, capaz de desenvolver estratégias adaptativas por meio da interação contínua entre agente e ambiente. Esta dissertação investiga o uso de técnicas de Aprendizado por Reforço Profundo (ARP) na negociação financeira, com foco em cenários de negociação intradiária envolvendo múltiplas ações. É proposta uma abordagem baseada em ARP para estimar ações de compra e venda simultaneamente em diversos ativos, utilizando dados de mercado de alta granularidade, de modo a aproximar-se das condições reais de negociação. As análises experimentais foram conduzidas com o algoritmo Proximal Policy Optimization (PPO). Os resultados obtidos indicam que o agente proposto apresentou desempenho superior em relação a estratégias tradicionais de referência, alcançando ganhos superiores a 10 pontos percentuais em determinados casos.