Defesa de dissertação (08/12/2025): Fernando Henrique de Jesus Fraga da Silva

Discente: Fernando Henrique de Jesus Fraga da Silva

Título: Aprendizado por Reforço Profundo Aplicado à Negociação Intradiária de Múltiplas Ações

Orientadores: Eduardo Bezerra da Silva (orientador) e Pedro Henrique González Silva (coorientador)

Banca: Eduardo Bezerra da Silva (Cefet/RJ), Pedro Henrique González Silva (UFRJ), Aline Marins Paes Carvalho (UFF) e Glauco Fiorott Amorim (Cefet/RJ)

Dia/Hora: 08/12/2025 às 15h

Sala: https://teams.microsoft.com/v2/?meetingjoin=true#/l/meetup-join/19:PKOJTuK7mfHSDE6QkCWQCYp71f0xOMNoRgSUj4wjMKc1@thread.tacv2/1763760050816?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d&anon=true&deeplinkId=91733be2-9804-4f09-ac6a-f1a362e67de8

Resumo: O mercado de ações é um ambiente dinâmico e volátil, no qual empresas de capital aberto negociam frações de seu valor, sujeitas a variações contínuas de preço influenciadas por fatores econômicos, políticos e sociais. Antecipar essas variações é uma tarefa complexa, especialmente no contexto da negociação intradiária, em que as decisões de compra e venda precisam ser tomadas em intervalos de tempo muito curtos, com base em dados que mudam rapidamente. Nesse cenário, o Aprendizado por Reforço (AR) surge como um paradigma promissor, capaz de desenvolver estratégias adaptativas por meio da interação contínua entre agente e ambiente. Esta dissertação investiga o uso de técnicas de Aprendizado por Reforço Profundo (ARP) na negociação financeira, com foco em cenários de negociação intradiária envolvendo múltiplas ações. É proposta uma abordagem baseada em ARP para estimar ações de compra e venda simultaneamente em diversos ativos, utilizando dados de mercado de alta granularidade, de modo a aproximar-se das condições reais de negociação. As análises experimentais foram conduzidas com o algoritmo Proximal Policy Optimization (PPO). Os resultados obtidos indicam que o agente proposto apresentou desempenho superior em relação a estratégias tradicionais de referência, alcançando ganhos superiores a 10 pontos percentuais em determinados casos.