Eu construo agentes de IA: Meu percurso além da engenharia de prompts

🌐🇧🇷 Português 🇮🇹 Italiano 🇩🇪 Deutsch 🇫🇷 Français

📖 15 min read•2,888 words•Updated Apr 5, 2026

Olá a todos, aqui é o Alex do agntai.net. Estamos em 25 de março de 2026, e recentemente eu me aprofundei em algo fundamental: como nós *construímos* realmente esses agentes de IA. Não apenas as brilhantes partes de LLM, mas toda a estrutura complexa que lhes permite fazer qualquer coisa útil no mundo real. Felizmente, superamos a fase em que “a engenharia de convites é tudo o que você precisa” e agora se trata de reunir sistemas confiáveis e escaláveis.

Hoje, quero falar sobre a arquitetura dos agentes, especificamente sobre como podemos passar de uma execução simples e linear de tarefas para algo mais resiliente, capaz de lidar com situações inesperadas. Meu objetivo será uma arquitetura modular e reflexiva – essencialmente, construir agentes que podem observar seu próprio processo, entender o que deu errado (ou certo) e se adaptar. Não é apenas uma teoria; eu vi com meus próprios olhos como um pouco de autoconsciência pode evitar muitas dores de cabeça.

O Problema dos Agentes Lineares: Meu Fracasso em um Projeto de Fim de Semana

Comecemos com uma história. Há algumas semanas, eu estava tentando automatizar uma tarefa de análise de dados bastante simples para um projeto secundário. Eu queria que um agente recuperasse dados financeiros, executasse um conjunto específico de testes estatísticos e, em seguida, resumisse os resultados em um relatório em markdown. Meu pensamento inicial? Uma cadeia simples:

Recuperar os dados da API.
Limpar os dados.
Executar testes estatísticos (usando uma biblioteca pré-definida).
Gerar um relatório.

Eu montei isso com LangChain, usando uma chamada GPT-4 para cada etapa, e me senti bastante satisfeito. Então eu pressionei “executar.”

O primeiro problema? O limite de taxa da API. Meu agente continuava apenas tentando alcançá-lo, falhando e, em seguida, passando para a próxima etapa com um conjunto de dados vazio. Sem gerenciamento de erros, sem lógica de nova tentativa, apenas um educado “Não consegui obter os dados, mas aqui está um bonito relatório sobre nada.”

O segundo problema? A etapa de limpeza dos dados. Às vezes, a API retornava nomes de colunas ligeiramente diferentes. Minhas funções de testes estatísticos esperavam `close_price`, mas recebiam `closing_price`. Meu agente simplesmente gerou um traceback do Python e falhou. Novamente, sem recuperação elegante, sem tentativa de entender por que a função falhou.

Essa experiência, embora frustrante, realmente destacou um ponto: os designs simples e lineares de agentes, onde cada etapa segue cegamente a anterior, são frágeis. Eles supõem um mundo perfeito onde as APIs sempre funcionam, os dados estão sempre impecáveis e as funções nunca falham. O mundo real não é assim. Precisamos de agentes capazes de fazer mais do que apenas executar uma sequência; eles devem observar, refletir e se adaptar.

Introdução à Arquitetura de Agente Reflexivo: A Abordagem do “Monólogo Interno”

A ideia central por trás de uma arquitetura de agente reflexivo é dar ao agente um mecanismo para observar suas próprias ações e resultados, e em seguida usar essa observação para iluminar suas decisões futuras. Pense nisso como um “monólogo interno” onde o agente se pergunta: “O que aconteceu? Foi bom? O que eu deveria fazer a seguir, dado o que aprendi?”

Não se trata apenas de adicionar blocos try-except. Trata-se de tornar o processo decisional do agente dinâmico e informado por seu próprio histórico de execução. Aqui está como eu geralmente o decomponho:

Os Componentes Chave de um Agente Reflexivo

Módulo de Percepção: É assim que o agente “vê” o mundo e suas próprias ações. Ele coleta observações do seu ambiente (respostas de API, mudanças no sistema de arquivos, entrada do usuário) e, de forma crucial, saídas e mensagens de erro de suas próprias ferramentas.
Módulo de Ação: É aqui que o agente realiza tarefas usando suas ferramentas disponíveis (funções, APIs, outros modelos). É nisso que a maioria das pessoas pensa ao construir agentes.
Módulo de Memória: Armazena observações, ações e reflexões passadas. Não é apenas um contexto de curto prazo; para a reflexão, frequentemente precisamos de uma memória de longo prazo sobre estratégias bem-sucedidas e falhadas.
Módulo de Reflexão: É o cérebro do processo reflexivo. Após uma ação, esse módulo pega as observações e memórias, e avalia criticamente o resultado. Ele faz perguntas como:
- A última ação foi bem-sucedida?
- Se não, por que falhou?
- O que poderíamos ter feito de diferente?
- Qual deveria ser a *próxima* ação, considerando essa nova compreensão?
- Devo modificar meu plano?
Módulo de Planejamento/Gestão de Objetivos: Embora muitas vezes esteja intricado com a reflexão, este módulo é responsável por decompor os objetivos de alto nível em etapas acionáveis e atualizar o plano com base nas reflexões.

A chave aqui é o ciclo de feedback: Ação -> Percepção -> Reflexão -> (potencialmente) Atualização do Plano -> Nova Ação. Não é uma rua de mão única; é um ciclo contínuo.

Um Exemplo Prático: Agente de Pipeline de Dados Auto-Reparador

Voltemos ao meu projeto de dados financeiros. Como um agente reflexivo gerenciaria esses problemas? Em vez de uma cadeia cega, introduziríamos a reflexão em pontos críticos.

Etapa 1: Definir as Ferramentas

Nosso agente precisa de ferramentas para interagir com o mundo. Essas são apenas funções Python encapsuladas de uma maneira que o LLM pode chamar.


def get_financial_data(symbol: str, start_date: str, end_date: str) -> dict:
 """
 Recupera dados financeiros históricos para um símbolo de ação dado.
 Gera uma exceção para erros de API ou limites de taxa.
 """
 # Simular uma chamada de API com possíveis erros
 import random
 if random.random() < 0.1: # Simular um erro de 10% na API
 raise ConnectionError("A chamada da API falhou: Limite de taxa excedido ou serviço indisponível.")
 if symbol == "FAILCO":
 raise ValueError("Símbolo inválido fornecido.")
 return {"symbol": symbol, "data": [{"date": "2023-01-01", "close_price": 100.0}]}

def clean_data(raw_data: dict) -> dict:
 """
 Limpa e padroniza os dados financeiros.
 Tenta normalizar variações comuns de nomes de colunas.
 """
 data = raw_data.get("data", [])
 if not data:
 raise ValueError("Nenhum dado para limpar.")
 
 # Simular a variação dos nomes de colunas e tentar corrigir
 if "closing_price" in data[0]:
 for item in data:
 item["close_price"] = item.pop("closing_price")
 
 # Validação básica
 for item in data:
 if "close_price" not in item:
 raise ValueError(f"Falta 'close_price' no item: {item}")
 
 return {"symbol": raw_data["symbol"], "cleaned_data": data}

def run_statistical_tests(cleaned_data: dict) -> dict:
 """
 Executa testes estatísticos pré-definidos sobre dados financeiros limpos.
 """
 if not cleaned_data.get("cleaned_data"):
 raise ValueError("Nenhum dado limpo para analisar.")
 
 # Simular uma análise estatística
 avg_price = sum(item["close_price"] for item in cleaned_data["cleaned_data"]) / len(cleaned_data["cleaned_data"])
 return {"analysis_results": f"Preço de fechamento médio: {avg_price:.2f}"}

def generate_report(analysis_results: dict) -> str:
 """
 Gera um relatório em markdown a partir dos resultados da análise.
 """
 return f"# Relatório de Análise Financeira\n\n{analysis_results.get('analysis_results', 'Nenhuma análise realizada.')}"

tools = [get_financial_data, clean_data, run_statistical_tests, generate_report]

Essas ferramentas são bastante padrão. A mágica reside na forma como o agente as utiliza e reflete sobre seus resultados.

Etapa 2: O Ciclo do Agente Reflexivo

É aqui que introduzimos as etapas de observação e reflexão. Estou simplificando as chamadas do LLM por motivos de concisão, mas imagine um prompt de sistema que guie o LLM a agir como “Módulo de Reflexão.”

“`python
from typing import List, Dict, Any
import time

class ReflectiveAgent:
def __init__(self, llm, tools: List[Any]):
self.llm = llm # Este seria o seu cliente LLM (por exemplo, OpenAI, Anthropic)
self.tools = {tool.__name__: tool for tool in tools}
self.memory: List[Dict[str, Any]] = [] # Armazena o histórico de ações, observações, reflexões
self.current_plan: List[str] = [“get_financial_data”, “clean_data”, “run_statistical_tests”, “generate_report”]
self.current_step_index = 0
self.max_retries = 3

def _call_llm(self, prompt: str) -> str:
# Em um sistema real, isso chamaria seu LLM
# Para este exemplo, vamos simular uma resposta simples do LLM baseada em palavras-chave
print(f”LLM Prompt: {prompt}\n—“)
if “Error” in prompt or “failed” in prompt:
if “API call failed” in prompt:
return “Reflexão: A chamada para a ferramenta anterior falhou devido a um erro de API. Eu deveria tentar novamente a ferramenta ‘get_financial_data’. Isso é um problema temporário. Vou esperar um pouco antes de tentar novamente.”
elif “Missing ‘close_price'” in prompt or “No data to clean” in prompt:
return “Reflexão: A ferramenta ‘clean_data’ falhou devido a um formato de dados inesperado ou dados ausentes. Eu preciso reavaliar os dados brutos ou ajustar minha estratégia de limpeza. Talvez a ferramenta ‘get_financial_data’ não tenha fornecido bons dados. Eu deveria tentar chamar ‘get_financial_data’ novamente para ver se a estrutura dos dados mudou, ou talvez eu devesse pedir esclarecimentos ao usuário se eu tivesse uma ferramenta de interação com o usuário.”
elif “Invalid symbol” in prompt:
return “Reflexão: A ferramenta ‘get_financial_data’ falhou devido a um símbolo inválido. Isso é um erro de entrada fundamental. Eu deveria informar o usuário ou parar.”
else:
return “Reflexão: Um erro inesperado ocorreu. Eu preciso rever a última ação e tentar entender a causa raiz. Meu plano atual pode estar com defeito.”
elif “succeeded” in prompt and “next step” in prompt:
return “Reflexão: A última ação teve sucesso. Eu deveria passar para a próxima etapa do meu plano.”
else:
return “Reflexão: Estou refletindo atualmente sobre a tarefa. Qual é o estado atual e qual deveria ser minha próxima ação baseada no plano?”

def run(self, symbol: str):
context = {“symbol”: symbol, “raw_data”: None, “cleaned_data”: None, “analysis_results”: None}

while self.current_step_index < len(self.current_plan): current_tool_name = self.current_plan[self.current_step_index] tool_func = self.tools.get(current_tool_name) if not tool_func: print(f"Erro: Ferramenta '{current_tool_name}' não encontrada. Parando.") break print(f"\n--- Tentativa de execução: {current_tool_name} ---") observation = {"status": "started", "tool": current_tool_name} retries = 0 while retries <= self.max_retries: try: if current_tool_name == "get_financial_data": result = tool_func(symbol=symbol, start_date="2023-01-01", end_date="2023-12-31") context["raw_data"] = result elif current_tool_name == "clean_data": result = tool_func(context["raw_data"]) context["cleaned_data"] = result elif current_tool_name == "run_statistical_tests": result = tool_func(context["cleaned_data"]) context["analysis_results"] = result elif current_tool_name == "generate_report": result = tool_func(context["analysis_results"]) print(result) # Saída final do relatório context["final_report"] = result observation["status"] = "succeeded" observation["output"] = result break # Ação bem-sucedida, sai do loop de tentativas except Exception as e: observation["status"] = "failed" observation["error"] = str(e) print(f"A ferramenta '{current_tool_name}' falhou: {e}") retries += 1 if retries <= self.max_retries: print(f"Tentando novamente '{current_tool_name}' (Tentativa {retries}/{self.max_retries})...") time.sleep(1) # Simular um atraso else: print(f"Número máximo de tentativas para '{current_tool_name}' atingido.") break # Número máximo de tentativas atingido, sai do loop de tentativas self.memory.append({"action": observation}) # --- Etapa de Reflexão --- reflection_prompt = f""" Contexto Atual: {context} Última Ação: {observation} Objetivo: Completar a análise dos dados financeiros e o relatório. Refletir sobre o resultado da última ação. - Teve sucesso? - Se não, qual foi o erro? - Qual deveria ser o próximo passo? Devo tentar novamente, mudar de estratégia ou parar? - Se ocorreu um erro que indica uma entrada inválida, o que devo fazer? """ reflection = self._call_llm(reflection_prompt) print(f"Reflexão: {reflection}") self.memory.append({"reflection": reflection}) # Com base na reflexão, decidir a próxima ação if observation["status"] == "failed": if "API call failed" in observation["error"] and retries <= self.max_retries: # A lógica de tentativas já está sendo gerida pelo loop while interno, # mas a reflexão confirma a estratégia. Se quisermos ajustar # o número de tentativas ou a estratégia com base no LLM, o faríamos aqui. print("A reflexão sugere tentar novamente, o que foi tentado.") # Se todas as tentativas falharam, precisamos de uma nova estratégia ou parar. if retries > self.max_retries:
print(“A reflexão indica que todas as tentativas falharam devido a um erro temporário. Parando ou escalando.”)
break
# Se as tentativas ainda estiverem em andamento, o ‘break’ do loop interno não foi alcançado,
# portanto, devemos permanecer na mesma etapa para a próxima iteração do loop externo,
# efetivamente continuando a tentativa, ou, se realmente quisermos que a reflexão leve,
# o LLM deve sugerir uma nova ação. Para simplificar,
# se o número máximo de tentativas foi atingido e falhou, paramos.
if retries > self.max_retries:
print(“Todas as tentativas para o erro temporário falharam. Parando.”)
break

elif “Invalid symbol” in observation[“error”]:
print(“A reflexão indica um erro de entrada crítico. Incapaz de prosseguir. Informar o usuário.”)
# Em um agente real, isso acionaria uma ferramenta de interação com o usuário.
break
elif “No data to clean” in observation[“error”] or “Missing ‘close_price'” in observation[“error”]:
print(“A reflexão indica um problema de qualidade dos dados. Reavaliando a etapa anterior ou parando.”)
# Aqui, uma reflexão mais avançada poderia sugerir voltar para ‘get_financial_data’
# ou até mesmo modificar os parâmetros da ferramenta ‘clean_data’.
# Por enquanto, vamos parar se for um problema persistente de dados após as tentativas.
if retries > self.max_retries:
print(“Problema persistente de limpeza de dados. Parando.”)
break
# Se o erro for sobre a ausência de dados, isso implica que get_financial_data falhou silenciosamente ou forneceu dados ruins.
# Um agente robusto poderia refletir e decidir chamar get_financial_data novamente antes de tentar clean_data.
# Para este exemplo, vamos simplesmente parar se as tentativas não resolveram o problema.
print(“A reflexão sugere um problema de dados. Parando por enquanto.”)
break # Parando por problemas de dados não resolvidos após as tentativas

else:
print(“Falha não tratada após reflexão. Parando.”)
break # Erros não tratados

self.current_step_index += 1 # Passar para a próxima etapa se a atual tiver sido bem-sucedida ou gerida.

print(“\n— Execução do Agente concluída —“)
return context

# — Execução do Agente —
# Substitua pelo seu cliente LLM real
class MockLLM:
def chat(self, messages):
return {“choices”: [{“message”: {“content”: “Resposta fictícia do LLM”}}]}

mock_llm = MockLLM()
agent = ReflectiveAgent(mock_llm, tools)

print(“\n— Execução com um bom símbolo —“)
agent.run(“AAPL”)

print(“\n— Execução com um símbolo que pode falhar na API —“)
# Reiniciar o estado do agente para uma nova execução
agent = ReflectiveAgent(mock_llm, tools)
agent.run(“GOOG”)

print(“\n— Execução com um símbolo deliberadamente inválido —“)
agent = ReflectiveAgent(mock_llm, tools)
agent.run(“FAILCO”)
“““html

L’ `ReflectiveAgent` tem uma `memory` para acompanhar seu percurso.
Após cada execução de ferramenta, ele registra a `observation` (sucesso, fracasso, saída, erro).
Essencialmente, ele chama depois `_call_llm` (simulando nosso LLM para reflexão) com um prompt que inclui o contexto atual e o resultado da `last_action`.
A reflexão do LLM informa então o próximo movimento do agente. Se a API falhar, o LLM sugere tentar novamente. Se for um símbolo inválido, sugere que pare. Se a limpeza de dados falhou devido a um formato inesperado, idealmente sugeriria reexaminar os dados ou ajustar a abordagem de limpeza (embora minha resposta de LLM fictício seja simplificada).
O loop `while` externo continua até que o plano seja concluído ou uma falha crítica e irreparável ocorra após reflexão.

Este é um exemplo simplificado, mas demonstra o loop central. Um verdadeiro sistema teria um prompt muito mais sofisticado para o `Módulo de Reflexão` e potencialmente um LLM que possa diretamente emitir comandos estruturados como `RETRY_TOOL(tool_name, delay)` ou `MODIFY_PLAN(new_step, index)`. Minha função `_call_llm` é um espaço reservado que retorna respostas pré-concebidas baseadas em palavras-chave, mas em uma configuração de produção, é aí que sua cadeia LLM real residiria, projetada para emitir ações específicas baseadas em sua reflexão.

Minha experiência na construção desses sistemas

Quando comecei a integrar esses loops reflexivos, a configuração inicial exigia um pouco mais de trabalho. Você precisa elaborar bons prompts para a etapa de reflexão, garantindo que o LLM compreenda seu papel na avaliação dos resultados. Você também deve estruturar suas observações de maneira clara para que o LLM tenha boas entradas.

No entanto, o retorno foi significativo. Meus agentes passaram de travar no primeiro sinal de problema a lidarem com graça com erros de rede temporários, adaptando-se a pequenas mudanças no esquema de dados, e até mesmo às vezes identificando problemas mais profundos que eu não tinha antecipado. É como dar um pouco de senso comum ao seu agente.

Um desafio que enfrentei foi a engenharia dos prompts para o módulo de reflexão. Você não quer que ele apenas repita o erro. Você quer que ele analise, deduza e proponha. Tive sucesso com prompts que pedem explicitamente:

“Dada a falha observada, qual é a causa raiz mais provável?”
“Qual ação específica deve ser tomada para resolver isso? Considere tentativas, ferramentas alternativas ou modificação do plano.”
“Se este problema for persistente, como devo escalar ou encerrar isso de forma elegante?”

Além disso, não subestime a importância do `Memory Module`. Para tarefas complexas, o agente precisa se lembrar *por que* tentou algo e quais foram os resultados em várias etapas. As janelas de contexto de curto prazo não são suficientes para uma verdadeira reflexão.

Pontos a Retenção

“`

Conceba para o Fracasso, Não Apenas para o Sucesso: Ao planejar o fluxo de trabalho do seu agente, pense ativamente no que pode dar errado em cada etapa. Isso o prepara para onde colocar seus pontos de observação e reflexão.
A Observação Explícita é Fundamental: Certifique-se de que suas ferramentas retornem resultados claros e estruturados e, acima de tudo, que propaguem os erros de forma eficaz. O Reflection Module só pode funcionar com o que ele “vê”.
Trate a Reflexão como um Cidadão de Primeira Classe: Não se contente em adicionar um tratamento de erros. Integre um Reflection Module dedicado (mesmo que seja apenas uma chamada LLM específica) no loop principal do seu agente.
Comece Simples, Itére: Você não precisa de um sistema de reflexão super complexo desde o primeiro dia. Comece com uma lógica de reexame básica baseada na reflexão LLM e, em seguida, adicione gradualmente uma tomada de decisão mais sofisticada para modificação de planos ou mudança de ferramenta.
Interrogue o Reflection Module com Cuidado: Guie seu LLM para realizar um pensamento analítico, não apenas um resumo. Faça perguntas abertas sobre as causas raízes e soluções propostas.
Considere a Memória de Longo Prazo: Para agentes que operam por longos períodos ou lidam com tarefas complexas em várias etapas, um sistema de memória que armazena mais do que o contexto do momento é crucial para uma reflexão e aprendizado eficazes.

Construir agentes capazes de refletir sobre seu próprio desempenho os torna consideravelmente mais robustos e úteis. Isso nos aproxima de sistemas verdadeiramente autônomos que podem operar de forma confiável em ambientes imprevisíveis. É um pouco mais trabalho no início, mas é um investimento que compensa amplamente em confiabilidade dos agentes e na redução de dores de cabeça relacionadas à manutenção. Experimente isso em seu próximo projeto!

Eu construo agentes de IA: Meu percurso além da engenharia de prompts

O Problema dos Agentes Lineares: Meu Fracasso em um Projeto de Fim de Semana

Introdução à Arquitetura de Agente Reflexivo: A Abordagem do “Monólogo Interno”

Os Componentes Chave de um Agente Reflexivo

Um Exemplo Prático: Agente de Pipeline de Dados Auto-Reparador

Etapa 1: Definir as Ferramentas

Etapa 2: O Ciclo do Agente Reflexivo

Minha experiência na construção desses sistemas

Pontos a Retenção

Artigos Relacionados

Related Articles

O Problema dos Agentes Lineares: Meu Fracasso em um Projeto de Fim de Semana

Introdução à Arquitetura de Agente Reflexivo: A Abordagem do “Monólogo Interno”

Os Componentes Chave de um Agente Reflexivo

Um Exemplo Prático: Agente de Pipeline de Dados Auto-Reparador

Etapa 1: Definir as Ferramentas

Etapa 2: O Ciclo do Agente Reflexivo

Minha experiência na construção desses sistemas

Pontos a Retenção

Artigos Relacionados

You May Also Like

📚 You Might Also Like

Related Articles