Skip to main content

Command Palette

Search for a command to run...

AI Coding com Agents Locais e Open Source

O Guia para SREs e DevOps levarem a AI ao próximo nível

Updated
12 min read
AI Coding com Agents Locais e Open Source
E

Linux power user since 2003. IT Manager, DevOps/SRE, Systems Administrator, and teacher. Bass player, Krav Maga practitioner, and sport shooter.

https://esli.blog || https://esli.cafe

Se você trabalha com infraestrutura, automação ou desenvolvimento, provavelmente já percebeu que 2025 é o ano em que os AI coding agents deixaram de ser curiosidade para se tornarem ferramentas de produção. A diferença entre um agente e um simples autocomplete? O agente executa. Ele não apenas sugere código — ele cria arquivos, roda comandos, debugga erros e faz commits. Tudo isso enquanto você toma café (ou apaga incêndios em produção, porque SRE é assim).

Para quem trabalha com SRE/DevOps, o apelo é óbvio: automação de tarefas repetitivas, geração de scripts de migração, troubleshooting de configurações Terraform, análise de logs, criação de runbooks. A possibilidade de rodar tudo localmente — sem enviar código proprietário ou dados sensíveis para APIs externas — é o que separa essas ferramentas das alternativas SaaS. Compliance, air-gapped environments, dados de clientes: tudo isso importa quando você é responsável pela infraestrutura.

Este artigo lista as principais ferramentas open source disponíveis, organizadas por categoria. O foco é praticidade: o que cada uma faz, onde roda, e por que você deveria (ou não) considerar.

Plataformas de Inferência Local (LLM Runners)

Antes de rodar qualquer agente, você precisa de um runtime para executar os modelos. Estas são as fundações:

Ollamahttps://ollama.ai
Runtime minimalista para execução de LLMs locais via CLI. Um ollama run llama3 e você tem um modelo rodando. API compatível com OpenAI, o que significa que qualquer ferramenta que fale com a API da OpenAI pode apontar para seu Ollama local. Suporta tool calling nativo, essencial para agentes. Para SRE, é a forma mais rápida de ter um LLM disponível para scripts, pipelines ou integração com outras ferramentas. Deploy via binário ou container Docker.

LocalAIhttps://localai.io
Se Ollama é o canivete suíço, LocalAI é a caixa de ferramentas completa. Drop-in replacement para a API OpenAI, mas vai além: suporta geração de imagens, áudio, transcrição (Whisper), text-to-speech. O módulo LocalAGI adiciona capacidade de agentes autônomos; LocalRecall oferece busca semântica. Funciona em CPU — não exige GPU. Ideal para ambientes on-premise onde você quer uma stack AI completa sem depender de cloud.

LM Studiohttps://lmstudio.ai
Interface gráfica para download e execução de modelos do Hugging Face. Servidor OpenAI-compatible embutido. Closed-source mas gratuito para uso pessoal. Útil para testar modelos antes de colocar em produção, ou para membros da equipe que preferem GUI. Otimizado para Apple Silicon e NVIDIA.

Janhttps://jan.ai
Alternativa 100% open-source ao ChatGPT para execução offline. Desktop app com download de modelos integrado, API local compatível com OpenAI (porta 1337 por padrão). Zero telemetria, dados armazenados localmente. Para quem precisa de uma interface amigável mas não quer abrir mão do controle.

GPT4Allhttps://gpt4all.io
Focado em rodar LLMs quantizados em hardware consumer-grade. Suporta 100+ modelos, interface desktop multiplataforma. A proposta é democratização: rodar AI em qualquer máquina, sem requisitos de hardware exóticos.

AnythingLLMhttps://anythingllm.com
Workspace para RAG (Retrieval-Augmented Generation) e chat com documentos. Conecta com múltiplos providers (Ollama, OpenAI, Azure), vector stores integrados, AI agents com tool calling. Deploy via Docker ou desktop app. Para SRE, é interessante para criar bases de conhecimento pesquisáveis sobre runbooks, documentação de infra, post-mortems.

Agentes de Código para Terminal e IDEs

Para quem vive no terminal, estas ferramentas integram AI diretamente no fluxo de trabalho CLI:

Aiderhttps://aider.chat | https://github.com/Aider-AI/aider
Pair programming no terminal. O Aider mapeia seu codebase completo, entende a estrutura do projeto, e faz edições cirúrgicas. Commits automáticos com mensagens descritivas. Suporta 30+ linguagens e qualquer LLM (Claude, GPT-4, modelos locais via Ollama). Top scores no SWE-Bench, o benchmark mais respeitado para coding agents. Para SRE: ideal para refatorar scripts Terraform, atualizar Ansible playbooks, ou gerar testes para módulos de infraestrutura. O fluxo é simples: aider arquivo.tf, descreve o que quer, e o Aider aplica as mudanças diretamente.

Open Interpreterhttps://openinterpreter.com | https://github.com/openinterpreter/open-interpreter
Interface natural language para seu computador. Diferente de outros agentes que só editam código, o Open Interpreter executa: roda scripts, manipula arquivos, interage com APIs, instala pacotes. Você descreve o que quer em linguagem natural; ele traduz para comandos e executa. Suporta modelos locais via Ollama/LM Studio. Para DevOps, é útil para tarefas ad-hoc: "analise os logs do nginx das últimas 24h e me diga quais IPs geraram mais 5xx" ou "crie um script que faça backup incremental desses diretórios para S3".

OpenCodehttps://opencode.ai | https://github.com/sst/opencode
CLI com TUI (Terminal User Interface) construída em Go. 60k+ stars, usado por 650k+ devs/mês. Suporta múltiplos providers (OpenAI, Anthropic, Gemini, Bedrock, Groq, Azure, modelos locais). Session management persistente com SQLite, integração LSP para code intelligence. Diferencial: integração com GitHub Actions — você pode invocar o OpenCode em PRs e issues via comentários. Plan mode para revisar mudanças antes de aplicar. Disponível também como desktop app.

Goose (Block)https://block.github.io/goose | https://github.com/block/goose
Framework de agentes da Block (a empresa por trás do Square e Cash App). Escrito em Rust, executa 100% local. Vai além de código: instala dependências, executa comandos, testa, debugga, interage com APIs externas. Suporte completo a MCP (Model Context Protocol) — o padrão da Anthropic para extensibilidade de ferramentas. Desktop app e CLI. Agnóstico ao modelo. A Block reportou que engenheiros internos economizam ~20% do tempo em tarefas de manutenção usando o Goose. O fato de ser open-source (Apache 2.0) e ter backing de uma empresa do porte da Block dá confiança para uso enterprise.

Plandexhttps://plandex.ai | https://github.com/plandex-ai/plandex
Agente para projetos grandes. Suporta 2M tokens de contexto efetivo, diff review em sandbox isolado (mudanças ficam separadas do projeto até você aprovar), commits controlados. Combina modelos de múltiplos providers. Terminal-based workflow robusto para quem trabalha com codebases extensos. Nota: a versão cloud foi descontinuada em outubro/2025, mas funciona self-hosted com Docker ou servidor próprio.

Clinehttps://cline.bot | https://github.com/cline/cline
O agente open-source mais popular para VSCode, com 4M+ de downloads. Funciona em dois modos: Plan (planeja as mudanças) e Act (executa). Human-in-the-loop obrigatório — cada mudança requer aprovação, o que é bom para ambientes onde você não quer surpresas. Executa comandos no terminal integrado, browser automation para testes, criação/edição de arquivos. Extensível via MCP: você pode criar ferramentas customizadas ("add a tool that fetches Jira tickets" e o Cline cria e instala o MCP server). Suporta qualquer provider: OpenRouter, Anthropic, OpenAI, Gemini, Bedrock, Ollama, LM Studio.

Roo Codehttps://roocode.com | https://github.com/RooCodeInc/Roo-Code
Fork do Cline com foco em multi-agent workflows. A ideia é ter um "time" de agentes especializados: Architect (planeja estrutura), Code (implementa), Debug (investiga erros), Ask (responde perguntas). Você pode criar Custom modes ilimitados: QA Engineer, Product Manager, Security Auditor — cada um com prompts e ferramentas específicas. Suporte a VSCode e JetBrains. O Roo Cloud permite delegar trabalho para agentes rodando remotamente, acionáveis via Slack ou GitHub. Para equipes de platform engineering, a possibilidade de ter agentes especializados em diferentes aspectos (segurança, performance, compliance) é interessante.

Kilo Codehttps://kilo.ai | https://github.com/Kilo-Org
Lançado em março/2025, já acumulou 250k+ instalações e 10k+ stars. Diferencial: suporta 400+ modelos sem necessidade de configurar API keys (provider integrado opcional). Orchestrator mode decompõe tarefas complexas em subtasks executados por agentes especializados. Memory Bank mantém contexto persistente entre sessões. Suporta VSCode, JetBrains, Cursor, Windsurf e CLI standalone.

Continuehttps://continue.dev | https://github.com/continuedev/continue
Plataforma para criar assistentes AI customizáveis. 26k+ stars. Três modos: Chat (conversa sobre código), Plan (cria plano de implementação), Agent (executa mudanças). CLI com TUI e modo headless para CI/CD. Configuração via .continue/rules/ permite definir padrões de equipe que o AI segue. Integração MCP com GitHub, Sentry, Snyk, Linear — o agente pode buscar contexto de issues, alertas de segurança, erros de produção. Para DevOps, a possibilidade de rodar em modo headless dentro de pipelines CI/CD abre cenários interessantes: code review automatizado, geração de changelog, atualização de documentação.

Qodo Gen (anteriormente Codium) — https://www.qodo.ai
Plataforma "quality-first" com 751k instalações no VSCode. Foco em geração de código, testes unitários e documentação com ênfase em code correctness. Menos autônomo que outros — a proposta é assistência com garantia de qualidade, não automação total. Para times que precisam de cobertura de testes mas não têm tempo de escrever, é uma opção pragmática.

Plataformas Low-Code / No-Code para Agentes

Para quem prefere construir workflows visualmente ou precisa de algo mais acessível para membros não-técnicos da equipe:

n8nhttps://n8n.io | https://github.com/n8n-io/n8n
Plataforma de automação visual com 400+ integrações e suporte nativo a AI agents via LangChain. Self-hosted, fair-code license. Combina workflows tradicionais (webhooks, APIs, bancos de dados) com capacidades de LLM e RAG. Para SRE, é útil para criar automações que combinam AI com sistemas existentes: "quando um alerta do PagerDuty chegar, busque logs relacionados, gere um resumo, e poste no canal do Slack". A curva de aprendizado é menor que escrever tudo em código.

Flowisehttps://flowiseai.com | https://github.com/FlowiseAI/Flowise
Builder visual drag-and-drop para aplicações LLM, baseado em LangChain. Suporta RAG, chatbots, agents com tool calling. Deploy via Docker, API REST exposta automaticamente. Interface amigável para prototipagem rápida. Útil para criar POCs de assistentes internos antes de investir em desenvolvimento custom.

Langflowhttps://langflow.org | https://github.com/langflow-ai/langflow
Plataforma low-code para AI agents e MCP servers. Editor visual Python-based. Self-hosted only (MIT license). Mais técnico que Flowise, com maior flexibilidade para customização.

Difyhttps://dify.ai | https://github.com/langgenius/dify
Plataforma all-in-one com 114k+ stars. Visual workflow builder, RAG pipelines, agent capabilities, observability integrada. Suporta deploy local ou cloud, múltiplos LLM providers. Para times que querem uma solução completa sem montar stack from scratch.

Frameworks de Agentes Multi-Purpose

Para quem quer construir sistemas de agentes customizados ou precisa de mais controle:

AutoGPThttps://agpt.co | https://github.com/Significant-Gravitas/AutoGPT
Um dos primeiros frameworks de agentes autônomos, com 177k+ stars. Plataforma low-code para criação de agentes goal-driven. Interface visual drag-and-drop, execução contínua em cloud (ou self-hosted), suporte a múltiplas ferramentas. A proposta é definir um objetivo e deixar o agente decompor em subtasks e executar autonomamente. Comunidade ativa, mas requer cuidado com autonomia excessiva em ambientes de produção.

CrewAIhttps://crewai.com | https://github.com/crewAIInc/crewAI
Framework Python para sistemas multi-agente com abstração de "crews" (equipes). Cada agente tem role/goal/backstory específicos e colaboram em workflows estruturados. CrewAI Studio oferece interface visual. Ideal para simular equipes: um agente pesquisa, outro analisa, outro implementa. Para DevOps, pode ser usado para criar pipelines de análise onde diferentes agentes cuidam de aspectos específicos (segurança, performance, compliance).

LangChain / LangGraphhttps://langchain.com | https://github.com/langchain-ai/langchain
Framework modular para construção de aplicações LLM. LangGraph adiciona orchestration baseada em grafos com estado persistente, branching e error recovery. Fundação para muitas das ferramentas listadas aqui. Mais baixo nível — você constrói os agentes em vez de usar prontos.

AutoGen (Microsoft)https://microsoft.github.io/autogen | https://github.com/microsoft/autogen
Framework event-driven para sistemas multi-agente com conversação estruturada. Suporta workflows determinísticos e dinâmicos, extensível via MCP servers. Foco em colaboração entre agentes especializados. Backing da Microsoft dá credibilidade para uso enterprise.

MetaGPThttps://github.com/geekan/MetaGPT
Simula estrutura de empresa de software com agentes assumindo roles: PM, Architect, Engineer, QA. Gera documentação, código e testes de forma coordenada. Interessante para prototipagem de features completas.

Ferramentas Especializadas

PrivateGPThttps://privategpt.io | https://github.com/zylon-ai/private-gpt
API production-ready para RAG 100% privado. Ingestion de documentos, chat contextual, tudo offline. Baseado em LlamaIndex, API compatível com OpenAI. Para ambientes com dados sensíveis onde nada pode sair da rede. Casos de uso: chat com documentação interna, análise de logs confidenciais, base de conhecimento para runbooks.

Huginnhttps://github.com/huginn/huginn
Plataforma self-hosted para criação de agentes que monitoram web, coletam dados e executam ações baseadas em triggers. Inspirado no IFTTT mas totalmente controlável. Mais voltado para automação de data pipelines e monitoramento do que coding, mas útil no toolkit de SRE.

OpenHands (anteriormente OpenDevin) — https://github.com/All-Hands-AI/OpenHands
Agente autônomo de engenharia de software. Opera em nível de repositório, faz changes multi-file, executa testes em sandbox, debugging iterativo. Mais autônomo que a maioria — a proposta é delegar features inteiras.

Comparativo Resumido

FerramentaAmbienteFocoSelf-hostedMCP Support
AiderTerminalPair programming
Open InterpreterTerminalExecução geral
OpenCodeTerminal/Desktop/IDECoding agent
GooseTerminal/DesktopAgente extensível
ClineVSCodeIDE agent
Roo CodeVSCode/JetBrainsMulti-agent IDE
Kilo CodeVSCode/JetBrains/CLIOrchestration
ContinueVSCode/JetBrains/CLICustomizable
n8nWeb UIWorkflow automationVia integração
FlowiseWeb UIVisual RAG/agentsVia integração

Conclusão

O ecossistema de AI coding agents open source amadureceu significativamente. Não estamos mais falando de demos interessantes ou projetos de fim de semana — são ferramentas com milhões de usuários, backing de empresas como Block e Microsoft, e comunidades ativas de contribuidores.

Para SRE/DevOps, o valor está em três frentes:

  1. Automação de tarefas repetitivas: geração de scripts, atualização de configurações, migração de código. O tempo que você gastaria escrevendo um script de migração de Terraform pode ser reduzido drasticamente.

  2. Troubleshooting assistido: análise de logs, correlação de eventos, sugestão de fixes. Quando são 3h da manhã e você está olhando para um stack trace incompreensível, ter um assistente que entende o contexto do seu codebase ajuda.

  3. Documentação e conhecimento: RAG sobre runbooks, post-mortems, documentação de arquitetura. A maioria das equipes tem conhecimento tribal que nunca foi documentado adequadamente. Ferramentas como PrivateGPT ou AnythingLLM permitem criar bases pesquisáveis sem expor dados sensíveis.

A execução local é o diferencial crítico. Em ambientes enterprise, enviar código para APIs externas frequentemente não é opção. A combinação de Ollama (ou LocalAI) com qualquer dos agentes listados permite operação 100% on-premise, air-gapped se necessário.

Minha recomendação para quem está começando:

  • Para terminal: comece com Aider. É maduro, bem documentado, e o fluxo é intuitivo.

  • Para IDE: Cline é o mais estabelecido. Roo Code se você quer experimentar multi-agent.

  • Para automação visual: n8n se você já trabalha com workflows; Flowise se o foco é RAG.

  • Para rodar modelos locais: Ollama. Simples, funciona, comunidade grande.

O MCP (Model Context Protocol) está se tornando o padrão de fato para extensibilidade. Se você for investir tempo aprendendo uma tecnologia, MCP é onde eu colocaria fichas. A maioria das ferramentas novas já suporta, e a tendência é consolidação em torno desse protocolo.

Por fim: essas ferramentas são tão boas quanto o modelo que você usa e o contexto que você fornece. Um agente com um modelo fraco ou sem acesso ao contexto relevante vai gerar lixo. A engenharia de prompts e a curadoria do que o agente pode acessar continuam sendo responsabilidade sua.

O futuro é agentic. A questão não é se você vai usar essas ferramentas, mas quando — e se vai ser com controle sobre seus dados ou entregue para um SaaS.

Tech

Part 4 of 50

Technical topics. Code, Linux, Network... Exercising the Tech Writer and teacher in me. Articles covering topics from across the entire OSI layer. Artigos passando por assuntos de toda a camada OSI.

Up next

Melhor maneira de acessar a Wikipedia

Usando o Brave, scriptlets, filter e wikiwand para melhor navegação