Será que o Paperclip pode mesmo?

Ser cético não significa negar o mérito técnico. O Paperclip acerta em alguns pontos importantes.

Pablo Murad

31 Mar 2026 — 7 min read

Tese

O Paperclip vende uma ideia forte: ser o “control plane for autonomous AI companies”, isto é, a camada de comando e governança para empresas compostas por agentes de IA. A proposta é sedutora porque resolve um problema real: quando você sai de um único bot e passa a operar vários agentes, a bagunça escala mais rápido do que a produtividade. O Paperclip tenta atacar justamente isso com organograma, orçamento, auditoria, heartbeats, tarefas, aprovações e isolamento por empresa.

Só que existe um salto lógico enorme entre “orquestrar vários agentes” e “dirigir uma companhia”.

Minha conclusão é direta: o Paperclip pode coordenar uma operação AI-native com escopo limitado; ele não substitui a direção real de uma companhia. No máximo, ele vira o sistema nervoso de uma firma altamente automatizada. O cérebro executivo, a responsabilidade jurídica, a arbitragem moral, a leitura de contexto social e a capacidade de assumir risco ainda continuam fora do software.

1. O que o projeto de fato é

Se você cortar o marketing e olhar a documentação, o próprio projeto se define de forma mais precisa do que boa parte dos textos de divulgação: o Paperclip é um control plane, não um agente, não um chat e não um framework de prompts. Ele organiza agentes como se fossem funcionários: há empresa, metas, organograma, orçamento, hierarquia de tarefas, aprovações do “board” e rastreabilidade de atividade.

Esse ponto importa porque já derruba uma ilusão comum. O Paperclip não executa a inteligência da empresa. Ele orquestra agentes externos por meio de adapters. Em outras palavras: ele não é o “CEO artificial” em si; ele é a estrutura operacional onde vários agentes são pendurados.

A arquitetura oficial deixa isso claro. O stack é um monorepo com React/Vite na UI, Express/Node.js na API, PostgreSQL/Drizzle no armazenamento e uma camada de adapters para runtimes como Claude, Codex, Gemini, Cursor, OpenClaw, processos shell e webhooks HTTP. Quando um heartbeat dispara, o servidor chama o adapter, o adapter invoca o agente, o agente trabalha e depois reporta de volta custos, estado e resultados.

Traduzindo para linguagem de negócio: o Paperclip é infraestrutura de coordenação, não competência operacional. Isso já limita bastante a ambição do slogan.

2. Onde o projeto é realmente forte

Ser cético não significa negar o mérito técnico. O Paperclip acerta em alguns pontos importantes.

2.1. Ele resolve o caos dos “20 agentes abertos ao mesmo tempo”

Essa é provavelmente a força mais concreta do projeto. O repositório e o site repetem a mesma tese: sem uma camada organizacional, você acaba com vários terminais, várias conversas, contexto disperso, custo invisível e quase nenhuma governança. Essa crítica está correta. Hoje, muita automação com agentes é basicamente gambiarra cara com memória curta.

O Paperclip tenta organizar isso com:

tarefas ligadas a uma meta superior;
organograma e cadeia de comando;
sessões persistentes entre heartbeats;
trilha de auditoria;
orçamentos por agente e por companhia;
controles de pausa, retomada, reassociação e terminação de agentes.

Isso é útil de verdade. Não é cosmético.

2.2. O mecanismo de governança é melhor do que o hype “AI fully autonomous”

Outro mérito: o projeto não empurra autonomia total como default seguro. Pelo contrário, a documentação insiste que o operador humano fica no topo como board. Algumas ações exigem aprovação humana, como contratação de agentes subordinados e aprovação da estratégia inicial do CEO. O site resume bem a filosofia: a autonomia é uma permissão concedida, não um direito natural do agente.

Essa é uma escolha inteligente. Sistemas multiagente sem mecanismo explícito de veto, rollback e trilha de decisão tendem a degenerar em custo sem accountability. O Paperclip pelo menos tenta colocar freios.

2.3. O controle de custo é simples, mas prático

O sistema de orçamento também é um ponto forte. A documentação diz que a plataforma aplica limites automaticamente, com alerta suave em 80% e parada automática em 100% do orçamento. Para qualquer stack agentic séria, isso não é luxo; é sobrevivência.

Muita demo de “empresa autônoma” ignora o fato de que modelos não só erram — eles erram consumindo orçamento. O Paperclip, ao menos, reconhece isso no núcleo do produto.

2.4. Sinais de tração e evolução existem

O projeto não parece abandonado. No GitHub, em 31 de março de 2026, o repositório exibia mais de 41 mil estrelas, mais de 1.700 commits, centenas de issues e pull requests abertas, além de release recente em 25 de março de 2026. A release mais nova mostra avanço em portabilidade de empresas, biblioteca de skills por companhia, rotinas recorrentes e melhorias de CLI, heartbeats e import/export.

Isso importa porque separa Paperclip de vaporware. É um projeto real, ativo e em evolução.

Mas não confunda tração open source com prova de viabilidade empresarial. São coisas diferentes.

3. O salto indevido: por que isso ainda não equivale a “dirigir uma companhia”

Aqui é onde o marketing do projeto exagera.

3.1. Orquestração não é liderança

Uma companhia não é apenas uma fila de tickets com orçamento. Empresa é:

alocação de capital sob incerteza;
priorização política e comercial;
negociação com humanos conflitantes;
responsabilidade legal;
interpretação de contexto ambíguo;
defesa reputacional;
resolução de exceções raras e caras.

O Paperclip cobre coordenação. Não cobre julgamento empresarial pleno.

Você pode até criar um “CEO agent”, mas a própria documentação admite que a estratégia inicial do CEO precisa de aprovação do board humano. Isso já revela a verdade operacional: o “CEO” do sistema não é CEO; é um executor subordinado com autonomia restrita.

3.2. O projeto depende totalmente da qualidade dos agentes externos

O próprio material oficial diz que o control plane não roda os agentes; apenas os orquestra. Isso é uma limitação estrutural gigantesca.

Se o agente conectado for mediano, o resultado será mediano.
Se o agente for vulnerável a prompt injection, o sistema inteiro herda o risco.
Se o agente alucinar, o Paperclip não “corrige inteligência”; ele só registra, repassa e tenta cercar com governança.

Em resumo: o Paperclip melhora a administração do problema, não elimina o problema.

3.3. Heartbeats são bons para rotina; ruins para muita operação real

A documentação explica que agentes não ficam rodando continuamente por padrão. Eles acordam em heartbeats — janelas curtas disparadas por agenda, menção, atribuição, aprovação ou ação manual.

Isso é excelente para jobs recorrentes, backlog, conteúdo, coding tasks e processos discretos. Mas é uma abstração limitada para operações que exigem:

tempo real;
latência previsível;
resposta contínua a eventos externos;
coordenação síncrona entre múltiplos agentes e humanos;
tratamento de incidentes urgentes.

Muitas empresas vivem no regime de exceção, não no regime de heartbeat. E aí o modelo já começa a ranger.

3.4. A própria roadmap denuncia maturidade incompleta

O repositório mostra itens importantes ainda no roadmap, incluindo:

Artifacts & Deployments
CEO Chat
Multiple Human Users
Cloud / Sandbox agents
Cloud deployments
Desktop App

Isso tem implicações claras.

Se “Multiple Human Users” ainda está no roadmap, então a colaboração humana multioperador ainda não está madura no núcleo do sistema. Isso sozinho já enfraquece a tese de “dirigir uma companhia”, porque companhia real não é só agente falando com agente e um operador solitário no topo. Há times, áreas, donos de processo, revisores, compliance, financeiro, jurídico, vendas, parceiros e clientes.

Se deployments em nuvem e artifacts ainda estão em aberto, então há partes essenciais da operação de software e de governança de entrega que ainda não estão fechadas no produto.

Ou seja: o Paperclip já é uma ferramenta séria; ainda não é um sistema executivo completo.

3.5. Segurança e produção continuam muito na conta do operador

A documentação de deploy é honesta: o modo padrão local_trusted roda sem login e é voltado para operador único em máquina local. Há modos autenticados para rede privada ou exposição pública, e o modo público exige mais checagens. A API também informa que não há rate limiting em deploys locais e que, em produção, esse tipo de proteção pode precisar ser adicionado pela infraestrutura.

Isso reforça um ponto importante: o projeto é self-hosted e poderoso, mas não “resolve produção” magicamente. Ele te dá um framework. Hardening, observabilidade externa, política de acesso, isolamento operacional, backups, monitoramento e contenção de risco continuam sendo trabalho do operador.

Para experimento e operação enxuta, tudo bem.
Para “dirigir uma companhia” com clientes, dinheiro, dados sensíveis e SLAs, isso é uma lacuna séria.

3.6. Empresa real exige accountability fora do software

Mesmo que tecnicamente tudo funcione, ainda sobra o problema maior: quem responde quando dá errado?

Um agente aprovou uma campanha mentirosa.
Um agente aceitou termos contratuais ruins.
Um agente feriu compliance.
Um agente insultou um cliente.
Um agente enviou algo juridicamente exposto.
Um agente enterrou a prioridade estratégica certa porque otimizou a métrica errada.

Paperclip consegue registrar o evento.
Talvez até consiga impedir parte dele via approval gates.
Mas a responsabilidade continua humana e institucional, não computacional.

Quem “dirige” uma companhia não é só quem move tarefas. É quem absorve as consequências. E software não absorve consequência; software externaliza consequência.

4. Onde ele pode funcionar bem

Aqui está o recorte honesto.

O Paperclip pode ser muito bom para empresas ou microempresas em que:

o output é digital e revisável;
o custo de erro é moderado;
há processos repetíveis e relativamente bem definidos;
um humano ainda faz supervisão nas decisões críticas.

Exemplos plausíveis:

agência de conteúdo e SEO;
operação de desenvolvimento com tarefas bem delimitadas;
pesquisa e triagem interna;
suporte interno não crítico;
automação de backoffice;
geração de documentação, relatórios e rotinas.

Nesses cenários, o Paperclip não precisa “ser CEO”. Basta ser um middleware de gestão de agentes. E isso já pode gerar muito valor.

5. Onde a tese de “empresa autônoma” provavelmente quebra

Agora o lado duro, sem romantização.

5.1. Setores regulados

Finanças, saúde, seguros, jurídico, defesa, infraestrutura crítica. Aqui, erro não é só custo de token; é risco regulatório, reputacional e às vezes criminal.

5.2. Operações com forte componente humano

Vendas enterprise, negociação complexa, gestão de parceiros, PR, RH, conflitos internos, retenção de clientes sensíveis. O problema aqui não é falta de task tracking; é leitura social, timing político e responsabilidade.

5.3. Operações físicas

Supply chain, logística, manufatura, varejo físico, campo, manutenção. O mundo físico destrói abstrações bonitas.

5.4. Estratégia sob extrema ambiguidade

A maior parte do valor de um dirigente não está em aprovar tarefas; está em fazer apostas sob informação imperfeita, com incentivos conflitantes, tempo escasso e consequências de segunda ordem. O Paperclip ajuda a operacionalizar execução. Não há evidência de que ele substitua discernimento estratégico de alto nível.

6. Então o Paperclip “dirige” uma companhia?

Não, no sentido forte da frase.

Ele:

organiza uma companhia composta por agentes;
coordena trabalho;
impõe orçamento e algumas regras de governança;
dá visibilidade e trilha de auditoria;
facilita operação AI-native em escala maior do que um monte de bots soltos.

Mas ele não:

assume responsabilidade jurídica;
substitui julgamento executivo;
resolve segurança e produção por conta própria;
elimina a dependência da qualidade dos agentes externos;
transforma automação em competência empresarial automaticamente.

A melhor forma de descrever o Paperclip é esta:

Não é uma companhia autônoma. É uma camada operacional para administrar agentes que executam partes de uma companhia.

Essa diferença parece semântica, mas não é. Ela separa ferramenta útil de fantasia cara.

7. Veredito final

O projeto é interessante, tecnicamente legítimo e muito mais sério do que a maioria das demos agentic. O time parece estar construindo um produto real, com governança, custos, arquitetura clara e evolução rápida. Como plataforma de orquestração para equipes de agentes, faz sentido.

Agora, a pergunta certa não é “ele consegue dirigir uma companhia?”.
A pergunta certa é:

“Quais partes de uma companhia podem ser transformadas em trabalho suficientemente estruturado para um sistema como esse coordenar sem explodir risco, custo e responsabilidade?”

Se você fizer essa pergunta, o Paperclip fica muito mais convincente.
Se insistir na frase “empresa que roda sozinha”, você já caiu no marketing.