OpenClaw gastou US$ 1,3 milhão em tokens: entenda o meta dos agentes de IA
O OpenClaw acaba de virar o “boss secreto” da economia de tokens. Um painel de uso atribuído ao desenvolvedor Peter Steinberger mostra um gasto de cerca de US$ 1,3 milhão em apenas 30 dias, com 603 bilhões de tokens consumidos em 7,6 milhões de requisições. A build por trás desse número não é um chatbot casual de uma aba só: seriam cerca de 100 instâncias do Codex operando para um time pequeno, com o GPT-5.5 aparecendo como principal modelo no painel. Como Steinberger entrou para a OpenAI em fevereiro, a conta, segundo ele, fica na aba da empresa.
Traduzindo para o dialeto gamer: isso não é “mandei um prompt e recebi uma resposta”. É raid de automação. Agentes desse tipo rodam loops de planejamento, leitura de contexto, chamada de ferramentas, revisão de código, abertura de PRs, checagem de regressão e correção de bugs. Cada ciclo desses come token como se fosse mana em build mal otimizada. A média bruta dá algo em torno de 79 mil tokens por requisição; considerando o gasto divulgado, isso fica perto de US$ 0,17 por requisição e cerca de US$ 2,16 por milhão de tokens, uma conta que ajuda a visualizar o tamanho do grind, ainda que o próprio caso envolva o tal Fast Mode e não represente um uso normal de API.
O detalhe mais importante não é só o número absurdo. É o que ele revela sobre o novo meta da IA: agentes autônomos não gastam como chatbots, gastam como servidores de MMO. Um usuário humano escreve, espera, lê e decide. Um agente, por outro lado, pode abrir várias frentes, testar hipóteses, consultar arquivos, chamar ferramentas, resumir histórico, gerar patch, revisar o próprio patch e repetir tudo. Nesse loop, o token deixa de ser “texto” e vira stamina, munição e energia do personagem ao mesmo tempo.
A documentação do OpenClaw ajuda a entender por que a barra de recursos desce tão rápido. Tudo que chega ao modelo conta: prompt de sistema, histórico de conversa, chamadas de ferramentas, resultados, anexos, transcrições, resumos de compactação e até camadas de provedor que o usuário nem sempre enxerga. O projeto também oferece comandos para acompanhar uso e custo estimado, como status de sessão e relatórios de uso, justamente porque, nesse tipo de operação, voar sem HUD é pedir para tomar wipe no primeiro chefe.
O Fast Mode é outro multiplicador do dano. A OpenAI informa que o Codex passou para uma lógica mais alinhada a tokens, com créditos por milhão de tokens de entrada, cache e saída; também avisa que o Fast Mode consome créditos em ritmo maior. No caso do OpenClaw, Steinberger atribuiu boa parte do susto a esse modo acelerado e indicou que a execução tradicional reduziria bastante a conta. Em outras palavras: é o equivalente a ativar modo desempenho no ultra, com prioridade de latência, e depois se surpreender com a GPU berrando.
Mas chamar isso apenas de desperdício seria uma leitura rasa. O gasto funciona como benchmark social: mostra o que acontece quando um laboratório remove quase todos os freios de custo e deixa agentes trabalhando como uma equipe paralela. O resultado é uma prévia do que estúdios, startups e times de engenharia podem querer fazer no futuro — só que com orçamento, governança e telemetria melhores. O próprio OpenAI descreve Codex e Sora como produtos que exigiram uma infraestrutura híbrida de limites, créditos e medição em tempo real, porque usuários engajados não querem bater em parede invisível no meio do trabalho.
Para devs e equipes menores, a lição prática é clara: não copie a build do endgame se você ainda está no tutorial. Antes de colocar múltiplos agentes para farmar tarefas, vale montar um kit básico de sobrevivência: limitar tokens de saída, encurtar prompts, evitar histórico inflado, usar cache quando fizer sentido, separar tarefas simples para modelos mais baratos, desligar modo rápido por padrão e criar orçamento por agente. A própria OpenAI recomenda reduzir limites de saída e otimizar prompts como formas de diminuir erro de limite e custo.
O ponto mais interessante é que o OpenClaw nasceu como uma promessa de “IA que faz coisas”, não apenas conversa. Ele foi apresentado como um projeto open source para construir assistentes capazes de mexer em calendários, reservas, tarefas e fluxos com menos intervenção humana. Depois, Steinberger passou a trabalhar na OpenAI, enquanto o projeto seguiria em uma fundação aberta. Esse contexto muda o peso da conta: o milhão em tokens não é só uma extravagância, mas um teste extremo de como agentes pessoais podem funcionar quando têm liberdade para agir.
No fim, a conta milionária do OpenClaw é menos um meme de “IA go brrr” e mais um alerta de balanceamento. Se agentes forem o próximo grande gênero da computação, custo, latência, segurança e observabilidade serão os atributos principais da ficha. Quem dominar esse meta vai criar automações úteis; quem ignorar a economia de tokens vai descobrir, do pior jeito, que até inteligência artificial precisa de gerenciamento de recursos.
Sou o Leo, geralmente jogo com o nick blade95. Sou apaixonado por jogos de FPS e amo montar PC Gamer! Aqui no Steamaníacos cuido de tudo sobre Hardware, review, preview, testes e novidades para o nosso mundo gamer!