Não é um chatbot que responde. É uma entidade que tem o seu próprio email, o seu WhatsApp, o seu telefone que liga e atende de verdade, a sua memória, e que ganha mais e mais capacidade ao longo do tempo. Como contratar gente, só que você aluga vários num clique.
A identidade é uma linha no banco e uma alma em markdown. Os recursos (email, WhatsApp, telefone, Composio) são um cinturão anexado: mintam sob demanda, revogam sem tocar a identidade. Pessoa por fora, dado stateless por dentro.
quem ele é, como fala, o tipo dele (persona pack)
entityId dele, age nas contas dele (Gmail, Drive, Slack)
steve-nome@steve-aios.com, inbox real via AgentMail
número dele (pool ou dedicado), conversa de verdade
número que liga e atende, voz dele, em tempo real
lembra de tudo, alma em markdown, nunca perde
gate: ação pra fora pede aprovação (lição do incidente)
instala skill nova e ele cresce, sem fim
Apertou criar, um fluxo durável (Inngest) minta os recursos sozinho: o Composio dele, a caixa de email dele, o slot de WhatsApp, o número de telefone. O que precisa do seu OK (conectar suas contas) vira um link no painel e espera. Idempotente, milhares de vezes.
Os instantâneos mintam sozinhos. Os que pedem consentimento (suas contas Google) viram link e o fluxo espera o clique, com timeout. Stateless: dá pra recriar o Steve inteiro das duas linhas + a alma.
O número toca, o áudio vira texto, o nosso motor (o Steve/Claude) é o cérebro da ligação, a resposta vira voz e volta na chamada, em tempo real. A telefonia é plumbing alugado; o cérebro é o nosso ativo, intocado. Mesmo padrão do L1 com OpenRouter.
pronto, rápido, o Steve já liga. O cérebro é o nosso Claude via um shim compatível. Inbound (atende) + outbound (ele liga pra alguém, pede info, manda followup).
quando o volume justificar, pipeline próprio mais barato por minuto. Mesma arquitetura, troca o fornecedor. Build só com tenant que paga.
Você não aluga um Steve, aluga uma equipe. O chefe recebe o pedido, decompõe, delega pros especialistas, junta e devolve. Tudo passa por um barramento durável que já existe no engine (`agent_messages`), que é ao mesmo tempo o canal, o log de auditoria e o ponto onde o gate de aprovação mora.
5 Steves, 1 esquadrão. Cada um com seus recursos próprios, todos coordenados pelo chefe. Supervisor manda no worker, sem fofoca cruzada (swarm é banido, é caos).
Capacidade nova é um módulo que pluga, não código novo no kernel. Você dá mais e mais skills, e o Steve vira mais gente. E o que ele aprendeu (a alma, a memória, as páginas que ele criou) nunca é sobrescrito num update. Engine atualiza, alma fica.
enxuto, cravado. Recebe, decide, executa, lembra.
skills, integrações, persona packs. Plugam, compõem, transferem entre Steves.
memória, persona editada, páginas custom. Update nunca toca. Regra inviolável.
O custo de dar a um Steve todos os órgãos é baixo. O preço que ele justifica é o de uma pessoa. Essa é a margem do produto de ouro.
| recurso por Steve | como | custo estimado |
|---|---|---|
| Composio (mãos) | 1 entityId por Steve, OAuth nas contas | baixo / por uso |
| Email (caixa real) | AgentMail, inbox steve-nome@steve-aios.com | centavos |
| WhatsApp · pool | 1 número, N Steves isolados (default) | centavos |
| WhatsApp · dedicado | número próprio via Embedded Signup (upsell) | ~$1-4/mês |
| Telefone + voz | número + ligação em tempo real | ~$1/mês + ~$0.07-0.12/min |
| Cérebro (motor) | Claude, pooling hot/cold, compartilhado | por uso |
A conta fecha: um Steve completo custa poucos dólares de recurso por mês mais o uso. E entrega o que um assistente humano entregaria. O cliente aluga vários, paga por mês, e a gente opera um sistema só.
Pooling hot/cold/off: Steve dorme frio, acorda quente sob demanda. Não mantém milhares de processos vivos. Mesmo motor em 3 trilhas: managed central (a massa), VPS dedicada (premium), sandbox (o Dev que roda código).
Os seus 8 Steves (Master, Infra, Sales, Finance, Inbox, Life, Marketing, Customer Success) migram pra cá como o primeiro tenant. Dogfood total: a gente vende o que usa todo dia. Migração é re-amarrar identidade, não reescrever (o stateless permite).
Nada de greenfield. Cada peça cara entra só quando tem cliente que justifica. Incremental, com prova material em cada fase (o Steve liga de verdade, manda email de verdade).
Cada Steve liga, manda email, responde, fecha, e cresce com o cliente. Vale o preço de um funcionário, e a gente entrega cinco num clique, operando um sistema só. Isso não tem teto.
um esquadrão completo alugado por mês.
cada Steve completo vale um salário, a margem é o recurso barato.
o hipersistema: você melhora o motor, todo Steve do mundo sobe junto.
Engenharia completa em docs/tasks/steve-platform/engenharia/ (12 domínios) · próximo passo: criar o steve-os, migrar o motor com histórico, e montar o 1º Steve completo (liga de verdade) como prova.