Problemas que Resolvemos
Cinco dores reais do desenvolvimento assistido por IA — e como o Arc OS elimina cada uma delas.
Dor 1: "A IA esquece tudo entre as sessões"
O Problema
Você passa 30 minutos ensinando ao Claude as convenções do seu projeto. Na próxima sessão — lousa em branco. Você corrige um erro. No dia seguinte — mesmo erro. Cada sessão começa do zero.
Como os Outros Lidam com Isso
- ChatGPT: Custom Instructions (200 palavras, um conjunto para tudo)
- Cursor: Arquivo
.cursorrules(manual, sem loop de feedback) - Manual: Copiar e colar suas "regras" em cada conversa
Como o Arc OS Resolve
Reflect Loop — memória persistente automática a partir de correções.
Você pressiona "Fix It" ou "thumbs-down"
→ O sistema escreve a regra em learnings.md
→ A regra sobrevive a reinicializações
→ Injetada em CADA prompt futuro automaticamente
Exemplo de learnings.md após 2 semanas:
- [2026-03-20] [fixit] Always use t-call for translations in Odoo QWeb
- [2026-03-21] [negative] Avoid sudo in deployment scripts
- [2026-03-25] [fixit] Use server components by default in Next.js 15
- [2026-04-01] [negative] Don't suggest rm -rf without confirmation
Resultado: O sistema constrói uma "memória imune". Uma correção = regra permanente. O mesmo erro nunca acontece duas vezes.
Dor 2: "A IA não entende o stack tecnológico do meu projeto"
O Problema
Seu projeto Odoo usa Bootstrap, framework Owl, templates QWeb e Python. Seu SaaS usa Tailwind, React, Next.js e TypeScript. Um bot de IA genérico confunde os dois. Conselhos para Odoo vazam no contexto do React. Padrões do React aparecem no código Odoo.
Como os Outros Lidam com Isso
- ChatGPT: Uma conversa por projeto (sem isolamento)
- Cursor: Ciente do workspace, mas janela de contexto única
- Manual: Lembrar constantemente à IA em qual projeto você está
Como o Arc OS Resolve
Arquitetura Federada — um child bot por projeto, isolamento completo.
Master Bot
├── Child: odoo-site (CLAUDE.md: Odoo 17, Bootstrap, QWeb)
│ ├── skills/library/odoo-expert.md
│ ├── skills/library/odoo-owl-expert.md
│ └── learnings.md: "Use t-call for i18n"
│
└── Child: saas-app (CLAUDE.md: Next.js 15, React, Tailwind)
├── skills/library/react-patterns.md
├── skills/library/tailwind-expert.md
└── learnings.md: "Prefer server components"
Bots Telegram diferentes. Diretórios de trabalho diferentes. Skills diferentes. Memória diferente. Eles nunca veem o contexto um do outro.
Resultado: Guia completo em Multi-Project Skill Isolation.
Dor 3: "A IA gera código inseguro e ninguém percebe"
O Problema
A IA sugere git push --force. Exibe uma senha em um trecho de código. Recomenda rm -rf /. Você nem sempre percebe. A resposta vai para produção.
Como os Outros Lidam com Isso
- ChatGPT / Copilot: Sem validação de saída alguma
- Cursor: Apenas verificação de sintaxe
- Manual: Revisão humana de cada resposta (não escala)
Como o Arc OS Resolve
Motor de Binary Evals — regras declarativas que verificam cada resposta antes da entrega.
{
"rules": [
{ "name": "No force push", "type": "string_not_contains", "value": "--force" },
{ "name": "No credentials", "type": "regex_not_match", "pattern": "(password|token)\\s*[:=]\\s*\\w{8,}" },
{ "name": "Response under 5000 chars", "type": "max_length", "value": 5000 }
]
}
As falhas aparecem como notas de rodapé na resposta:
[Resposta do Claude aqui]
---
Eval: ⚠️ No force push | ⚠️ No credentials in output
As regras são por skill, por projeto. Seu projeto Odoo verifica conformidade com QWeb. Seu projeto React verifica manipulação direta do DOM.
Resultado: Portão de qualidade automatizado em cada saída de IA. Sem necessidade de revisão humana para segurança básica.
Dor 4: "Não tenho ideia se a IA está tendo um bom desempenho"
O Problema
Você usa IA há 3 meses. Ela é realmente boa? Quais skills funcionam? Quais falham? Está melhorando ou piorando? Sem dados. Sem métricas. Só intuição.
Como os Outros Lidam com Isso
- ChatGPT: Histórico de conversas (não estruturado, sem métricas)
- Copilot: Taxa de aceitação (um número, sem detalhes)
- Manual: Sensação intuitiva
Como o Arc OS Resolve
Quality Tracker + Karpathy Loop — métricas por skill com propostas automáticas de melhoria.
Cada resposta é registrada:
{
"type": "execution",
"skills": ["code-review"],
"success": true,
"duration_ms": 12340,
"response_length": 2847
}
Cada botão de feedback (thumbs-up/thumbs-down) é rastreado por resposta:
Comando /quality mostra:
code-review: 45x, 91% ok, thumbs-up 12/thumbs-down 2, média 8.3s
git-manager: 23x, 78% ok, thumbs-up 5/thumbs-down 4, média 3.1s
Às 3h da manhã o Karpathy Loop é executado:
- Encontra skills com <80% de sucesso ou mais feedback negativo que positivo
- Envia ao CEO um cartão de proposta no Telegram
- Um toque: Aprovar (backup + melhoria) ou Rejeitar (descartar)
Resultado: Gerenciamento de IA baseado em dados. Você sabe exatamente o que funciona e o que não funciona.
Dor 5: "25 skills carregadas de uma vez = IA confusa"
O Problema
Você tem 25 skills cobrindo git, deploy, code review, Figma, Odoo, testes e segurança. Carregar todas em cada prompt desperdiça a janela de contexto e confunde o modelo. Ele tenta aplicar conselhos de deploy a uma pergunta de code review.
Como os Outros Lidam com Isso
- ChatGPT: Sem sistema de skills
- Cursor: Todas as regras sempre carregadas
- Manual: Comentar regras irrelevantes por tarefa
Como o Arc OS Resolve
Context Router — seleção inteligente de skills por mensagem.
Usuário: "Revise este código para vulnerabilidades XSS"
Context Router pontua:
code-review: trigger "review" (2) + keyword "XSS" (1) = 3
code-review-protocol: trigger "code review" (2) = 2
system-audit: sem correspondência = 0
git-manager: sem correspondência = 0
Injeta no prompt:
SKILLS_HINT (foque nestas):
- code-review: Auditoria de segurança e revisão de qualidade de código...
- code-review-protocol: Code review estruturado com OWASP...
Apenas as 5 skills mais relevantes são sugeridas. O Claude ainda tem acesso a todas as skills, mas foca nas certas. Consultivo, não restritivo — sem risco de quebrar nada.
Resultado: Respostas focadas e relevantes. Sem poluição de contexto de skills irrelevantes.
Resumo
| Dor | Solução do Arc OS | Mecanismo |
|---|---|---|
| IA esquece correções | Regras de aprendizado persistentes | Reflect Loop (learnings.md) |
| Contexto errado do stack tecnológico | Child bots isolados | Arquitetura Federada |
| Saída insegura | Validação declarativa | Motor de Binary Evals |
| Sem dados de desempenho | Métricas por skill + análise noturna | Quality Tracker + Karpathy Loop |
| Diluição de contexto | Seleção inteligente de skills | Context Router |