Problemas que Resolvemos

Cinco dores reais do desenvolvimento assistido por IA — e como o Arc OS elimina cada uma delas.


Dor 1: "A IA esquece tudo entre as sessões"

O Problema

Você passa 30 minutos ensinando ao Claude as convenções do seu projeto. Na próxima sessão — lousa em branco. Você corrige um erro. No dia seguinte — mesmo erro. Cada sessão começa do zero.

Como os Outros Lidam com Isso

Como o Arc OS Resolve

Reflect Loop — memória persistente automática a partir de correções.

Você pressiona "Fix It" ou "thumbs-down"
    → O sistema escreve a regra em learnings.md
    → A regra sobrevive a reinicializações
    → Injetada em CADA prompt futuro automaticamente

Exemplo de learnings.md após 2 semanas:

- [2026-03-20] [fixit] Always use t-call for translations in Odoo QWeb
- [2026-03-21] [negative] Avoid sudo in deployment scripts
- [2026-03-25] [fixit] Use server components by default in Next.js 15
- [2026-04-01] [negative] Don't suggest rm -rf without confirmation

Resultado: O sistema constrói uma "memória imune". Uma correção = regra permanente. O mesmo erro nunca acontece duas vezes.


Dor 2: "A IA não entende o stack tecnológico do meu projeto"

O Problema

Seu projeto Odoo usa Bootstrap, framework Owl, templates QWeb e Python. Seu SaaS usa Tailwind, React, Next.js e TypeScript. Um bot de IA genérico confunde os dois. Conselhos para Odoo vazam no contexto do React. Padrões do React aparecem no código Odoo.

Como os Outros Lidam com Isso

Como o Arc OS Resolve

Arquitetura Federada — um child bot por projeto, isolamento completo.

Master Bot
    ├── Child: odoo-site     (CLAUDE.md: Odoo 17, Bootstrap, QWeb)
    │   ├── skills/library/odoo-expert.md
    │   ├── skills/library/odoo-owl-expert.md
    │   └── learnings.md: "Use t-call for i18n"
    │
    └── Child: saas-app      (CLAUDE.md: Next.js 15, React, Tailwind)
        ├── skills/library/react-patterns.md
        ├── skills/library/tailwind-expert.md
        └── learnings.md: "Prefer server components"

Bots Telegram diferentes. Diretórios de trabalho diferentes. Skills diferentes. Memória diferente. Eles nunca veem o contexto um do outro.

Resultado: Guia completo em Multi-Project Skill Isolation.


Dor 3: "A IA gera código inseguro e ninguém percebe"

O Problema

A IA sugere git push --force. Exibe uma senha em um trecho de código. Recomenda rm -rf /. Você nem sempre percebe. A resposta vai para produção.

Como os Outros Lidam com Isso

Como o Arc OS Resolve

Motor de Binary Evals — regras declarativas que verificam cada resposta antes da entrega.

{
  "rules": [
    { "name": "No force push", "type": "string_not_contains", "value": "--force" },
    { "name": "No credentials", "type": "regex_not_match", "pattern": "(password|token)\\s*[:=]\\s*\\w{8,}" },
    { "name": "Response under 5000 chars", "type": "max_length", "value": 5000 }
  ]
}

As falhas aparecem como notas de rodapé na resposta:

[Resposta do Claude aqui]
---
Eval: ⚠️ No force push | ⚠️ No credentials in output

As regras são por skill, por projeto. Seu projeto Odoo verifica conformidade com QWeb. Seu projeto React verifica manipulação direta do DOM.

Resultado: Portão de qualidade automatizado em cada saída de IA. Sem necessidade de revisão humana para segurança básica.


Dor 4: "Não tenho ideia se a IA está tendo um bom desempenho"

O Problema

Você usa IA há 3 meses. Ela é realmente boa? Quais skills funcionam? Quais falham? Está melhorando ou piorando? Sem dados. Sem métricas. Só intuição.

Como os Outros Lidam com Isso

Como o Arc OS Resolve

Quality Tracker + Karpathy Loop — métricas por skill com propostas automáticas de melhoria.

Cada resposta é registrada:

{
  "type": "execution",
  "skills": ["code-review"],
  "success": true,
  "duration_ms": 12340,
  "response_length": 2847
}

Cada botão de feedback (thumbs-up/thumbs-down) é rastreado por resposta:

Comando /quality mostra:
  code-review: 45x, 91% ok, thumbs-up 12/thumbs-down 2, média 8.3s
  git-manager: 23x, 78% ok, thumbs-up 5/thumbs-down 4, média 3.1s

Às 3h da manhã o Karpathy Loop é executado:

  1. Encontra skills com <80% de sucesso ou mais feedback negativo que positivo
  2. Envia ao CEO um cartão de proposta no Telegram
  3. Um toque: Aprovar (backup + melhoria) ou Rejeitar (descartar)

Resultado: Gerenciamento de IA baseado em dados. Você sabe exatamente o que funciona e o que não funciona.


Dor 5: "25 skills carregadas de uma vez = IA confusa"

O Problema

Você tem 25 skills cobrindo git, deploy, code review, Figma, Odoo, testes e segurança. Carregar todas em cada prompt desperdiça a janela de contexto e confunde o modelo. Ele tenta aplicar conselhos de deploy a uma pergunta de code review.

Como os Outros Lidam com Isso

Como o Arc OS Resolve

Context Router — seleção inteligente de skills por mensagem.

Usuário: "Revise este código para vulnerabilidades XSS"

Context Router pontua:
  code-review:          trigger "review" (2) + keyword "XSS" (1) = 3
  code-review-protocol: trigger "code review" (2)                 = 2
  system-audit:         sem correspondência                       = 0
  git-manager:          sem correspondência                       = 0

Injeta no prompt:
  SKILLS_HINT (foque nestas):
  - code-review: Auditoria de segurança e revisão de qualidade de código...
  - code-review-protocol: Code review estruturado com OWASP...

Apenas as 5 skills mais relevantes são sugeridas. O Claude ainda tem acesso a todas as skills, mas foca nas certas. Consultivo, não restritivo — sem risco de quebrar nada.

Resultado: Respostas focadas e relevantes. Sem poluição de contexto de skills irrelevantes.


Resumo

Dor Solução do Arc OS Mecanismo
IA esquece correções Regras de aprendizado persistentes Reflect Loop (learnings.md)
Contexto errado do stack tecnológico Child bots isolados Arquitetura Federada
Saída insegura Validação declarativa Motor de Binary Evals
Sem dados de desempenho Métricas por skill + análise noturna Quality Tracker + Karpathy Loop
Diluição de contexto Seleção inteligente de skills Context Router