Problemas que Resolvemos

Cinco dores reais do desenvolvimento assistido por IA — e como o Arc OS elimina cada uma delas.

Dor 1: "A IA esquece tudo entre as sessões"

O Problema

Você passa 30 minutos ensinando ao Claude as convenções do seu projeto. Na próxima sessão — lousa em branco. Você corrige um erro. No dia seguinte — mesmo erro. Cada sessão começa do zero.

Como os Outros Lidam com Isso

ChatGPT: Custom Instructions (200 palavras, um conjunto para tudo)
Cursor: Arquivo .cursorrules (manual, sem loop de feedback)
Manual: Copiar e colar suas "regras" em cada conversa

Como o Arc OS Resolve

Reflect Loop — memória persistente automática a partir de correções.

Você pressiona "Fix It" ou "thumbs-down"
    → O sistema escreve a regra em learnings.md
    → A regra sobrevive a reinicializações
    → Injetada em CADA prompt futuro automaticamente

Exemplo de learnings.md após 2 semanas:

- [2026-03-20] [fixit] Always use t-call for translations in Odoo QWeb
- [2026-03-21] [negative] Avoid sudo in deployment scripts
- [2026-03-25] [fixit] Use server components by default in Next.js 15
- [2026-04-01] [negative] Don't suggest rm -rf without confirmation

Resultado: O sistema constrói uma "memória imune". Uma correção = regra permanente. O mesmo erro nunca acontece duas vezes.

Dor 2: "A IA não entende o stack tecnológico do meu projeto"

O Problema

Seu projeto Odoo usa Bootstrap, framework Owl, templates QWeb e Python. Seu SaaS usa Tailwind, React, Next.js e TypeScript. Um bot de IA genérico confunde os dois. Conselhos para Odoo vazam no contexto do React. Padrões do React aparecem no código Odoo.

Como os Outros Lidam com Isso

ChatGPT: Uma conversa por projeto (sem isolamento)
Cursor: Ciente do workspace, mas janela de contexto única
Manual: Lembrar constantemente à IA em qual projeto você está

Como o Arc OS Resolve

Arquitetura Federada — um child bot por projeto, isolamento completo.

Master Bot
    ├── Child: odoo-site     (CLAUDE.md: Odoo 17, Bootstrap, QWeb)
    │   ├── skills/library/odoo-expert.md
    │   ├── skills/library/odoo-owl-expert.md
    │   └── learnings.md: "Use t-call for i18n"
    │
    └── Child: saas-app      (CLAUDE.md: Next.js 15, React, Tailwind)
        ├── skills/library/react-patterns.md
        ├── skills/library/tailwind-expert.md
        └── learnings.md: "Prefer server components"

Bots Telegram diferentes. Diretórios de trabalho diferentes. Skills diferentes. Memória diferente. Eles nunca veem o contexto um do outro.

Resultado: Guia completo em Multi-Project Skill Isolation.

Dor 3: "A IA gera código inseguro e ninguém percebe"

O Problema

A IA sugere git push --force. Exibe uma senha em um trecho de código. Recomenda rm -rf /. Você nem sempre percebe. A resposta vai para produção.

Como os Outros Lidam com Isso

ChatGPT / Copilot: Sem validação de saída alguma
Cursor: Apenas verificação de sintaxe
Manual: Revisão humana de cada resposta (não escala)

Como o Arc OS Resolve

Motor de Binary Evals — regras declarativas que verificam cada resposta antes da entrega.

{
  "rules": [
    { "name": "No force push", "type": "string_not_contains", "value": "--force" },
    { "name": "No credentials", "type": "regex_not_match", "pattern": "(password|token)\\s*[:=]\\s*\\w{8,}" },
    { "name": "Response under 5000 chars", "type": "max_length", "value": 5000 }
  ]
}

As falhas aparecem como notas de rodapé na resposta:

[Resposta do Claude aqui]
---
Eval: ⚠️ No force push | ⚠️ No credentials in output

As regras são por skill, por projeto. Seu projeto Odoo verifica conformidade com QWeb. Seu projeto React verifica manipulação direta do DOM.

Resultado: Portão de qualidade automatizado em cada saída de IA. Sem necessidade de revisão humana para segurança básica.

Dor 4: "Não tenho ideia se a IA está tendo um bom desempenho"

O Problema

Você usa IA há 3 meses. Ela é realmente boa? Quais skills funcionam? Quais falham? Está melhorando ou piorando? Sem dados. Sem métricas. Só intuição.

Como os Outros Lidam com Isso

ChatGPT: Histórico de conversas (não estruturado, sem métricas)
Copilot: Taxa de aceitação (um número, sem detalhes)
Manual: Sensação intuitiva

Como o Arc OS Resolve

Quality Tracker + Karpathy Loop — métricas por skill com propostas automáticas de melhoria.

Cada resposta é registrada:

{
  "type": "execution",
  "skills": ["code-review"],
  "success": true,
  "duration_ms": 12340,
  "response_length": 2847
}

Cada botão de feedback (thumbs-up/thumbs-down) é rastreado por resposta:

Comando /quality mostra:
  code-review: 45x, 91% ok, thumbs-up 12/thumbs-down 2, média 8.3s
  git-manager: 23x, 78% ok, thumbs-up 5/thumbs-down 4, média 3.1s

Às 3h da manhã o Karpathy Loop é executado:

Encontra skills com <80% de sucesso ou mais feedback negativo que positivo
Envia ao CEO um cartão de proposta no Telegram
Um toque: Aprovar (backup + melhoria) ou Rejeitar (descartar)

Resultado: Gerenciamento de IA baseado em dados. Você sabe exatamente o que funciona e o que não funciona.

Dor 5: "25 skills carregadas de uma vez = IA confusa"

O Problema

Você tem 25 skills cobrindo git, deploy, code review, Figma, Odoo, testes e segurança. Carregar todas em cada prompt desperdiça a janela de contexto e confunde o modelo. Ele tenta aplicar conselhos de deploy a uma pergunta de code review.

Como os Outros Lidam com Isso

ChatGPT: Sem sistema de skills
Cursor: Todas as regras sempre carregadas
Manual: Comentar regras irrelevantes por tarefa

Como o Arc OS Resolve

Context Router — seleção inteligente de skills por mensagem.

Usuário: "Revise este código para vulnerabilidades XSS"

Context Router pontua:
  code-review:          trigger "review" (2) + keyword "XSS" (1) = 3
  code-review-protocol: trigger "code review" (2)                 = 2
  system-audit:         sem correspondência                       = 0
  git-manager:          sem correspondência                       = 0

Injeta no prompt:
  SKILLS_HINT (foque nestas):
  - code-review: Auditoria de segurança e revisão de qualidade de código...
  - code-review-protocol: Code review estruturado com OWASP...

Apenas as 5 skills mais relevantes são sugeridas. O Claude ainda tem acesso a todas as skills, mas foca nas certas. Consultivo, não restritivo — sem risco de quebrar nada.

Resultado: Respostas focadas e relevantes. Sem poluição de contexto de skills irrelevantes.

Resumo

Dor	Solução do Arc OS	Mecanismo
IA esquece correções	Regras de aprendizado persistentes	Reflect Loop (`learnings.md`)
Contexto errado do stack tecnológico	Child bots isolados	Arquitetura Federada
Saída insegura	Validação declarativa	Motor de Binary Evals
Sem dados de desempenho	Métricas por skill + análise noturna	Quality Tracker + Karpathy Loop
Diluição de contexto	Seleção inteligente de skills	Context Router