Проблемы, которые мы решаем

Пять реальных болей AI-ассистированной разработки — и как Arc OS устраняет каждую из них.


Боль 1: «AI всё забывает между сессиями»

Проблема

Ты тратишь 30 минут, чтобы объяснить Claude конвенции проекта. Следующая сессия — чистый лист. Исправляешь ошибку. Завтра — та же ошибка. Каждая сессия начинается с нуля.

Как другие с этим справляются

Как Arc OS решает это

Reflect Loop — автоматическая персистентная память из коррекций.

Ты нажимаешь «Fix It» или thumbs-down
    → Система записывает правило в learnings.md
    → Правило выживает перезапуски
    → Автоматически инжектируется в КАЖДЫЙ будущий промпт

Пример learnings.md через 2 недели:

- [2026-03-20] [fixit] Always use t-call for translations in Odoo QWeb
- [2026-03-21] [negative] Avoid sudo in deployment scripts
- [2026-03-25] [fixit] Use server components by default in Next.js 15
- [2026-04-01] [negative] Don't suggest rm -rf without confirmation

Результат: система строит «иммунную память». Одна коррекция = постоянное правило. Одна и та же ошибка больше не повторяется.


Боль 2: «AI не понимает технологический стек проекта»

Проблема

Твой Odoo-проект использует Bootstrap, фреймворк Owl, QWeb-шаблоны, Python. Твой SaaS — Tailwind, React, Next.js, TypeScript. Универсальный AI-бот путает их. Советы по Odoo просачиваются в React-контекст. React-паттерны появляются в Odoo-коде.

Как другие с этим справляются

Как Arc OS решает это

Федеративная архитектура — один child bot на проект, полная изоляция.

Master Bot
    ├── Child: odoo-site     (CLAUDE.md: Odoo 17, Bootstrap, QWeb)
    │   ├── skills/library/odoo-expert.md
    │   ├── skills/library/odoo-owl-expert.md
    │   └── learnings.md: "Use t-call for i18n"
    │
    └── Child: saas-app      (CLAUDE.md: Next.js 15, React, Tailwind)
        ├── skills/library/react-patterns.md
        ├── skills/library/tailwind-expert.md
        └── learnings.md: "Prefer server components"

Разные Telegram-боты. Разные рабочие директории. Разные скиллы. Разная память. Они никогда не видят контекст друг друга.

Результат: Полное руководство в Multi-Project Skill Isolation.


Боль 3: «AI генерирует небезопасный код, и никто его не ловит»

Проблема

AI предлагает git push --force. Выводит пароль в сниппете кода. Рекомендует rm -rf /. Ты не всегда это замечаешь. Ответ уходит в production.

Как другие с этим справляются

Как Arc OS решает это

Binary Eval Engine — декларативные правила, проверяющие каждый ответ перед доставкой.

{
  "rules": [
    { "name": "No force push", "type": "string_not_contains", "value": "--force" },
    { "name": "No credentials", "type": "regex_not_match", "pattern": "(password|token)\\s*[:=]\\s*\\w{8,}" },
    { "name": "Response under 5000 chars", "type": "max_length", "value": 5000 }
  ]
}

Нарушения отображаются как сноски под ответом:

[Ответ Claude]
---
Eval: ⚠️ No force push | ⚠️ No credentials in output

Правила по-скиллу, по-проекту. Твой Odoo-проект проверяет соответствие QWeb. Твой React-проект — прямые манипуляции с DOM.

Результат: Автоматический контрольный шлюз на каждый AI-вывод. Ручная проверка базовой безопасности не нужна.


Боль 4: «Я понятия не имею, насколько хорошо работает AI»

Проблема

Ты используешь AI три месяца. Реально ли он хорош? Какие скиллы работают? Какие нет? Становится лучше или хуже? Нет данных. Нет метрик. Только ощущения.

Как другие с этим справляются

Как Arc OS решает это

Quality Tracker + Karpathy Loop — метрики по скиллу с автоматическими предложениями улучшений.

Каждый ответ логируется:

{
  "type": "execution",
  "skills": ["code-review"],
  "success": true,
  "duration_ms": 12340,
  "response_length": 2847
}

Каждая кнопка фидбека (thumbs-up/thumbs-down) отслеживается по ответу:

Команда /quality показывает:
  code-review: 45x, 91% ok, thumbs-up 12/thumbs-down 2, avg 8.3s
  git-manager: 23x, 78% ok, thumbs-up 5/thumbs-down 4, avg 3.1s

В 3:00 ночи Karpathy Loop запускается:

  1. Находит скиллы с <80% успеха или больше негативных, чем позитивных оценок
  2. Отправляет CEO карточку-предложение в Telegram
  3. Одно нажатие: Одобрить (бэкап + улучшение) или Отклонить (выбросить)

Результат: Data-driven управление AI. Ты точно знаешь, что работает, а что нет.


Боль 5: «25 загруженных скиллов одновременно = запутавшийся AI»

Проблема

У тебя 25 скиллов: git, деплой, code review, Figma, Odoo, тестирование, безопасность. Загружать все в каждый промпт — расход контекстного окна и путаница модели. Она пытается применять советы по деплою к вопросу о code review.

Как другие с этим справляются

Как Arc OS решает это

Context Router — умный выбор скиллов для каждого сообщения.

Пользователь: "Review this code for XSS vulnerabilities"

Context Router скорит:
  code-review:          trigger "review" (2) + keyword "XSS" (1) = 3
  code-review-protocol: trigger "code review" (2)                 = 2
  system-audit:         no match                                  = 0
  git-manager:          no match                                  = 0

Инжектирует в промпт:
  SKILLS_HINT (focus on these):
  - code-review: Security audit and code quality review...
  - code-review-protocol: Structured code review with OWASP...

Только top-5 релевантных скиллов предлагаются. Claude по-прежнему имеет доступ ко всем скиллам, но фокусируется на нужных. Рекомендательно, не ограничительно — нет риска сломать что-то.

Результат: Сфокусированные, релевантные ответы. Никакого загрязнения контекста нерелевантными скиллами.


Резюме

Боль Решение Arc OS Механизм
AI забывает коррекции Персистентные правила обучения Reflect Loop (learnings.md)
Неправильный контекст стека Изолированные child bot-ы Федеративная архитектура
Небезопасный вывод Декларативная валидация Binary Eval Engine
Нет данных о производительности Метрики по скиллу + ночной анализ Quality Tracker + Karpathy Loop
Разбавление контекста Умный выбор скиллов Context Router