Проблеми, які ми вирішуємо

П'ять реальних болів AI-assisted розробки — і як Arc OS усуває кожен із них.

Біль 1: «AI забуває все між сесіями»

Проблема

Ти витрачаєш 30 хвилин, навчаючи Claude конвенцій свого проєкту. Наступна сесія — чистий аркуш. Виправляєш помилку. Завтра — та сама помилка. Кожна сесія починається з нуля.

Як це вирішують інші

ChatGPT: Custom Instructions (200 слів, один набір на все)
Cursor: файл .cursorrules (вручну, без зворотного зв'язку)
Вручну: копіюєш-вставляєш свої «правила» у кожну розмову

Як це вирішує Arc OS

Reflect Loop — автоматична персистентна пам'ять із виправлень.

Ти натискаєш "Fix It" або "thumbs-down"
    → Система записує правило у learnings.md
    → Правило переживає рестарти
    → Автоматично інжектується у КОЖЕН майбутній prompt

Приклад learnings.md через 2 тижні:

- [2026-03-20] [fixit] Always use t-call for translations in Odoo QWeb
- [2026-03-21] [negative] Avoid sudo in deployment scripts
- [2026-03-25] [fixit] Use server components by default in Next.js 15
- [2026-04-01] [negative] Don't suggest rm -rf without confirmation

Результат: Система вибудовує «імунну пам'ять». Одне виправлення = постійне правило. Та сама помилка ніколи не повториться двічі.

Біль 2: «AI не розуміє технологічного стеку мого проєкту»

Проблема

Твій Odoo-проєкт використовує Bootstrap, Owl framework, QWeb-шаблони, Python. Твій SaaS — Tailwind, React, Next.js, TypeScript. Загальний AI-бот плутає ці два світи. Поради для Odoo просочуються у React-контекст. React-патерни з'являються в Odoo-коді.

Як це вирішують інші

ChatGPT: одна розмова на проєкт (без enforcement)
Cursor: workspace-aware, але одне вікно контексту
Вручну: постійно нагадуєш AI, у якому ти проєкті

Як це вирішує Arc OS

Federated Architecture — один child bot на проєкт, повна ізоляція.

Master Bot
    ├── Child: odoo-site     (CLAUDE.md: Odoo 17, Bootstrap, QWeb)
    │   ├── skills/library/odoo-expert.md
    │   ├── skills/library/odoo-owl-expert.md
    │   └── learnings.md: "Use t-call for i18n"
    │
    └── Child: saas-app      (CLAUDE.md: Next.js 15, React, Tailwind)
        ├── skills/library/react-patterns.md
        ├── skills/library/tailwind-expert.md
        └── learnings.md: "Prefer server components"

Різні Telegram-боти. Різні робочі директорії. Різні скіли. Різна пам'ять. Вони ніколи не бачать контексту одне одного.

Результат: Повний гайд у Multi-Project Skill Isolation.

Біль 3: «AI генерує небезпечний код, і ніхто цього не помічає»

Проблема

AI пропонує git push --force. Виводить пароль у фрагменті коду. Рекомендує rm -rf /. Ти не завжди це ловиш. Відповідь іде в продакшн.

Як це вирішують інші

ChatGPT / Copilot: жодної валідації виводу
Cursor: лише перевірка синтаксису
Вручну: людський review кожної відповіді (не масштабується)

Як це вирішує Arc OS

Binary Eval Engine — декларативні правила, які перевіряють кожну відповідь перед доставкою.

{
  "rules": [
    { "name": "No force push", "type": "string_not_contains", "value": "--force" },
    { "name": "No credentials", "type": "regex_not_match", "pattern": "(password|token)\\s*[:=]\\s*\\w{8,}" },
    { "name": "Response under 5000 chars", "type": "max_length", "value": 5000 }
  ]
}

Невдачі з'являються у вигляді футноут до відповіді:

[Claude's response here]
---
Eval: ⚠️ No force push | ⚠️ No credentials in output

Правила — per-skill, per-project. Твій Odoo-проєкт перевіряє відповідність QWeb. Твій React-проєкт перевіряє пряму маніпуляцію DOM.

Результат: Автоматичний quality gate на кожному AI-виводі. Жодного людського review для базової безпеки.

Біль 4: «Я взагалі не знаю, чи добре працює AI»

Проблема

Ти користуєшся AI 3 місяці. Він реально добрий? Які скіли працюють? Які провалюються? Стає кращим чи гіршим? Немає даних. Немає метрик. Просто відчуття.

Як це вирішують інші

ChatGPT: історія розмов (неструктурована, без метрик)
Copilot: acceptance rate (одне число без деталей)
Вручну: інтуїція

Як це вирішує Arc OS

Quality Tracker + Karpathy Loop — per-skill метрики з автоматичними пропозиціями покращень.

Кожна відповідь логується:

{
  "type": "execution",
  "skills": ["code-review"],
  "success": true,
  "duration_ms": 12340,
  "response_length": 2847
}

Кожне натискання feedback-кнопки (thumbs-up/thumbs-down) трекається на рівні відповіді:

/quality command shows:
  code-review: 45x, 91% ok, thumbs-up 12/thumbs-down 2, avg 8.3s
  git-manager: 23x, 78% ok, thumbs-up 5/thumbs-down 4, avg 3.1s

О 3:00 ночі запускається Karpathy Loop:

Знаходить скіли з <80% успіху або більшим негативним фідбеком, ніж позитивним
Надсилає CEO картку-пропозицію в Telegram
Одне натискання: Approve (бекап + покращити) або Reject (відкинути)

Результат: Data-driven управління AI. Ти точно знаєш, що працює, а що — ні.

Біль 5: «25 скілів завантажені одночасно = розгублений AI»

Проблема

У тебе 25 скілів, що покривають git, деплой, code review, Figma, Odoo, тестування, безпеку. Завантаження всіх у кожен prompt марнує context window і збиває модель з пантелику. Вона намагається застосувати поради з деплою до питання про code review.

Як це вирішують інші

ChatGPT: системи скілів немає взагалі
Cursor: усі правила завжди завантажені
Вручну: коментуєш нерелевантні правила під кожну задачу

Як це вирішує Arc OS

Context Router — інтелектуальний підбір скілів під кожне повідомлення.

User: "Review this code for XSS vulnerabilities"

Context Router scores:
  code-review:          trigger "review" (2) + keyword "XSS" (1) = 3
  code-review-protocol: trigger "code review" (2)                 = 2
  system-audit:         no match                                  = 0
  git-manager:          no match                                  = 0

Injects into prompt:
  SKILLS_HINT (focus on these):
  - code-review: Security audit and code quality review...
  - code-review-protocol: Structured code review with OWASP...

Лише top-5 релевантних скілів пропонуються. Claude усе ще має доступ до всіх скілів, але фокусується на правильних. Це порада, а не обмеження — жодного ризику щось зламати.

Результат: Сфокусовані, релевантні відповіді. Жодного забруднення контексту нерелевантними скілами.

Підсумок

Біль	Рішення Arc OS	Механізм
AI забуває виправлення	Персистентні правила навчання	Reflect Loop (`learnings.md`)
Неправильний контекст техстеку	Ізольовані child bots	Federated Architecture
Небезпечний вивід	Декларативна валідація	Binary Eval Engine
Немає даних про продуктивність	Per-skill метрики + нічний аналіз	Quality Tracker + Karpathy Loop
Розмивання контексту	Розумний підбір скілів	Context Router