Проблеми, які ми вирішуємо

П'ять реальних болів AI-assisted розробки — і як Arc OS усуває кожен із них.


Біль 1: «AI забуває все між сесіями»

Проблема

Ти витрачаєш 30 хвилин, навчаючи Claude конвенцій свого проєкту. Наступна сесія — чистий аркуш. Виправляєш помилку. Завтра — та сама помилка. Кожна сесія починається з нуля.

Як це вирішують інші

Як це вирішує Arc OS

Reflect Loop — автоматична персистентна пам'ять із виправлень.

Ти натискаєш "Fix It" або "thumbs-down"
    → Система записує правило у learnings.md
    → Правило переживає рестарти
    → Автоматично інжектується у КОЖЕН майбутній prompt

Приклад learnings.md через 2 тижні:

- [2026-03-20] [fixit] Always use t-call for translations in Odoo QWeb
- [2026-03-21] [negative] Avoid sudo in deployment scripts
- [2026-03-25] [fixit] Use server components by default in Next.js 15
- [2026-04-01] [negative] Don't suggest rm -rf without confirmation

Результат: Система вибудовує «імунну пам'ять». Одне виправлення = постійне правило. Та сама помилка ніколи не повториться двічі.


Біль 2: «AI не розуміє технологічного стеку мого проєкту»

Проблема

Твій Odoo-проєкт використовує Bootstrap, Owl framework, QWeb-шаблони, Python. Твій SaaS — Tailwind, React, Next.js, TypeScript. Загальний AI-бот плутає ці два світи. Поради для Odoo просочуються у React-контекст. React-патерни з'являються в Odoo-коді.

Як це вирішують інші

Як це вирішує Arc OS

Federated Architecture — один child bot на проєкт, повна ізоляція.

Master Bot
    ├── Child: odoo-site     (CLAUDE.md: Odoo 17, Bootstrap, QWeb)
    │   ├── skills/library/odoo-expert.md
    │   ├── skills/library/odoo-owl-expert.md
    │   └── learnings.md: "Use t-call for i18n"
    │
    └── Child: saas-app      (CLAUDE.md: Next.js 15, React, Tailwind)
        ├── skills/library/react-patterns.md
        ├── skills/library/tailwind-expert.md
        └── learnings.md: "Prefer server components"

Різні Telegram-боти. Різні робочі директорії. Різні скіли. Різна пам'ять. Вони ніколи не бачать контексту одне одного.

Результат: Повний гайд у Multi-Project Skill Isolation.


Біль 3: «AI генерує небезпечний код, і ніхто цього не помічає»

Проблема

AI пропонує git push --force. Виводить пароль у фрагменті коду. Рекомендує rm -rf /. Ти не завжди це ловиш. Відповідь іде в продакшн.

Як це вирішують інші

Як це вирішує Arc OS

Binary Eval Engine — декларативні правила, які перевіряють кожну відповідь перед доставкою.

{
  "rules": [
    { "name": "No force push", "type": "string_not_contains", "value": "--force" },
    { "name": "No credentials", "type": "regex_not_match", "pattern": "(password|token)\\s*[:=]\\s*\\w{8,}" },
    { "name": "Response under 5000 chars", "type": "max_length", "value": 5000 }
  ]
}

Невдачі з'являються у вигляді футноут до відповіді:

[Claude's response here]
---
Eval: ⚠️ No force push | ⚠️ No credentials in output

Правила — per-skill, per-project. Твій Odoo-проєкт перевіряє відповідність QWeb. Твій React-проєкт перевіряє пряму маніпуляцію DOM.

Результат: Автоматичний quality gate на кожному AI-виводі. Жодного людського review для базової безпеки.


Біль 4: «Я взагалі не знаю, чи добре працює AI»

Проблема

Ти користуєшся AI 3 місяці. Він реально добрий? Які скіли працюють? Які провалюються? Стає кращим чи гіршим? Немає даних. Немає метрик. Просто відчуття.

Як це вирішують інші

Як це вирішує Arc OS

Quality Tracker + Karpathy Loop — per-skill метрики з автоматичними пропозиціями покращень.

Кожна відповідь логується:

{
  "type": "execution",
  "skills": ["code-review"],
  "success": true,
  "duration_ms": 12340,
  "response_length": 2847
}

Кожне натискання feedback-кнопки (thumbs-up/thumbs-down) трекається на рівні відповіді:

/quality command shows:
  code-review: 45x, 91% ok, thumbs-up 12/thumbs-down 2, avg 8.3s
  git-manager: 23x, 78% ok, thumbs-up 5/thumbs-down 4, avg 3.1s

О 3:00 ночі запускається Karpathy Loop:

  1. Знаходить скіли з <80% успіху або більшим негативним фідбеком, ніж позитивним
  2. Надсилає CEO картку-пропозицію в Telegram
  3. Одне натискання: Approve (бекап + покращити) або Reject (відкинути)

Результат: Data-driven управління AI. Ти точно знаєш, що працює, а що — ні.


Біль 5: «25 скілів завантажені одночасно = розгублений AI»

Проблема

У тебе 25 скілів, що покривають git, деплой, code review, Figma, Odoo, тестування, безпеку. Завантаження всіх у кожен prompt марнує context window і збиває модель з пантелику. Вона намагається застосувати поради з деплою до питання про code review.

Як це вирішують інші

Як це вирішує Arc OS

Context Router — інтелектуальний підбір скілів під кожне повідомлення.

User: "Review this code for XSS vulnerabilities"

Context Router scores:
  code-review:          trigger "review" (2) + keyword "XSS" (1) = 3
  code-review-protocol: trigger "code review" (2)                 = 2
  system-audit:         no match                                  = 0
  git-manager:          no match                                  = 0

Injects into prompt:
  SKILLS_HINT (focus on these):
  - code-review: Security audit and code quality review...
  - code-review-protocol: Structured code review with OWASP...

Лише top-5 релевантних скілів пропонуються. Claude усе ще має доступ до всіх скілів, але фокусується на правильних. Це порада, а не обмеження — жодного ризику щось зламати.

Результат: Сфокусовані, релевантні відповіді. Жодного забруднення контексту нерелевантними скілами.


Підсумок

Біль Рішення Arc OS Механізм
AI забуває виправлення Персистентні правила навчання Reflect Loop (learnings.md)
Неправильний контекст техстеку Ізольовані child bots Federated Architecture
Небезпечний вивід Декларативна валідація Binary Eval Engine
Немає даних про продуктивність Per-skill метрики + нічний аналіз Quality Tracker + Karpathy Loop
Розмивання контексту Розумний підбір скілів Context Router