Проблеми, які ми вирішуємо
П'ять реальних болів AI-assisted розробки — і як Arc OS усуває кожен із них.
Біль 1: «AI забуває все між сесіями»
Проблема
Ти витрачаєш 30 хвилин, навчаючи Claude конвенцій свого проєкту. Наступна сесія — чистий аркуш. Виправляєш помилку. Завтра — та сама помилка. Кожна сесія починається з нуля.
Як це вирішують інші
- ChatGPT: Custom Instructions (200 слів, один набір на все)
- Cursor: файл
.cursorrules(вручну, без зворотного зв'язку) - Вручну: копіюєш-вставляєш свої «правила» у кожну розмову
Як це вирішує Arc OS
Reflect Loop — автоматична персистентна пам'ять із виправлень.
Ти натискаєш "Fix It" або "thumbs-down"
→ Система записує правило у learnings.md
→ Правило переживає рестарти
→ Автоматично інжектується у КОЖЕН майбутній prompt
Приклад learnings.md через 2 тижні:
- [2026-03-20] [fixit] Always use t-call for translations in Odoo QWeb
- [2026-03-21] [negative] Avoid sudo in deployment scripts
- [2026-03-25] [fixit] Use server components by default in Next.js 15
- [2026-04-01] [negative] Don't suggest rm -rf without confirmation
Результат: Система вибудовує «імунну пам'ять». Одне виправлення = постійне правило. Та сама помилка ніколи не повториться двічі.
Біль 2: «AI не розуміє технологічного стеку мого проєкту»
Проблема
Твій Odoo-проєкт використовує Bootstrap, Owl framework, QWeb-шаблони, Python. Твій SaaS — Tailwind, React, Next.js, TypeScript. Загальний AI-бот плутає ці два світи. Поради для Odoo просочуються у React-контекст. React-патерни з'являються в Odoo-коді.
Як це вирішують інші
- ChatGPT: одна розмова на проєкт (без enforcement)
- Cursor: workspace-aware, але одне вікно контексту
- Вручну: постійно нагадуєш AI, у якому ти проєкті
Як це вирішує Arc OS
Federated Architecture — один child bot на проєкт, повна ізоляція.
Master Bot
├── Child: odoo-site (CLAUDE.md: Odoo 17, Bootstrap, QWeb)
│ ├── skills/library/odoo-expert.md
│ ├── skills/library/odoo-owl-expert.md
│ └── learnings.md: "Use t-call for i18n"
│
└── Child: saas-app (CLAUDE.md: Next.js 15, React, Tailwind)
├── skills/library/react-patterns.md
├── skills/library/tailwind-expert.md
└── learnings.md: "Prefer server components"
Різні Telegram-боти. Різні робочі директорії. Різні скіли. Різна пам'ять. Вони ніколи не бачать контексту одне одного.
Результат: Повний гайд у Multi-Project Skill Isolation.
Біль 3: «AI генерує небезпечний код, і ніхто цього не помічає»
Проблема
AI пропонує git push --force. Виводить пароль у фрагменті коду. Рекомендує rm -rf /. Ти не завжди це ловиш. Відповідь іде в продакшн.
Як це вирішують інші
- ChatGPT / Copilot: жодної валідації виводу
- Cursor: лише перевірка синтаксису
- Вручну: людський review кожної відповіді (не масштабується)
Як це вирішує Arc OS
Binary Eval Engine — декларативні правила, які перевіряють кожну відповідь перед доставкою.
{
"rules": [
{ "name": "No force push", "type": "string_not_contains", "value": "--force" },
{ "name": "No credentials", "type": "regex_not_match", "pattern": "(password|token)\\s*[:=]\\s*\\w{8,}" },
{ "name": "Response under 5000 chars", "type": "max_length", "value": 5000 }
]
}
Невдачі з'являються у вигляді футноут до відповіді:
[Claude's response here]
---
Eval: ⚠️ No force push | ⚠️ No credentials in output
Правила — per-skill, per-project. Твій Odoo-проєкт перевіряє відповідність QWeb. Твій React-проєкт перевіряє пряму маніпуляцію DOM.
Результат: Автоматичний quality gate на кожному AI-виводі. Жодного людського review для базової безпеки.
Біль 4: «Я взагалі не знаю, чи добре працює AI»
Проблема
Ти користуєшся AI 3 місяці. Він реально добрий? Які скіли працюють? Які провалюються? Стає кращим чи гіршим? Немає даних. Немає метрик. Просто відчуття.
Як це вирішують інші
- ChatGPT: історія розмов (неструктурована, без метрик)
- Copilot: acceptance rate (одне число без деталей)
- Вручну: інтуїція
Як це вирішує Arc OS
Quality Tracker + Karpathy Loop — per-skill метрики з автоматичними пропозиціями покращень.
Кожна відповідь логується:
{
"type": "execution",
"skills": ["code-review"],
"success": true,
"duration_ms": 12340,
"response_length": 2847
}
Кожне натискання feedback-кнопки (thumbs-up/thumbs-down) трекається на рівні відповіді:
/quality command shows:
code-review: 45x, 91% ok, thumbs-up 12/thumbs-down 2, avg 8.3s
git-manager: 23x, 78% ok, thumbs-up 5/thumbs-down 4, avg 3.1s
О 3:00 ночі запускається Karpathy Loop:
- Знаходить скіли з <80% успіху або більшим негативним фідбеком, ніж позитивним
- Надсилає CEO картку-пропозицію в Telegram
- Одне натискання: Approve (бекап + покращити) або Reject (відкинути)
Результат: Data-driven управління AI. Ти точно знаєш, що працює, а що — ні.
Біль 5: «25 скілів завантажені одночасно = розгублений AI»
Проблема
У тебе 25 скілів, що покривають git, деплой, code review, Figma, Odoo, тестування, безпеку. Завантаження всіх у кожен prompt марнує context window і збиває модель з пантелику. Вона намагається застосувати поради з деплою до питання про code review.
Як це вирішують інші
- ChatGPT: системи скілів немає взагалі
- Cursor: усі правила завжди завантажені
- Вручну: коментуєш нерелевантні правила під кожну задачу
Як це вирішує Arc OS
Context Router — інтелектуальний підбір скілів під кожне повідомлення.
User: "Review this code for XSS vulnerabilities"
Context Router scores:
code-review: trigger "review" (2) + keyword "XSS" (1) = 3
code-review-protocol: trigger "code review" (2) = 2
system-audit: no match = 0
git-manager: no match = 0
Injects into prompt:
SKILLS_HINT (focus on these):
- code-review: Security audit and code quality review...
- code-review-protocol: Structured code review with OWASP...
Лише top-5 релевантних скілів пропонуються. Claude усе ще має доступ до всіх скілів, але фокусується на правильних. Це порада, а не обмеження — жодного ризику щось зламати.
Результат: Сфокусовані, релевантні відповіді. Жодного забруднення контексту нерелевантними скілами.
Підсумок
| Біль | Рішення Arc OS | Механізм |
|---|---|---|
| AI забуває виправлення | Персистентні правила навчання | Reflect Loop (learnings.md) |
| Неправильний контекст техстеку | Ізольовані child bots | Federated Architecture |
| Небезпечний вивід | Декларативна валідація | Binary Eval Engine |
| Немає даних про продуктивність | Per-skill метрики + нічний аналіз | Quality Tracker + Karpathy Loop |
| Розмивання контексту | Розумний підбір скілів | Context Router |