ваше сообщение коммита

2026-02-20 14:18:08 +03:00
parent 8702a355a1
commit 24e560fc83
44 changed files with 8354 additions and 95 deletions
--- a/docs.ru/ai-assistant.md
+++ b/docs.ru/ai-assistant.md
@@ -0,0 +1,372 @@
+[English](../docs.en/ai-assistant.md) | **Русский**
+
+# ИИ-агенты DLE — система создания специализированных агентов для бизнеса
+
+> **Концепция**: одна локальная модель — множество специализированных агентов. Каждый агент заточен под конкретный бизнес-процесс: свой промпт, свои правила, своя база знаний, свой интерфейс.
+
+## Содержание
+
+1. [Что это и зачем](#что-это-и-зачем)
+2. [Архитектура](#архитектура)
+3. [Как создать агента](#как-создать-агента)
+4. [Примеры агентов](#примеры-агентов)
+5. [Технологический стек](#технологический-стек)
+6. [Преимущества перед облачными решениями](#преимущества-перед-облачными-решениями)
+7. [Экономический эффект](#экономический-эффект)
+
+---
+
+## Что это и зачем
+
+DLE предоставляет **инструменты для создания ИИ-агентов** — специализированных помощников, каждый из которых отвечает за отдельный бизнес-процесс.
+
+Это не один универсальный чат-бот. Это **конструктор**, в котором вы:
+
+- Создаёте агента под конкретную задачу (поддержка клиентов, контент, закупки, аналитика)
+- Задаёте ему роль через системный промпт
+- Подключаете базу знаний (RAG-таблицы) с релевантными данными
+- Настраиваете правила поведения (строгий режим, креативный, гибридный)
+- Привязываете к каналам (веб-чат, Telegram, Email)
+- Получаете изолированного специалиста, который работает 24/7
+
+Все агенты используют **одну локальную модель Ollama** на вашем сервере. Различие между ними — в системных промптах, правилах и подключённых данных. Данные не покидают ваш сервер.
+
+---
+
+## Архитектура
+
+### Принцип: одна модель — множество агентов
+
+```
+┌──────────────────────────────────────────────────────┐
+│            Локальная модель Ollama (qwen2.5:7b)      │
+│            Единая для всех агентов                   │
+└───────────┬──────────────┬───────────────┬───────────┘
+            │              │               │
+            ↓              ↓               ↓
+┌───────────────┐ ┌────────────────┐ ┌──────────────┐
+│ Агент         │ │ Агент          │ │ Агент        │
+│ поддержки     │ │ контент-       │ │ закупок      │
+│               │ │ редактор       │ │              │
+│ Промпт:       │ │ Промпт:        │ │ Промпт:      │
+│ "Вы —         │ │ "Вы —          │ │ "Вы —        │
+│  ассистент    │ │  контент-      │ │  специалист  │
+│  поддержки"   │ │  маркетолог"   │ │  по закупкам"│
+│               │ │                │ │              │
+│ RAG: FAQ,     │ │ RAG: стиль,    │ │ RAG: база    │
+│ документация  │ │ инструкции,    │ │ поставщиков, │
+│               │ │ примеры        │ │ условия      │
+│               │ │                │ │              │
+│ Правила:      │ │ Правила:       │ │ Правила:     │
+│ строгий       │ │ креативный     │ │ гибридный    │
+│ (t=0.3)       │ │ (t=0.7)        │ │ (t=0.5)      │
+│               │ │                │ │              │
+│ Каналы:       │ │ Каналы:        │ │ Каналы:      │
+│ чат, TG,      │ │ веб-интерфейс  │ │ веб-интерфейс│
+│ email         │ │ /content-editor│ │              │
+└───────────────┘ └────────────────┘ └──────────────┘
+```
+
+### Изоляция агентов
+
+Каждый агент полностью изолирован:
+
+| Параметр | Изоляция |
+|----------|----------|
+| Системный промпт | Свой для каждого агента |
+| Правила (Rules) | Свой набор: temperature, maxTokens, режим RAG |
+| RAG-таблицы | Агент видит только свои подключённые таблицы |
+| Каналы | Отдельная привязка к веб-чату, Telegram, Email |
+| Интерфейс | Свой маршрут и UI |
+| Права доступа | Раздельные permissions |
+
+Агенты не влияют друг на друга: можно создавать, менять и удалять их независимо.
+
+### Обработка запроса
+
+```
+Запрос пользователя
+       ↓
+Определение агента (по каналу / маршруту)
+       ↓
+Загрузка настроек агента (промпт, правила, RAG-таблицы)
+       ↓
+Векторизация запроса (Ollama mxbai-embed-large → вектор [768])
+       ↓
+RAG-поиск по подключённым таблицам (FAISS)
+       ↓
+Генерация ответа (LLM с контекстом из RAG + системный промпт + история)
+       ↓
+Кэширование ответа (TTL 1 час, повторный запрос < 50ms)
+       ↓
+Ответ пользователю
+```
+
+---
+
+## Как создать агента
+
+### Шаг 1. Базовая информация
+
+- **Название** — «Агент поддержки», «Контент-редактор», «AI-закупщик»
+- **Роль** — support, content_editor, analyst, purchaser и т.д.
+- **Описание** — для чего агент создан
+
+### Шаг 2. Системный промпт
+
+Определяет личность и поведение агента. Примеры:
+
+**Для агента поддержки:**
+```
+Вы — профессиональный ассистент службы поддержки компании "Название".
+
+Правила:
+1. Отвечайте ТОЛЬКО на основе базы знаний
+2. Если ответа нет — предложите связаться с оператором
+3. Не придумывайте информацию о ценах, сроках, условиях
+4. Обращайтесь к клиенту на "Вы"
+5. Заканчивайте: "Чем ещё могу помочь?"
+```
+
+**Для контент-редактора:**
+```
+Вы — профессиональный контент-маркетолог и редактор компании "Название".
+
+Правила:
+1. Используйте стиль компании из базы знаний
+2. Следуйте инструкциям конкретной платформы (ВК, Telegram, и т.д.)
+3. Используйте ключевые слова и хэштеги из базы
+4. Добавляйте CTA-блоки из базы
+```
+
+### Шаг 3. Правила (Rules)
+
+JSON-конфигурация поведения агента:
+
+```json
+{
+  "searchRagFirst": true,
+  "generateIfNoRag": false,
+  "checkUserTags": true,
+  "temperature": 0.3,
+  "maxTokens": 500
+}
+```
+
+| Параметр | Что делает | Поддержка | Контент | Аналитика |
+|----------|-----------|-----------|---------|-----------|
+| `temperature` | Степень креативности (0.0–1.0) | 0.3 | 0.7 | 0.2 |
+| `searchRagFirst` | Сначала искать в базе знаний | true | true | true |
+| `generateIfNoRag` | Генерировать, если не нашёл в базе | false | true | false |
+| `maxTokens` | Максимальная длина ответа | 500 | 2000 | 1000 |
+| `checkUserTags` | Учитывать теги пользователя | true | false | true |
+
+### Шаг 4. База знаний (RAG-таблицы)
+
+Подключите электронные таблицы, по которым агент будет искать информацию:
+
+- **Агент поддержки** → таблицы «FAQ», «Документация продукта»
+- **Контент-редактор** → таблицы «Инструкции платформ», «Стиль компании», «Примеры контента», «Ключевые слова»
+- **AI-закупщик** → таблицы «База поставщиков», «Условия и прайсы»
+
+Каждая таблица должна иметь столбцы с назначениями «Вопрос для AI» и «Ответ AI» — они автоматически индексируются для векторного поиска.
+
+### Шаг 5. Каналы и интерфейс
+
+| Параметр | Описание |
+|----------|----------|
+| Каналы | веб-чат, Telegram, Email, SMS |
+| Маршрут | URL интерфейса агента (например, `/content-editor`) |
+| Права доступа | Какие роли пользователей имеют доступ |
+
+### Шаг 6. Активация
+
+Включите агента — он начнёт обрабатывать запросы по подключённым каналам.
+
+---
+
+## Примеры агентов
+
+### 1. Агент поддержки клиентов
+
+**Задача**: отвечать на вопросы клиентов 24/7 на основе базы знаний.
+
+| Параметр | Значение |
+|----------|----------|
+| Режим | Строгий — только из базы знаний |
+| temperature | 0.3 |
+| RAG-таблицы | FAQ, Документация, База знаний для клиентов |
+| Каналы | Веб-чат, Telegram, Email |
+| Поведение при отсутствии ответа | Предлагает связаться с оператором |
+
+**Пример работы:**
+```
+Клиент: "Как оплатить заказ?"
+Агент:  [Ищет в таблице FAQ → находит ответ с Score < 300]
+        "Мы принимаем оплату банковской картой, через PayPal
+         или банковским переводом. Чем ещё могу помочь?"
+```
+
+### 2. Контент-редактор
+
+**Задача**: создавать контент для соцсетей, блога, рассылок по стилю компании.
+
+| Параметр | Значение |
+|----------|----------|
+| Режим | Креативный — генерирует на основе инструкций и примеров |
+| temperature | 0.7 |
+| RAG-таблицы | Инструкции платформ, Стиль компании, Примеры контента, Ключевые слова, CTA-блоки |
+| Каналы | Веб-интерфейс `/content-editor` |
+| Доступ | Пользователи с ролью Editor |
+
+**Интерфейс:**
+- Поле ввода задачи
+- Выбор типа контента (пост ВК, статья блога, email-рассылка)
+- Выбор платформы
+- Генерация → редактирование → сохранение/экспорт
+- История созданного контента
+
+### 3. AI-закупщик
+
+**Задача**: помогать с выбором поставщиков и анализом условий.
+
+| Параметр | Значение |
+|----------|----------|
+| Режим | Гибридный |
+| temperature | 0.5 |
+| RAG-таблицы | База поставщиков, Условия и прайсы |
+| Каналы | Веб-интерфейс |
+| Доступ | Менеджеры по закупкам |
+
+**Пример работы:**
+```
+Менеджер: "Кто поставляет электронику с доставкой до 3 дней?"
+Агент:    [Ищет в таблице поставщиков, фильтрует по категории и срокам]
+          "ТОП-3 поставщика электроники с доставкой до 3 дней:
+           1. ООО «Техноснаб» — рейтинг 9/10, доставка 2 дня
+           2. ..."
+```
+
+### 4. Другие возможные агенты
+
+| Агент | Задача | RAG-таблицы |
+|-------|--------|-------------|
+| **Аналитик** | Анализ данных, создание отчётов, выявление трендов | Метрики, KPI, Отчёты |
+| **HR-ассистент** | Скрининг резюме, ответы сотрудникам, планирование обучения | База знаний для сотрудников, HR-политики |
+| **Переводчик** | Перевод документов, локализация контента | Глоссарии, Стиль для разных языков |
+| **Юрист-помощник** | Анализ договоров, ответы на правовые вопросы | Шаблоны договоров, Нормативные акты |
+
+Количество агентов не ограничено. Каждый новый агент — это новая комбинация промпта, правил и подключённых таблиц.
+
+---
+
+## Технологический стек
+
+| Компонент | Технология | Назначение |
+|-----------|------------|------------|
+| LLM | Ollama (qwen2.5:7b или любая другая) | Генерация ответов, диалог |
+| Embedding | mxbai-embed-large | Векторизация текста для поиска |
+| Векторная БД | FAISS | Быстрый семантический поиск |
+| Основная БД | PostgreSQL | Хранение настроек агентов, баз знаний, истории |
+| Кэш | Node.js Map + TTL | Ускорение повторных запросов (< 50ms) |
+| Очередь | AI Queue | Обработка задач по приоритету |
+| Шифрование | AES-256 | Все промпты и настройки зашифрованы |
+
+### Методы поиска (RAG)
+
+| Метод | Описание | Когда использовать |
+|-------|----------|-------------------|
+| Семантический | Поиск по смыслу через FAISS | Когда важна точность понимания |
+| По ключевым словам | Быстрый текстовый поиск | Когда важна скорость |
+| Гибридный | 70% семантика + 30% ключевые слова | Рекомендуется по умолчанию |
+
+Дополнительно: нечёткий поиск (опечатки), стемминг (разные формы слов), извлечение ключевых слов.
+
+---
+
+## Преимущества перед облачными решениями
+
+| Характеристика | DLE (локальный) | ChatGPT API | Claude API |
+|----------------|----------------|-------------|------------|
+| **Стоимость** | $0 | ~$0.02/запрос | ~$0.03/запрос |
+| **Конфиденциальность** | 100% — данные на вашем сервере | Данные у OpenAI | Данные у Anthropic |
+| **Скорость (кэш)** | < 50ms | 500–2000ms | 500–2000ms |
+| **Offline-работа** | Да | Нет | Нет |
+| **Настройка под бизнес** | Полная: промпты, правила, RAG | Ограниченная | Ограниченная |
+| **Лимиты API** | Нет | Есть | Есть |
+| **Количество агентов** | Неограничено | Нужен отдельный API-вызов | Нужен отдельный API-вызов |
+| **Множественные базы знаний** | Да, изолированные RAG-таблицы | Нет нативной поддержки | Нет нативной поддержки |
+
+---
+
+## Экономический эффект
+
+### Экономия на API-запросах
+
+| Объём запросов | ChatGPT API | Claude API | DLE |
+|---------------|-------------|------------|-----|
+| 10,000/мес | $2,400/год | $3,600/год | $0 |
+| 50,000/мес | $12,000/год | $18,000/год | $0 |
+| 100,000/мес | $24,000/год | $36,000/год | $0 |
+
+### Экономия на автоматизации процессов
+
+Каждый агент заменяет рутинную работу сотрудников. Расчёт для компании среднего размера:
+
+| Агент | Что автоматизирует | Экономия в год |
+|-------|--------------------|----------------|
+| Агент поддержки | Ответы на типовые вопросы 24/7 (вместо 1-2 операторов) | $57,600 |
+| AI-закупщик | Поиск и сравнение поставщиков (вместо ручного анализа) | $64,800 |
+| HR-ассистент | Скрининг резюме, ответы сотрудникам | $57,600 |
+| Контент-редактор | Генерация постов, рассылок, статей | $86,400 |
+| Аналитик | Отчётность, анализ данных, мониторинг KPI | $144,000 |
+| Агент по работе с партнёрами | Коммуникации, подготовка документов | $43,200 |
+| Обучение персонала | Персонализированные программы, тесты знаний | $30,000 |
+| Экономия на API | Отсутствие платы за облачные API | $24,000–36,000 |
+| **Итого** | | **$507,600–519,600** |
+
+**Стоимость DLE**: $1,000 (единоразово)
+
+### Сравнение с SaaS за 5 лет
+
+```
+Типичный SaaS-стек:
+  CRM (HubSpot):      $200/мес × 60 = $12,000
+  Чат-бот (Intercom): $150/мес × 60 = $9,000
+  Email (SendGrid):   $100/мес × 60 = $6,000
+  AI (ChatGPT API):   $200/мес × 60 = $12,000
+  ─────────────────────────────────────────────
+  Итого SaaS:                         $39,000
+
+DLE:
+  Лицензия:                           $1,000
+  AI без лимитов:                     $0
+  Обновления 5 лет:                   $0
+  ─────────────────────────────────────────────
+  Итого DLE:                          $1,000
+
+  Экономия за 5 лет:                 $38,000
+```
+
+---
+
+## Дополнительные материалы
+
+- [Архитектура множественных ИИ-агентов](./back-docs/multi-agent-architecture.md) — детальная техническая спецификация
+- [Настройка AI-ассистента](./back-docs/setup-ai-assistant.md) — пошаговая инструкция по развёртыванию
+- [Система электронных таблиц](./back-docs/tables-system.md) — как устроены RAG-таблицы
+- [FAQ](./FAQ.md) — частые вопросы
+
+---
+
+## Поддержка
+
+- **Email**: info@hb3-accelerator.com
+- **Чат**: https://hb3-accelerator.com
+- **Документация**: [FAQ](./FAQ.md)
+
+---
+
+**© 2024-2025 Тарабанов Александр Викторович. Все права защищены.**
+
+**Последнее обновление**: Февраль 2026