ваше сообщение коммита

This commit is contained in:
2026-02-20 14:18:08 +03:00
parent 8702a355a1
commit 24e560fc83
44 changed files with 8354 additions and 95 deletions

372
docs.ru/ai-assistant.md Normal file
View File

@@ -0,0 +1,372 @@
[English](../docs.en/ai-assistant.md) | **Русский**
# ИИ-агенты DLE — система создания специализированных агентов для бизнеса
> **Концепция**: одна локальная модель — множество специализированных агентов. Каждый агент заточен под конкретный бизнес-процесс: свой промпт, свои правила, своя база знаний, свой интерфейс.
## Содержание
1. [Что это и зачем](#что-это-и-зачем)
2. [Архитектура](#архитектура)
3. [Как создать агента](#как-создать-агента)
4. [Примеры агентов](#примеры-агентов)
5. [Технологический стек](#технологический-стек)
6. [Преимущества перед облачными решениями](#преимущества-перед-облачными-решениями)
7. [Экономический эффект](#экономический-эффект)
---
## Что это и зачем
DLE предоставляет **инструменты для создания ИИ-агентов** — специализированных помощников, каждый из которых отвечает за отдельный бизнес-процесс.
Это не один универсальный чат-бот. Это **конструктор**, в котором вы:
- Создаёте агента под конкретную задачу (поддержка клиентов, контент, закупки, аналитика)
- Задаёте ему роль через системный промпт
- Подключаете базу знаний (RAG-таблицы) с релевантными данными
- Настраиваете правила поведения (строгий режим, креативный, гибридный)
- Привязываете к каналам (веб-чат, Telegram, Email)
- Получаете изолированного специалиста, который работает 24/7
Все агенты используют **одну локальную модель Ollama** на вашем сервере. Различие между ними — в системных промптах, правилах и подключённых данных. Данные не покидают ваш сервер.
---
## Архитектура
### Принцип: одна модель — множество агентов
```
┌──────────────────────────────────────────────────────┐
│ Локальная модель Ollama (qwen2.5:7b) │
│ Единая для всех агентов │
└───────────┬──────────────┬───────────────┬───────────┘
│ │ │
↓ ↓ ↓
┌───────────────┐ ┌────────────────┐ ┌──────────────┐
│ Агент │ │ Агент │ │ Агент │
│ поддержки │ │ контент- │ │ закупок │
│ │ │ редактор │ │ │
│ Промпт: │ │ Промпт: │ │ Промпт: │
│ "Вы — │ │ "Вы — │ │ "Вы — │
│ ассистент │ │ контент- │ │ специалист │
│ поддержки" │ │ маркетолог" │ │ по закупкам"│
│ │ │ │ │ │
│ RAG: FAQ, │ │ RAG: стиль, │ │ RAG: база │
│ документация │ │ инструкции, │ │ поставщиков, │
│ │ │ примеры │ │ условия │
│ │ │ │ │ │
│ Правила: │ │ Правила: │ │ Правила: │
│ строгий │ │ креативный │ │ гибридный │
│ (t=0.3) │ │ (t=0.7) │ │ (t=0.5) │
│ │ │ │ │ │
│ Каналы: │ │ Каналы: │ │ Каналы: │
│ чат, TG, │ │ веб-интерфейс │ │ веб-интерфейс│
│ email │ │ /content-editor│ │ │
└───────────────┘ └────────────────┘ └──────────────┘
```
### Изоляция агентов
Каждый агент полностью изолирован:
| Параметр | Изоляция |
|----------|----------|
| Системный промпт | Свой для каждого агента |
| Правила (Rules) | Свой набор: temperature, maxTokens, режим RAG |
| RAG-таблицы | Агент видит только свои подключённые таблицы |
| Каналы | Отдельная привязка к веб-чату, Telegram, Email |
| Интерфейс | Свой маршрут и UI |
| Права доступа | Раздельные permissions |
Агенты не влияют друг на друга: можно создавать, менять и удалять их независимо.
### Обработка запроса
```
Запрос пользователя
Определение агента (по каналу / маршруту)
Загрузка настроек агента (промпт, правила, RAG-таблицы)
Векторизация запроса (Ollama mxbai-embed-large → вектор [768])
RAG-поиск по подключённым таблицам (FAISS)
Генерация ответа (LLM с контекстом из RAG + системный промпт + история)
Кэширование ответа (TTL 1 час, повторный запрос < 50ms)
Ответ пользователю
```
---
## Как создать агента
### Шаг 1. Базовая информация
- **Название** — «Агент поддержки», «Контент-редактор», «AI-закупщик»
- **Роль** — support, content_editor, analyst, purchaser и т.д.
- **Описание** — для чего агент создан
### Шаг 2. Системный промпт
Определяет личность и поведение агента. Примеры:
**Для агента поддержки:**
```
Вы — профессиональный ассистент службы поддержки компании "Название".
Правила:
1. Отвечайте ТОЛЬКО на основе базы знаний
2. Если ответа нет — предложите связаться с оператором
3. Не придумывайте информацию о ценах, сроках, условиях
4. Обращайтесь к клиенту на "Вы"
5. Заканчивайте: "Чем ещё могу помочь?"
```
**Для контент-редактора:**
```
Вы — профессиональный контент-маркетолог и редактор компании "Название".
Правила:
1. Используйте стиль компании из базы знаний
2. Следуйте инструкциям конкретной платформы (ВК, Telegram, и т.д.)
3. Используйте ключевые слова и хэштеги из базы
4. Добавляйте CTA-блоки из базы
```
### Шаг 3. Правила (Rules)
JSON-конфигурация поведения агента:
```json
{
"searchRagFirst": true,
"generateIfNoRag": false,
"checkUserTags": true,
"temperature": 0.3,
"maxTokens": 500
}
```
| Параметр | Что делает | Поддержка | Контент | Аналитика |
|----------|-----------|-----------|---------|-----------|
| `temperature` | Степень креативности (0.01.0) | 0.3 | 0.7 | 0.2 |
| `searchRagFirst` | Сначала искать в базе знаний | true | true | true |
| `generateIfNoRag` | Генерировать, если не нашёл в базе | false | true | false |
| `maxTokens` | Максимальная длина ответа | 500 | 2000 | 1000 |
| `checkUserTags` | Учитывать теги пользователя | true | false | true |
### Шаг 4. База знаний (RAG-таблицы)
Подключите электронные таблицы, по которым агент будет искать информацию:
- **Агент поддержки** → таблицы «FAQ», «Документация продукта»
- **Контент-редактор** → таблицы «Инструкции платформ», «Стиль компании», «Примеры контента», «Ключевые слова»
- **AI-закупщик** → таблицы «База поставщиков», «Условия и прайсы»
Каждая таблица должна иметь столбцы с назначениями «Вопрос для AI» и «Ответ AI» — они автоматически индексируются для векторного поиска.
### Шаг 5. Каналы и интерфейс
| Параметр | Описание |
|----------|----------|
| Каналы | веб-чат, Telegram, Email, SMS |
| Маршрут | URL интерфейса агента (например, `/content-editor`) |
| Права доступа | Какие роли пользователей имеют доступ |
### Шаг 6. Активация
Включите агента — он начнёт обрабатывать запросы по подключённым каналам.
---
## Примеры агентов
### 1. Агент поддержки клиентов
**Задача**: отвечать на вопросы клиентов 24/7 на основе базы знаний.
| Параметр | Значение |
|----------|----------|
| Режим | Строгий — только из базы знаний |
| temperature | 0.3 |
| RAG-таблицы | FAQ, Документация, База знаний для клиентов |
| Каналы | Веб-чат, Telegram, Email |
| Поведение при отсутствии ответа | Предлагает связаться с оператором |
**Пример работы:**
```
Клиент: "Как оплатить заказ?"
Агент: [Ищет в таблице FAQ → находит ответ с Score < 300]
"Мы принимаем оплату банковской картой, через PayPal
или банковским переводом. Чем ещё могу помочь?"
```
### 2. Контент-редактор
**Задача**: создавать контент для соцсетей, блога, рассылок по стилю компании.
| Параметр | Значение |
|----------|----------|
| Режим | Креативный — генерирует на основе инструкций и примеров |
| temperature | 0.7 |
| RAG-таблицы | Инструкции платформ, Стиль компании, Примеры контента, Ключевые слова, CTA-блоки |
| Каналы | Веб-интерфейс `/content-editor` |
| Доступ | Пользователи с ролью Editor |
**Интерфейс:**
- Поле ввода задачи
- Выбор типа контента (пост ВК, статья блога, email-рассылка)
- Выбор платформы
- Генерация → редактирование → сохранение/экспорт
- История созданного контента
### 3. AI-закупщик
**Задача**: помогать с выбором поставщиков и анализом условий.
| Параметр | Значение |
|----------|----------|
| Режим | Гибридный |
| temperature | 0.5 |
| RAG-таблицы | База поставщиков, Условия и прайсы |
| Каналы | Веб-интерфейс |
| Доступ | Менеджеры по закупкам |
**Пример работы:**
```
Менеджер: "Кто поставляет электронику с доставкой до 3 дней?"
Агент: [Ищет в таблице поставщиков, фильтрует по категории и срокам]
"ТОП-3 поставщика электроники с доставкой до 3 дней:
1. ООО «Техноснаб» — рейтинг 9/10, доставка 2 дня
2. ..."
```
### 4. Другие возможные агенты
| Агент | Задача | RAG-таблицы |
|-------|--------|-------------|
| **Аналитик** | Анализ данных, создание отчётов, выявление трендов | Метрики, KPI, Отчёты |
| **HR-ассистент** | Скрининг резюме, ответы сотрудникам, планирование обучения | База знаний для сотрудников, HR-политики |
| **Переводчик** | Перевод документов, локализация контента | Глоссарии, Стиль для разных языков |
| **Юрист-помощник** | Анализ договоров, ответы на правовые вопросы | Шаблоны договоров, Нормативные акты |
Количество агентов не ограничено. Каждый новый агент — это новая комбинация промпта, правил и подключённых таблиц.
---
## Технологический стек
| Компонент | Технология | Назначение |
|-----------|------------|------------|
| LLM | Ollama (qwen2.5:7b или любая другая) | Генерация ответов, диалог |
| Embedding | mxbai-embed-large | Векторизация текста для поиска |
| Векторная БД | FAISS | Быстрый семантический поиск |
| Основная БД | PostgreSQL | Хранение настроек агентов, баз знаний, истории |
| Кэш | Node.js Map + TTL | Ускорение повторных запросов (< 50ms) |
| Очередь | AI Queue | Обработка задач по приоритету |
| Шифрование | AES-256 | Все промпты и настройки зашифрованы |
### Методы поиска (RAG)
| Метод | Описание | Когда использовать |
|-------|----------|-------------------|
| Семантический | Поиск по смыслу через FAISS | Когда важна точность понимания |
| По ключевым словам | Быстрый текстовый поиск | Когда важна скорость |
| Гибридный | 70% семантика + 30% ключевые слова | Рекомендуется по умолчанию |
Дополнительно: нечёткий поиск (опечатки), стемминг (разные формы слов), извлечение ключевых слов.
---
## Преимущества перед облачными решениями
| Характеристика | DLE (локальный) | ChatGPT API | Claude API |
|----------------|----------------|-------------|------------|
| **Стоимость** | $0 | ~$0.02/запрос | ~$0.03/запрос |
| **Конфиденциальность** | 100% данные на вашем сервере | Данные у OpenAI | Данные у Anthropic |
| **Скорость (кэш)** | < 50ms | 5002000ms | 5002000ms |
| **Offline-работа** | Да | Нет | Нет |
| **Настройка под бизнес** | Полная: промпты, правила, RAG | Ограниченная | Ограниченная |
| **Лимиты API** | Нет | Есть | Есть |
| **Количество агентов** | Неограничено | Нужен отдельный API-вызов | Нужен отдельный API-вызов |
| **Множественные базы знаний** | Да, изолированные RAG-таблицы | Нет нативной поддержки | Нет нативной поддержки |
---
## Экономический эффект
### Экономия на API-запросах
| Объём запросов | ChatGPT API | Claude API | DLE |
|---------------|-------------|------------|-----|
| 10,000/мес | $2,400/год | $3,600/год | $0 |
| 50,000/мес | $12,000/год | $18,000/год | $0 |
| 100,000/мес | $24,000/год | $36,000/год | $0 |
### Экономия на автоматизации процессов
Каждый агент заменяет рутинную работу сотрудников. Расчёт для компании среднего размера:
| Агент | Что автоматизирует | Экономия в год |
|-------|--------------------|----------------|
| Агент поддержки | Ответы на типовые вопросы 24/7 (вместо 1-2 операторов) | $57,600 |
| AI-закупщик | Поиск и сравнение поставщиков (вместо ручного анализа) | $64,800 |
| HR-ассистент | Скрининг резюме, ответы сотрудникам | $57,600 |
| Контент-редактор | Генерация постов, рассылок, статей | $86,400 |
| Аналитик | Отчётность, анализ данных, мониторинг KPI | $144,000 |
| Агент по работе с партнёрами | Коммуникации, подготовка документов | $43,200 |
| Обучение персонала | Персонализированные программы, тесты знаний | $30,000 |
| Экономия на API | Отсутствие платы за облачные API | $24,00036,000 |
| **Итого** | | **$507,600519,600** |
**Стоимость DLE**: $1,000 (единоразово)
### Сравнение с SaaS за 5 лет
```
Типичный SaaS-стек:
CRM (HubSpot): $200/мес × 60 = $12,000
Чат-бот (Intercom): $150/мес × 60 = $9,000
Email (SendGrid): $100/мес × 60 = $6,000
AI (ChatGPT API): $200/мес × 60 = $12,000
─────────────────────────────────────────────
Итого SaaS: $39,000
DLE:
Лицензия: $1,000
AI без лимитов: $0
Обновления 5 лет: $0
─────────────────────────────────────────────
Итого DLE: $1,000
Экономия за 5 лет: $38,000
```
---
## Дополнительные материалы
- [Архитектура множественных ИИ-агентов](./back-docs/multi-agent-architecture.md) детальная техническая спецификация
- [Настройка AI-ассистента](./back-docs/setup-ai-assistant.md) пошаговая инструкция по развёртыванию
- [Система электронных таблиц](./back-docs/tables-system.md) как устроены RAG-таблицы
- [FAQ](./FAQ.md) частые вопросы
---
## Поддержка
- **Email**: info@hb3-accelerator.com
- **Чат**: https://hb3-accelerator.com
- **Документация**: [FAQ](./FAQ.md)
---
**© 2024-2025 Тарабанов Александр Викторович. Все права защищены.**
**Последнее обновление**: Февраль 2026