Files
DLE/docs.ru/ai-assistant.md
2026-03-01 22:03:48 +03:00

373 lines
21 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

[English](../docs.en/ai-assistant.md) | **Русский**
# ИИ-агенты DLE — система создания специализированных агентов для бизнеса
> **Концепция**: одна локальная модель — множество специализированных агентов. Каждый агент заточен под конкретный бизнес-процесс: свой промпт, свои правила, своя база знаний, свой интерфейс.
## Содержание
1. [Что это и зачем](#что-это-и-зачем)
2. [Архитектура](#архитектура)
3. [Как создать агента](#как-создать-агента)
4. [Примеры агентов](#примеры-агентов)
5. [Технологический стек](#технологический-стек)
6. [Преимущества перед облачными решениями](#преимущества-перед-облачными-решениями)
7. [Экономический эффект](#экономический-эффект)
---
## Что это и зачем
DLE предоставляет **инструменты для создания ИИ-агентов** — специализированных помощников, каждый из которых отвечает за отдельный бизнес-процесс.
Это не один универсальный чат-бот. Это **конструктор**, в котором вы:
- Создаёте агента под конкретную задачу (поддержка клиентов, контент, закупки, аналитика)
- Задаёте ему роль через системный промпт
- Подключаете базу знаний (RAG-таблицы) с релевантными данными
- Настраиваете правила поведения (строгий режим, креативный, гибридный)
- Привязываете к каналам (веб-чат, Telegram, Email)
- Получаете изолированного специалиста, который работает 24/7
Все агенты используют **одну локальную модель Ollama** на вашем сервере. Различие между ними — в системных промптах, правилах и подключённых данных. Данные не покидают ваш сервер.
---
## Архитектура
### Принцип: одна модель — множество агентов
```
┌──────────────────────────────────────────────────────┐
│ Локальная модель Ollama (qwen2.5:7b) │
│ Единая для всех агентов │
└───────────┬──────────────┬───────────────┬───────────┘
│ │ │
↓ ↓ ↓
┌───────────────┐ ┌────────────────┐ ┌──────────────┐
│ Агент │ │ Агент │ │ Агент │
│ поддержки │ │ контент- │ │ закупок │
│ │ │ редактор │ │ │
│ Промпт: │ │ Промпт: │ │ Промпт: │
│ "Вы — │ │ "Вы — │ │ "Вы — │
│ ассистент │ │ контент- │ │ специалист │
│ поддержки" │ │ маркетолог" │ │ по закупкам"│
│ │ │ │ │ │
│ RAG: FAQ, │ │ RAG: стиль, │ │ RAG: база │
│ документация │ │ инструкции, │ │ поставщиков, │
│ │ │ примеры │ │ условия │
│ │ │ │ │ │
│ Правила: │ │ Правила: │ │ Правила: │
│ строгий │ │ креативный │ │ гибридный │
│ (t=0.3) │ │ (t=0.7) │ │ (t=0.5) │
│ │ │ │ │ │
│ Каналы: │ │ Каналы: │ │ Каналы: │
│ чат, TG, │ │ веб-интерфейс │ │ веб-интерфейс│
│ email │ │ /content-editor│ │ │
└───────────────┘ └────────────────┘ └──────────────┘
```
### Изоляция агентов
Каждый агент полностью изолирован:
| Параметр | Изоляция |
|----------|----------|
| Системный промпт | Свой для каждого агента |
| Правила (Rules) | Свой набор: temperature, maxTokens, режим RAG |
| RAG-таблицы | Агент видит только свои подключённые таблицы |
| Каналы | Отдельная привязка к веб-чату, Telegram, Email |
| Интерфейс | Свой маршрут и UI |
| Права доступа | Раздельные permissions |
Агенты не влияют друг на друга: можно создавать, менять и удалять их независимо.
### Обработка запроса
```
Запрос пользователя
Определение агента (по каналу / маршруту)
Загрузка настроек агента (промпт, правила, RAG-таблицы)
Векторизация запроса (Ollama mxbai-embed-large → вектор [768])
RAG-поиск по подключённым таблицам (FAISS)
Генерация ответа (LLM с контекстом из RAG + системный промпт + история)
Кэширование ответа (TTL 1 час, повторный запрос < 50ms)
Ответ пользователю
```
---
## Как создать агента
### Шаг 1. Базовая информация
- **Название** — «Агент поддержки», «Контент-редактор», «AI-закупщик»
- **Роль** — support, content_editor, analyst, purchaser и т.д.
- **Описание** — для чего агент создан
### Шаг 2. Системный промпт
Определяет личность и поведение агента. Примеры:
**Для агента поддержки:**
```
Вы — профессиональный ассистент службы поддержки компании "Название".
Правила:
1. Отвечайте ТОЛЬКО на основе базы знаний
2. Если ответа нет — предложите связаться с оператором
3. Не придумывайте информацию о ценах, сроках, условиях
4. Обращайтесь к клиенту на "Вы"
5. Заканчивайте: "Чем ещё могу помочь?"
```
**Для контент-редактора:**
```
Вы — профессиональный контент-маркетолог и редактор компании "Название".
Правила:
1. Используйте стиль компании из базы знаний
2. Следуйте инструкциям конкретной платформы (ВК, Telegram, и т.д.)
3. Используйте ключевые слова и хэштеги из базы
4. Добавляйте CTA-блоки из базы
```
### Шаг 3. Правила (Rules)
JSON-конфигурация поведения агента:
```json
{
"searchRagFirst": true,
"generateIfNoRag": false,
"checkUserTags": true,
"temperature": 0.3,
"maxTokens": 500
}
```
| Параметр | Что делает | Поддержка | Контент | Аналитика |
|----------|-----------|-----------|---------|-----------|
| `temperature` | Степень креативности (0.01.0) | 0.3 | 0.7 | 0.2 |
| `searchRagFirst` | Сначала искать в базе знаний | true | true | true |
| `generateIfNoRag` | Генерировать, если не нашёл в базе | false | true | false |
| `maxTokens` | Максимальная длина ответа | 500 | 2000 | 1000 |
| `checkUserTags` | Учитывать теги пользователя | true | false | true |
### Шаг 4. База знаний (RAG-таблицы)
Подключите электронные таблицы, по которым агент будет искать информацию:
- **Агент поддержки** → таблицы «FAQ», «Документация продукта»
- **Контент-редактор** → таблицы «Инструкции платформ», «Стиль компании», «Примеры контента», «Ключевые слова»
- **AI-закупщик** → таблицы «База поставщиков», «Условия и прайсы»
Каждая таблица должна иметь столбцы с назначениями «Вопрос для AI» и «Ответ AI» — они автоматически индексируются для векторного поиска.
### Шаг 5. Каналы и интерфейс
| Параметр | Описание |
|----------|----------|
| Каналы | веб-чат, Telegram, Email, SMS |
| Маршрут | URL интерфейса агента (например, `/content-editor`) |
| Права доступа | Какие роли пользователей имеют доступ |
### Шаг 6. Активация
Включите агента — он начнёт обрабатывать запросы по подключённым каналам.
---
## Примеры агентов
### 1. Агент поддержки клиентов
**Задача**: отвечать на вопросы клиентов 24/7 на основе базы знаний.
| Параметр | Значение |
|----------|----------|
| Режим | Строгий — только из базы знаний |
| temperature | 0.3 |
| RAG-таблицы | FAQ, Документация, База знаний для клиентов |
| Каналы | Веб-чат, Telegram, Email |
| Поведение при отсутствии ответа | Предлагает связаться с оператором |
**Пример работы:**
```
Клиент: "Как оплатить заказ?"
Агент: [Ищет в таблице FAQ → находит ответ с Score < 300]
"Мы принимаем оплату банковской картой, через PayPal
или банковским переводом. Чем ещё могу помочь?"
```
### 2. Контент-редактор
**Задача**: создавать контент для соцсетей, блога, рассылок по стилю компании.
| Параметр | Значение |
|----------|----------|
| Режим | Креативный — генерирует на основе инструкций и примеров |
| temperature | 0.7 |
| RAG-таблицы | Инструкции платформ, Стиль компании, Примеры контента, Ключевые слова, CTA-блоки |
| Каналы | Веб-интерфейс `/content-editor` |
| Доступ | Пользователи с ролью Editor |
**Интерфейс:**
- Поле ввода задачи
- Выбор типа контента (пост ВК, статья блога, email-рассылка)
- Выбор платформы
- Генерация → редактирование → сохранение/экспорт
- История созданного контента
### 3. AI-закупщик
**Задача**: помогать с выбором поставщиков и анализом условий.
| Параметр | Значение |
|----------|----------|
| Режим | Гибридный |
| temperature | 0.5 |
| RAG-таблицы | База поставщиков, Условия и прайсы |
| Каналы | Веб-интерфейс |
| Доступ | Менеджеры по закупкам |
**Пример работы:**
```
Менеджер: "Кто поставляет электронику с доставкой до 3 дней?"
Агент: [Ищет в таблице поставщиков, фильтрует по категории и срокам]
"ТОП-3 поставщика электроники с доставкой до 3 дней:
1. ООО «Техноснаб» — рейтинг 9/10, доставка 2 дня
2. ..."
```
### 4. Другие возможные агенты
| Агент | Задача | RAG-таблицы |
|-------|--------|-------------|
| **Аналитик** | Анализ данных, создание отчётов, выявление трендов | Метрики, KPI, Отчёты |
| **HR-ассистент** | Скрининг резюме, ответы сотрудникам, планирование обучения | База знаний для сотрудников, HR-политики |
| **Переводчик** | Перевод документов, локализация контента | Глоссарии, Стиль для разных языков |
| **Юрист-помощник** | Анализ договоров, ответы на правовые вопросы | Шаблоны договоров, Нормативные акты |
Количество агентов не ограничено. Каждый новый агент — это новая комбинация промпта, правил и подключённых таблиц.
---
## Технологический стек
| Компонент | Технология | Назначение |
|-----------|------------|------------|
| LLM | Ollama (qwen2.5:7b или любая другая) | Генерация ответов, диалог |
| Embedding | mxbai-embed-large | Векторизация текста для поиска |
| Векторная БД | FAISS | Быстрый семантический поиск |
| Основная БД | PostgreSQL | Хранение настроек агентов, баз знаний, истории |
| Кэш | Node.js Map + TTL | Ускорение повторных запросов (< 50ms) |
| Очередь | AI Queue | Обработка задач по приоритету |
| Шифрование | AES-256 | Все промпты и настройки зашифрованы |
### Методы поиска (RAG)
| Метод | Описание | Когда использовать |
|-------|----------|-------------------|
| Семантический | Поиск по смыслу через FAISS | Когда важна точность понимания |
| По ключевым словам | Быстрый текстовый поиск | Когда важна скорость |
| Гибридный | 70% семантика + 30% ключевые слова | Рекомендуется по умолчанию |
Дополнительно: нечёткий поиск (опечатки), стемминг (разные формы слов), извлечение ключевых слов.
---
## Преимущества перед облачными решениями
| Характеристика | DLE (локальный) | ChatGPT API | Claude API |
|----------------|----------------|-------------|------------|
| **Стоимость** | $0 | ~$0.02/запрос | ~$0.03/запрос |
| **Конфиденциальность** | 100% данные на вашем сервере | Данные у OpenAI | Данные у Anthropic |
| **Скорость (кэш)** | < 50ms | 5002000ms | 5002000ms |
| **Offline-работа** | Да | Нет | Нет |
| **Настройка под бизнес** | Полная: промпты, правила, RAG | Ограниченная | Ограниченная |
| **Лимиты API** | Нет | Есть | Есть |
| **Количество агентов** | Неограничено | Нужен отдельный API-вызов | Нужен отдельный API-вызов |
| **Множественные базы знаний** | Да, изолированные RAG-таблицы | Нет нативной поддержки | Нет нативной поддержки |
---
## Экономический эффект
### Экономия на API-запросах
| Объём запросов | ChatGPT API | Claude API | DLE |
|---------------|-------------|------------|-----|
| 10,000/мес | $2,400/год | $3,600/год | $0 |
| 50,000/мес | $12,000/год | $18,000/год | $0 |
| 100,000/мес | $24,000/год | $36,000/год | $0 |
### Экономия на автоматизации процессов
Каждый агент заменяет рутинную работу сотрудников. Расчёт для компании среднего размера:
| Агент | Что автоматизирует | Экономия в год |
|-------|--------------------|----------------|
| Агент поддержки | Ответы на типовые вопросы 24/7 (вместо 1-2 операторов) | $57,600 |
| AI-закупщик | Поиск и сравнение поставщиков (вместо ручного анализа) | $64,800 |
| HR-ассистент | Скрининг резюме, ответы сотрудникам | $57,600 |
| Контент-редактор | Генерация постов, рассылок, статей | $86,400 |
| Аналитик | Отчётность, анализ данных, мониторинг KPI | $144,000 |
| Агент по работе с партнёрами | Коммуникации, подготовка документов | $43,200 |
| Обучение персонала | Персонализированные программы, тесты знаний | $30,000 |
| Экономия на API | Отсутствие платы за облачные API | $24,00036,000 |
| **Итого** | | **$507,600519,600** |
**Стоимость DLE**: $1,000 (единоразово)
### Сравнение с SaaS за 5 лет
```
Типичный SaaS-стек:
CRM (HubSpot): $200/мес × 60 = $12,000
Чат-бот (Intercom): $150/мес × 60 = $9,000
Email (SendGrid): $100/мес × 60 = $6,000
AI (ChatGPT API): $200/мес × 60 = $12,000
─────────────────────────────────────────────
Итого SaaS: $39,000
DLE:
Лицензия: $1,000
AI без лимитов: $0
Обновления 5 лет: $0
─────────────────────────────────────────────
Итого DLE: $1,000
Экономия за 5 лет: $38,000
```
---
## Дополнительные материалы
- [Архитектура множественных ИИ-агентов](./back-docs/multi-agent-architecture.md) детальная техническая спецификация
- [Настройка AI-ассистента](./back-docs/setup-ai-assistant.md) пошаговая инструкция по развёртыванию
- [Система электронных таблиц](./back-docs/tables-system.md) как устроены RAG-таблицы
- [FAQ](https://github.com/VC-HB3-Accelerator/.github/blob/main/ru/FAQ.md) частые вопросы
---
## Поддержка
- **Email**: info@hb3-accelerator.com
- **Чат**: https://hb3-accelerator.com
- **Документация**: [FAQ](https://github.com/VC-HB3-Accelerator/.github/blob/main/ru/FAQ.md)
---
**© 2024-2026 Тарабанов Александр Викторович. Все права защищены.**
**Последнее обновление**: Февраль 2026