373 lines
21 KiB
Markdown
373 lines
21 KiB
Markdown
[English](../docs.en/ai-assistant.md) | **Русский**
|
||
|
||
# ИИ-агенты DLE — система создания специализированных агентов для бизнеса
|
||
|
||
> **Концепция**: одна локальная модель — множество специализированных агентов. Каждый агент заточен под конкретный бизнес-процесс: свой промпт, свои правила, своя база знаний, свой интерфейс.
|
||
|
||
## Содержание
|
||
|
||
1. [Что это и зачем](#что-это-и-зачем)
|
||
2. [Архитектура](#архитектура)
|
||
3. [Как создать агента](#как-создать-агента)
|
||
4. [Примеры агентов](#примеры-агентов)
|
||
5. [Технологический стек](#технологический-стек)
|
||
6. [Преимущества перед облачными решениями](#преимущества-перед-облачными-решениями)
|
||
7. [Экономический эффект](#экономический-эффект)
|
||
|
||
---
|
||
|
||
## Что это и зачем
|
||
|
||
DLE предоставляет **инструменты для создания ИИ-агентов** — специализированных помощников, каждый из которых отвечает за отдельный бизнес-процесс.
|
||
|
||
Это не один универсальный чат-бот. Это **конструктор**, в котором вы:
|
||
|
||
- Создаёте агента под конкретную задачу (поддержка клиентов, контент, закупки, аналитика)
|
||
- Задаёте ему роль через системный промпт
|
||
- Подключаете базу знаний (RAG-таблицы) с релевантными данными
|
||
- Настраиваете правила поведения (строгий режим, креативный, гибридный)
|
||
- Привязываете к каналам (веб-чат, Telegram, Email)
|
||
- Получаете изолированного специалиста, который работает 24/7
|
||
|
||
Все агенты используют **одну локальную модель Ollama** на вашем сервере. Различие между ними — в системных промптах, правилах и подключённых данных. Данные не покидают ваш сервер.
|
||
|
||
---
|
||
|
||
## Архитектура
|
||
|
||
### Принцип: одна модель — множество агентов
|
||
|
||
```
|
||
┌──────────────────────────────────────────────────────┐
|
||
│ Локальная модель Ollama (qwen2.5:7b) │
|
||
│ Единая для всех агентов │
|
||
└───────────┬──────────────┬───────────────┬───────────┘
|
||
│ │ │
|
||
↓ ↓ ↓
|
||
┌───────────────┐ ┌────────────────┐ ┌──────────────┐
|
||
│ Агент │ │ Агент │ │ Агент │
|
||
│ поддержки │ │ контент- │ │ закупок │
|
||
│ │ │ редактор │ │ │
|
||
│ Промпт: │ │ Промпт: │ │ Промпт: │
|
||
│ "Вы — │ │ "Вы — │ │ "Вы — │
|
||
│ ассистент │ │ контент- │ │ специалист │
|
||
│ поддержки" │ │ маркетолог" │ │ по закупкам"│
|
||
│ │ │ │ │ │
|
||
│ RAG: FAQ, │ │ RAG: стиль, │ │ RAG: база │
|
||
│ документация │ │ инструкции, │ │ поставщиков, │
|
||
│ │ │ примеры │ │ условия │
|
||
│ │ │ │ │ │
|
||
│ Правила: │ │ Правила: │ │ Правила: │
|
||
│ строгий │ │ креативный │ │ гибридный │
|
||
│ (t=0.3) │ │ (t=0.7) │ │ (t=0.5) │
|
||
│ │ │ │ │ │
|
||
│ Каналы: │ │ Каналы: │ │ Каналы: │
|
||
│ чат, TG, │ │ веб-интерфейс │ │ веб-интерфейс│
|
||
│ email │ │ /content-editor│ │ │
|
||
└───────────────┘ └────────────────┘ └──────────────┘
|
||
```
|
||
|
||
### Изоляция агентов
|
||
|
||
Каждый агент полностью изолирован:
|
||
|
||
| Параметр | Изоляция |
|
||
|----------|----------|
|
||
| Системный промпт | Свой для каждого агента |
|
||
| Правила (Rules) | Свой набор: temperature, maxTokens, режим RAG |
|
||
| RAG-таблицы | Агент видит только свои подключённые таблицы |
|
||
| Каналы | Отдельная привязка к веб-чату, Telegram, Email |
|
||
| Интерфейс | Свой маршрут и UI |
|
||
| Права доступа | Раздельные permissions |
|
||
|
||
Агенты не влияют друг на друга: можно создавать, менять и удалять их независимо.
|
||
|
||
### Обработка запроса
|
||
|
||
```
|
||
Запрос пользователя
|
||
↓
|
||
Определение агента (по каналу / маршруту)
|
||
↓
|
||
Загрузка настроек агента (промпт, правила, RAG-таблицы)
|
||
↓
|
||
Векторизация запроса (Ollama mxbai-embed-large → вектор [768])
|
||
↓
|
||
RAG-поиск по подключённым таблицам (FAISS)
|
||
↓
|
||
Генерация ответа (LLM с контекстом из RAG + системный промпт + история)
|
||
↓
|
||
Кэширование ответа (TTL 1 час, повторный запрос < 50ms)
|
||
↓
|
||
Ответ пользователю
|
||
```
|
||
|
||
---
|
||
|
||
## Как создать агента
|
||
|
||
### Шаг 1. Базовая информация
|
||
|
||
- **Название** — «Агент поддержки», «Контент-редактор», «AI-закупщик»
|
||
- **Роль** — support, content_editor, analyst, purchaser и т.д.
|
||
- **Описание** — для чего агент создан
|
||
|
||
### Шаг 2. Системный промпт
|
||
|
||
Определяет личность и поведение агента. Примеры:
|
||
|
||
**Для агента поддержки:**
|
||
```
|
||
Вы — профессиональный ассистент службы поддержки компании "Название".
|
||
|
||
Правила:
|
||
1. Отвечайте ТОЛЬКО на основе базы знаний
|
||
2. Если ответа нет — предложите связаться с оператором
|
||
3. Не придумывайте информацию о ценах, сроках, условиях
|
||
4. Обращайтесь к клиенту на "Вы"
|
||
5. Заканчивайте: "Чем ещё могу помочь?"
|
||
```
|
||
|
||
**Для контент-редактора:**
|
||
```
|
||
Вы — профессиональный контент-маркетолог и редактор компании "Название".
|
||
|
||
Правила:
|
||
1. Используйте стиль компании из базы знаний
|
||
2. Следуйте инструкциям конкретной платформы (ВК, Telegram, и т.д.)
|
||
3. Используйте ключевые слова и хэштеги из базы
|
||
4. Добавляйте CTA-блоки из базы
|
||
```
|
||
|
||
### Шаг 3. Правила (Rules)
|
||
|
||
JSON-конфигурация поведения агента:
|
||
|
||
```json
|
||
{
|
||
"searchRagFirst": true,
|
||
"generateIfNoRag": false,
|
||
"checkUserTags": true,
|
||
"temperature": 0.3,
|
||
"maxTokens": 500
|
||
}
|
||
```
|
||
|
||
| Параметр | Что делает | Поддержка | Контент | Аналитика |
|
||
|----------|-----------|-----------|---------|-----------|
|
||
| `temperature` | Степень креативности (0.0–1.0) | 0.3 | 0.7 | 0.2 |
|
||
| `searchRagFirst` | Сначала искать в базе знаний | true | true | true |
|
||
| `generateIfNoRag` | Генерировать, если не нашёл в базе | false | true | false |
|
||
| `maxTokens` | Максимальная длина ответа | 500 | 2000 | 1000 |
|
||
| `checkUserTags` | Учитывать теги пользователя | true | false | true |
|
||
|
||
### Шаг 4. База знаний (RAG-таблицы)
|
||
|
||
Подключите электронные таблицы, по которым агент будет искать информацию:
|
||
|
||
- **Агент поддержки** → таблицы «FAQ», «Документация продукта»
|
||
- **Контент-редактор** → таблицы «Инструкции платформ», «Стиль компании», «Примеры контента», «Ключевые слова»
|
||
- **AI-закупщик** → таблицы «База поставщиков», «Условия и прайсы»
|
||
|
||
Каждая таблица должна иметь столбцы с назначениями «Вопрос для AI» и «Ответ AI» — они автоматически индексируются для векторного поиска.
|
||
|
||
### Шаг 5. Каналы и интерфейс
|
||
|
||
| Параметр | Описание |
|
||
|----------|----------|
|
||
| Каналы | веб-чат, Telegram, Email, SMS |
|
||
| Маршрут | URL интерфейса агента (например, `/content-editor`) |
|
||
| Права доступа | Какие роли пользователей имеют доступ |
|
||
|
||
### Шаг 6. Активация
|
||
|
||
Включите агента — он начнёт обрабатывать запросы по подключённым каналам.
|
||
|
||
---
|
||
|
||
## Примеры агентов
|
||
|
||
### 1. Агент поддержки клиентов
|
||
|
||
**Задача**: отвечать на вопросы клиентов 24/7 на основе базы знаний.
|
||
|
||
| Параметр | Значение |
|
||
|----------|----------|
|
||
| Режим | Строгий — только из базы знаний |
|
||
| temperature | 0.3 |
|
||
| RAG-таблицы | FAQ, Документация, База знаний для клиентов |
|
||
| Каналы | Веб-чат, Telegram, Email |
|
||
| Поведение при отсутствии ответа | Предлагает связаться с оператором |
|
||
|
||
**Пример работы:**
|
||
```
|
||
Клиент: "Как оплатить заказ?"
|
||
Агент: [Ищет в таблице FAQ → находит ответ с Score < 300]
|
||
"Мы принимаем оплату банковской картой, через PayPal
|
||
или банковским переводом. Чем ещё могу помочь?"
|
||
```
|
||
|
||
### 2. Контент-редактор
|
||
|
||
**Задача**: создавать контент для соцсетей, блога, рассылок по стилю компании.
|
||
|
||
| Параметр | Значение |
|
||
|----------|----------|
|
||
| Режим | Креативный — генерирует на основе инструкций и примеров |
|
||
| temperature | 0.7 |
|
||
| RAG-таблицы | Инструкции платформ, Стиль компании, Примеры контента, Ключевые слова, CTA-блоки |
|
||
| Каналы | Веб-интерфейс `/content-editor` |
|
||
| Доступ | Пользователи с ролью Editor |
|
||
|
||
**Интерфейс:**
|
||
- Поле ввода задачи
|
||
- Выбор типа контента (пост ВК, статья блога, email-рассылка)
|
||
- Выбор платформы
|
||
- Генерация → редактирование → сохранение/экспорт
|
||
- История созданного контента
|
||
|
||
### 3. AI-закупщик
|
||
|
||
**Задача**: помогать с выбором поставщиков и анализом условий.
|
||
|
||
| Параметр | Значение |
|
||
|----------|----------|
|
||
| Режим | Гибридный |
|
||
| temperature | 0.5 |
|
||
| RAG-таблицы | База поставщиков, Условия и прайсы |
|
||
| Каналы | Веб-интерфейс |
|
||
| Доступ | Менеджеры по закупкам |
|
||
|
||
**Пример работы:**
|
||
```
|
||
Менеджер: "Кто поставляет электронику с доставкой до 3 дней?"
|
||
Агент: [Ищет в таблице поставщиков, фильтрует по категории и срокам]
|
||
"ТОП-3 поставщика электроники с доставкой до 3 дней:
|
||
1. ООО «Техноснаб» — рейтинг 9/10, доставка 2 дня
|
||
2. ..."
|
||
```
|
||
|
||
### 4. Другие возможные агенты
|
||
|
||
| Агент | Задача | RAG-таблицы |
|
||
|-------|--------|-------------|
|
||
| **Аналитик** | Анализ данных, создание отчётов, выявление трендов | Метрики, KPI, Отчёты |
|
||
| **HR-ассистент** | Скрининг резюме, ответы сотрудникам, планирование обучения | База знаний для сотрудников, HR-политики |
|
||
| **Переводчик** | Перевод документов, локализация контента | Глоссарии, Стиль для разных языков |
|
||
| **Юрист-помощник** | Анализ договоров, ответы на правовые вопросы | Шаблоны договоров, Нормативные акты |
|
||
|
||
Количество агентов не ограничено. Каждый новый агент — это новая комбинация промпта, правил и подключённых таблиц.
|
||
|
||
---
|
||
|
||
## Технологический стек
|
||
|
||
| Компонент | Технология | Назначение |
|
||
|-----------|------------|------------|
|
||
| LLM | Ollama (qwen2.5:7b или любая другая) | Генерация ответов, диалог |
|
||
| Embedding | mxbai-embed-large | Векторизация текста для поиска |
|
||
| Векторная БД | FAISS | Быстрый семантический поиск |
|
||
| Основная БД | PostgreSQL | Хранение настроек агентов, баз знаний, истории |
|
||
| Кэш | Node.js Map + TTL | Ускорение повторных запросов (< 50ms) |
|
||
| Очередь | AI Queue | Обработка задач по приоритету |
|
||
| Шифрование | AES-256 | Все промпты и настройки зашифрованы |
|
||
|
||
### Методы поиска (RAG)
|
||
|
||
| Метод | Описание | Когда использовать |
|
||
|-------|----------|-------------------|
|
||
| Семантический | Поиск по смыслу через FAISS | Когда важна точность понимания |
|
||
| По ключевым словам | Быстрый текстовый поиск | Когда важна скорость |
|
||
| Гибридный | 70% семантика + 30% ключевые слова | Рекомендуется по умолчанию |
|
||
|
||
Дополнительно: нечёткий поиск (опечатки), стемминг (разные формы слов), извлечение ключевых слов.
|
||
|
||
---
|
||
|
||
## Преимущества перед облачными решениями
|
||
|
||
| Характеристика | DLE (локальный) | ChatGPT API | Claude API |
|
||
|----------------|----------------|-------------|------------|
|
||
| **Стоимость** | $0 | ~$0.02/запрос | ~$0.03/запрос |
|
||
| **Конфиденциальность** | 100% — данные на вашем сервере | Данные у OpenAI | Данные у Anthropic |
|
||
| **Скорость (кэш)** | < 50ms | 500–2000ms | 500–2000ms |
|
||
| **Offline-работа** | Да | Нет | Нет |
|
||
| **Настройка под бизнес** | Полная: промпты, правила, RAG | Ограниченная | Ограниченная |
|
||
| **Лимиты API** | Нет | Есть | Есть |
|
||
| **Количество агентов** | Неограничено | Нужен отдельный API-вызов | Нужен отдельный API-вызов |
|
||
| **Множественные базы знаний** | Да, изолированные RAG-таблицы | Нет нативной поддержки | Нет нативной поддержки |
|
||
|
||
---
|
||
|
||
## Экономический эффект
|
||
|
||
### Экономия на API-запросах
|
||
|
||
| Объём запросов | ChatGPT API | Claude API | DLE |
|
||
|---------------|-------------|------------|-----|
|
||
| 10,000/мес | $2,400/год | $3,600/год | $0 |
|
||
| 50,000/мес | $12,000/год | $18,000/год | $0 |
|
||
| 100,000/мес | $24,000/год | $36,000/год | $0 |
|
||
|
||
### Экономия на автоматизации процессов
|
||
|
||
Каждый агент заменяет рутинную работу сотрудников. Расчёт для компании среднего размера:
|
||
|
||
| Агент | Что автоматизирует | Экономия в год |
|
||
|-------|--------------------|----------------|
|
||
| Агент поддержки | Ответы на типовые вопросы 24/7 (вместо 1-2 операторов) | $57,600 |
|
||
| AI-закупщик | Поиск и сравнение поставщиков (вместо ручного анализа) | $64,800 |
|
||
| HR-ассистент | Скрининг резюме, ответы сотрудникам | $57,600 |
|
||
| Контент-редактор | Генерация постов, рассылок, статей | $86,400 |
|
||
| Аналитик | Отчётность, анализ данных, мониторинг KPI | $144,000 |
|
||
| Агент по работе с партнёрами | Коммуникации, подготовка документов | $43,200 |
|
||
| Обучение персонала | Персонализированные программы, тесты знаний | $30,000 |
|
||
| Экономия на API | Отсутствие платы за облачные API | $24,000–36,000 |
|
||
| **Итого** | | **$507,600–519,600** |
|
||
|
||
**Стоимость DLE**: $1,000 (единоразово)
|
||
|
||
### Сравнение с SaaS за 5 лет
|
||
|
||
```
|
||
Типичный SaaS-стек:
|
||
CRM (HubSpot): $200/мес × 60 = $12,000
|
||
Чат-бот (Intercom): $150/мес × 60 = $9,000
|
||
Email (SendGrid): $100/мес × 60 = $6,000
|
||
AI (ChatGPT API): $200/мес × 60 = $12,000
|
||
─────────────────────────────────────────────
|
||
Итого SaaS: $39,000
|
||
|
||
DLE:
|
||
Лицензия: $1,000
|
||
AI без лимитов: $0
|
||
Обновления 5 лет: $0
|
||
─────────────────────────────────────────────
|
||
Итого DLE: $1,000
|
||
|
||
Экономия за 5 лет: $38,000
|
||
```
|
||
|
||
---
|
||
|
||
## Дополнительные материалы
|
||
|
||
- [Архитектура множественных ИИ-агентов](./back-docs/multi-agent-architecture.md) — детальная техническая спецификация
|
||
- [Настройка AI-ассистента](./back-docs/setup-ai-assistant.md) — пошаговая инструкция по развёртыванию
|
||
- [Система электронных таблиц](./back-docs/tables-system.md) — как устроены RAG-таблицы
|
||
- [FAQ](https://github.com/VC-HB3-Accelerator/.github/blob/main/ru/FAQ.md) — частые вопросы
|
||
|
||
---
|
||
|
||
## Поддержка
|
||
|
||
- **Email**: info@hb3-accelerator.com
|
||
- **Чат**: https://hb3-accelerator.com
|
||
- **Документация**: [FAQ](https://github.com/VC-HB3-Accelerator/.github/blob/main/ru/FAQ.md)
|
||
|
||
---
|
||
|
||
**© 2024-2026 Тарабанов Александр Викторович. Все права защищены.**
|
||
|
||
**Последнее обновление**: Февраль 2026
|