База знаний — то, на что опирается AI-агент, когда отвечает клиенту. Без неё агент работает только на общих данных языковой модели и быстро выдаёт ошибки: путает цены, выдумывает условия, обещает то, чего нет. С правильно собранной базой — отвечает на уровне менеджера, который проработал в компании год. Разница между «правильно» и «неправильно» — в том, что именно туда положено. Гайд про это: что загружать, чего не загружать, как обновлять и как проверять, что агент этим действительно пользуется.
Статья для тех, кто настраивает своего AI-агента впервые, и для тех, кто уже запустил, но получает странные ответы. В обоих случаях корень проблемы — почти всегда в базе знаний, а не в модели.
Что такое база знаний и как её читает агент
Техническая основа — RAG (retrieval-augmented generation). На каждый вопрос клиента агент сначала ищет релевантные фрагменты в вашей базе, подкладывает их в контекст ответа и только потом формулирует. Без базы — отвечает из общих знаний модели (скорее всего, ошибётся). С базой — отвечает по вашим данным.
В Leadarr база знаний поддерживает три типа источников:
- Документы — PDF, Word (.docx), TXT. Используется для текстового контента: регламенты, описания услуг, FAQ.
- Таблицы — Excel (.xlsx), CSV. Лучше работает с структурированными данными: прайсы, каталоги, матрицы условий.
- Калькулятор цен — отдельный тип под расчёт стоимости по параметрам.
Правило: выбор типа влияет на качество ответа. Прайс в Word превратится в кашу — его правильно класть в таблицу. Регламент, загруженный как таблица, не найдётся при текстовом поиске.
4 типа контента, которые стоит загрузить
Минимальный набор, который закрывает 80% вопросов клиентов.
1. Прайс и описание услуг. Что продаёте, за сколько, в каких пакетах, что входит в каждый, какие есть скидки и условия. Формат — таблица, если позиций много, или документ, если 3–5 пакетов с развёрнутыми описаниями. Без этого агент не сможет даже сказать клиенту, сколько стоит — а это первый вопрос в любой переписке.
2. FAQ по типовым вопросам. Возьмите 50–100 вопросов, которые чаще всего задают клиенты, и напишите на них ответы. Источники: реальные диалоги менеджеров, комментарии под объявлениями на Авито, сообщения в поддержке. Не пишите FAQ «из головы» — там будут не те вопросы.
3. Регламенты и процессы. Как вы работаете: порядок оформления заказа, сроки доставки, возврат, гарантия, способы оплаты, график работы. Одним документом — менеджер в чате обычно отвечает по этим темам «по памяти», и эту память нужно отцифровать.
4. Ниша-специфика. То, что сложно объяснить без контекста вашей ниши. У перевозчика — тарифные зоны и условия по весу/габаритам. У образовательного центра — программы, форматы, преподаватели. У автоимпортёра — нормативка и таможня. Кейс Encar Russia — хороший пример: примерно 40% входящих там закрывается подробным контентом по утильсбору и ввозу.
Если всё это собрано и обновляется — агент отвечает на уровне, на котором клиент готов вести разговор дальше. Остальное (исключения, нестандартные ситуации) закрывает менеджер.
4 антипаттерна — чего не класть
Часть контента не помогает агенту, а портит ответы. Это важнее, чем кажется: в базе знаний всё, что положили, участвует в поиске, и мусор вытесняет полезное.
1. История компании, миссия, ценности. «Мы с 2015 года помогаем бизнесу расти». Для отдела продаж это не нужно — клиент спрашивает про цену и сроки, а не про основателей. Загружать такое в базу — значит отвлекать поиск от реально важных данных. Если хочется — вынесите в system prompt одной строкой, не документом.
2. Маркетинговые тексты с лендингов. «Мы даём лучшее решение для роста вашего бизнеса» — это выглядит содержательно, но на деле не отвечает ни на один вопрос клиента. Клиент спросит «сколько стоит», база выдаст абзац про «мы даём решение», и агент ответит мимо. Убираем.
3. Дубли и устаревшие версии. Три версии прайса за разные месяцы в одной папке — классика. Агент выберет одну, но какую — непредсказуемо. Правило: одна актуальная версия документа, старые — в архив или удалять.
4. Внутренние документы, которых клиент видеть не должен. Внутренние скрипты с закупочными ценами, KPI менеджеров, служебные регламенты. Если это попало в базу — агент может случайно сослаться на это в разговоре. Загружаем только то, что и так можно показать клиенту.
Как организовать и обновлять
Несколько практик, которые отделяют рабочую базу от «загрузили и забыли».
- Разделяйте по типам. Прайсы — отдельная база (Таблица). Регламенты и FAQ — отдельная (Документы). Калькулятор цен — отдельный источник. Разные типы поиска работают эффективнее, чем одна большая свалка.
- Формат влияет на ответ. Если в прайсе нужны точные цены — таблица с колонками. Если FAQ — документ с явными вопросами в заголовках. Агент использует заголовки как сигналы релевантности.
- Обновляйте при изменениях. Поменяли цену — обновили таблицу. Изменили условия доставки — переписали регламент. Между обновлениями агент отвечает по старым данным и выдаёт устаревшие обещания.
- Ведите отдельный документ «исключения». Нестандартные случаи, ответы на которые не войдут в обычные разделы. Например: «для клиентов из N города тариф считается иначе». Пригодится, когда таких мелочей становится десятки.
Как проверить, что агент действительно пользуется базой
Частая ошибка — загрузили базу, запустили и забыли. Через месяц агент даёт странные ответы, а найти причину уже сложно. Четыре простых проверки.
Проверка 1: тестовые вопросы на старте. Сформулируйте 20–30 вопросов, которые реально задают клиенты, и задайте агенту в тестовом чате. Сверьте ответ с тем, что должен был выдать менеджер. Расхождения — сигнал либо к доработке базы, либо к уточнению настройки.
Проверка 2: режим «сообщения на проверку». Первые 1–2 недели после запуска менеджер смотрит каждый ответ агента перед отправкой клиенту. Все правки, которые делает менеджер, — это дыры в базе. Их фиксируете и закрываете.
Проверка 3: регулярный аудит логов. Раз в неделю первое время, потом реже — читайте диалоги, где агент ответил «не знаю», «уточню у менеджера» или выдал общий ответ вместо конкретики. Каждый такой случай — задача добавить или уточнить данные в базе.
Проверка 4: смотрите на конверсию. Если процент диалогов, дошедших до передачи менеджеру с заполненной карточкой, падает — в базу что-то недоложили или положили лишнее. Связь прямая.
Частые вопросы
Какой объём базы — нормально?
Зависит от ниши. Маленький B2B — 20–50 страниц регламентов плюс прайс. Импорт авто или B2B-железо — сотни страниц (нормативка, каталоги, условия по моделям). Ограничение не в размере, а в качестве структурирования.
Нужен ли свой текст, или можно скормить PDF с сайта?
Лендинги и промо-страницы — не подходят (см. антипаттерн №2). Нужны именно рабочие документы: прайсы, регламенты, FAQ. Если у вас есть внутренние материалы, которые реально используют менеджеры, — их и загружайте.
Что если в регламентах есть противоречия?
Агент будет путаться так же, как путался бы новый менеджер. Выход один: почистить противоречия в источниках до загрузки. Из-под бардака в источниках чистые ответы не возьмутся.
Как быстро обновляется база после изменений?
После загрузки новой версии документа база переиндексируется; агент начинает пользоваться новыми данными в течение нескольких минут. Старый документ лучше удалить — иначе в базе будут обе версии одновременно.
Нужно ли что-то делать с тоном и стилем?
База знаний — про факты (что/сколько/как). Стиль общения — отдельная настройка: агент обучается на ваших реальных диалогах. Подробности — в документации про обучение стилю.
Собрать базу под ваш процесс
Если у вас уже есть прайсы, FAQ и регламенты, собрать рабочую базу знаний для агента можно за день. Попробуйте Leadarr 7 дней без карты — подключим, загрузим ваши материалы и покажем, как агент отвечает на типовые вопросы клиентов.
Смежные материалы: