Все кейсы
Гайд · AI-агент 6 мин · Leadarr апрель 2026

База знаний для AI-агента: что класть, а что — нет

Что загружать в базу знаний AI-агента: прайсы, FAQ, регламенты. Чего избегать. Как организовать, обновлять и проверять.

База знаний — то, на что опирается AI-агент, когда отвечает клиенту. Без неё агент работает только на общих данных языковой модели и быстро выдаёт ошибки: путает цены, выдумывает условия, обещает то, чего нет. С правильно собранной базой — отвечает на уровне менеджера, который проработал в компании год. Разница между «правильно» и «неправильно» — в том, что именно туда положено. Гайд про это: что загружать, чего не загружать, как обновлять и как проверять, что агент этим действительно пользуется.

Статья для тех, кто настраивает своего AI-агента впервые, и для тех, кто уже запустил, но получает странные ответы. В обоих случаях корень проблемы — почти всегда в базе знаний, а не в модели.

Что такое база знаний и как её читает агент

Техническая основа — RAG (retrieval-augmented generation). На каждый вопрос клиента агент сначала ищет релевантные фрагменты в вашей базе, подкладывает их в контекст ответа и только потом формулирует. Без базы — отвечает из общих знаний модели (скорее всего, ошибётся). С базой — отвечает по вашим данным.

В Leadarr база знаний поддерживает три типа источников:

  • Документы — PDF, Word (.docx), TXT. Используется для текстового контента: регламенты, описания услуг, FAQ.
  • Таблицы — Excel (.xlsx), CSV. Лучше работает с структурированными данными: прайсы, каталоги, матрицы условий.
  • Калькулятор цен — отдельный тип под расчёт стоимости по параметрам.

Правило: выбор типа влияет на качество ответа. Прайс в Word превратится в кашу — его правильно класть в таблицу. Регламент, загруженный как таблица, не найдётся при текстовом поиске.

4 типа контента, которые стоит загрузить

Минимальный набор, который закрывает 80% вопросов клиентов.

1. Прайс и описание услуг. Что продаёте, за сколько, в каких пакетах, что входит в каждый, какие есть скидки и условия. Формат — таблица, если позиций много, или документ, если 3–5 пакетов с развёрнутыми описаниями. Без этого агент не сможет даже сказать клиенту, сколько стоит — а это первый вопрос в любой переписке.

2. FAQ по типовым вопросам. Возьмите 50–100 вопросов, которые чаще всего задают клиенты, и напишите на них ответы. Источники: реальные диалоги менеджеров, комментарии под объявлениями на Авито, сообщения в поддержке. Не пишите FAQ «из головы» — там будут не те вопросы.

3. Регламенты и процессы. Как вы работаете: порядок оформления заказа, сроки доставки, возврат, гарантия, способы оплаты, график работы. Одним документом — менеджер в чате обычно отвечает по этим темам «по памяти», и эту память нужно отцифровать.

4. Ниша-специфика. То, что сложно объяснить без контекста вашей ниши. У перевозчика — тарифные зоны и условия по весу/габаритам. У образовательного центра — программы, форматы, преподаватели. У автоимпортёра — нормативка и таможня. Кейс Encar Russia — хороший пример: примерно 40% входящих там закрывается подробным контентом по утильсбору и ввозу.

Если всё это собрано и обновляется — агент отвечает на уровне, на котором клиент готов вести разговор дальше. Остальное (исключения, нестандартные ситуации) закрывает менеджер.

4 антипаттерна — чего не класть

Часть контента не помогает агенту, а портит ответы. Это важнее, чем кажется: в базе знаний всё, что положили, участвует в поиске, и мусор вытесняет полезное.

1. История компании, миссия, ценности. «Мы с 2015 года помогаем бизнесу расти». Для отдела продаж это не нужно — клиент спрашивает про цену и сроки, а не про основателей. Загружать такое в базу — значит отвлекать поиск от реально важных данных. Если хочется — вынесите в system prompt одной строкой, не документом.

2. Маркетинговые тексты с лендингов. «Мы даём лучшее решение для роста вашего бизнеса» — это выглядит содержательно, но на деле не отвечает ни на один вопрос клиента. Клиент спросит «сколько стоит», база выдаст абзац про «мы даём решение», и агент ответит мимо. Убираем.

3. Дубли и устаревшие версии. Три версии прайса за разные месяцы в одной папке — классика. Агент выберет одну, но какую — непредсказуемо. Правило: одна актуальная версия документа, старые — в архив или удалять.

4. Внутренние документы, которых клиент видеть не должен. Внутренние скрипты с закупочными ценами, KPI менеджеров, служебные регламенты. Если это попало в базу — агент может случайно сослаться на это в разговоре. Загружаем только то, что и так можно показать клиенту.

Как организовать и обновлять

Несколько практик, которые отделяют рабочую базу от «загрузили и забыли».

  • Разделяйте по типам. Прайсы — отдельная база (Таблица). Регламенты и FAQ — отдельная (Документы). Калькулятор цен — отдельный источник. Разные типы поиска работают эффективнее, чем одна большая свалка.
  • Формат влияет на ответ. Если в прайсе нужны точные цены — таблица с колонками. Если FAQ — документ с явными вопросами в заголовках. Агент использует заголовки как сигналы релевантности.
  • Обновляйте при изменениях. Поменяли цену — обновили таблицу. Изменили условия доставки — переписали регламент. Между обновлениями агент отвечает по старым данным и выдаёт устаревшие обещания.
  • Ведите отдельный документ «исключения». Нестандартные случаи, ответы на которые не войдут в обычные разделы. Например: «для клиентов из N города тариф считается иначе». Пригодится, когда таких мелочей становится десятки.

Как проверить, что агент действительно пользуется базой

Частая ошибка — загрузили базу, запустили и забыли. Через месяц агент даёт странные ответы, а найти причину уже сложно. Четыре простых проверки.

Проверка 1: тестовые вопросы на старте. Сформулируйте 20–30 вопросов, которые реально задают клиенты, и задайте агенту в тестовом чате. Сверьте ответ с тем, что должен был выдать менеджер. Расхождения — сигнал либо к доработке базы, либо к уточнению настройки.

Проверка 2: режим «сообщения на проверку». Первые 1–2 недели после запуска менеджер смотрит каждый ответ агента перед отправкой клиенту. Все правки, которые делает менеджер, — это дыры в базе. Их фиксируете и закрываете.

Проверка 3: регулярный аудит логов. Раз в неделю первое время, потом реже — читайте диалоги, где агент ответил «не знаю», «уточню у менеджера» или выдал общий ответ вместо конкретики. Каждый такой случай — задача добавить или уточнить данные в базе.

Проверка 4: смотрите на конверсию. Если процент диалогов, дошедших до передачи менеджеру с заполненной карточкой, падает — в базу что-то недоложили или положили лишнее. Связь прямая.

Частые вопросы

Какой объём базы — нормально?

Зависит от ниши. Маленький B2B — 20–50 страниц регламентов плюс прайс. Импорт авто или B2B-железо — сотни страниц (нормативка, каталоги, условия по моделям). Ограничение не в размере, а в качестве структурирования.

Нужен ли свой текст, или можно скормить PDF с сайта?

Лендинги и промо-страницы — не подходят (см. антипаттерн №2). Нужны именно рабочие документы: прайсы, регламенты, FAQ. Если у вас есть внутренние материалы, которые реально используют менеджеры, — их и загружайте.

Что если в регламентах есть противоречия?

Агент будет путаться так же, как путался бы новый менеджер. Выход один: почистить противоречия в источниках до загрузки. Из-под бардака в источниках чистые ответы не возьмутся.

Как быстро обновляется база после изменений?

После загрузки новой версии документа база переиндексируется; агент начинает пользоваться новыми данными в течение нескольких минут. Старый документ лучше удалить — иначе в базе будут обе версии одновременно.

Нужно ли что-то делать с тоном и стилем?

База знаний — про факты (что/сколько/как). Стиль общения — отдельная настройка: агент обучается на ваших реальных диалогах. Подробности — в документации про обучение стилю.

Собрать базу под ваш процесс

Если у вас уже есть прайсы, FAQ и регламенты, собрать рабочую базу знаний для агента можно за день. Попробуйте Leadarr 7 дней без карты — подключим, загрузим ваши материалы и покажем, как агент отвечает на типовые вопросы клиентов.

Смежные материалы:

Запустите своего агента за 5 минут.

7 дней бесплатно. Без карты. Настройка за один созвон.