llms.txt и Schema: настройка сайта под ИИ-поиск в 2026

llms.txt — это текстовый файл в корне сайта (домен/llms.txt), который в формате Markdown объясняет нейросетям, о чём ваш сайт и какие страницы на нём главные. Создать его можно за 15 минут: пишете заголовок с названием проекта, короткое описание и список ключевых страниц со ссылками, сохраняете как llms.txt и кладёте в корень рядом с robots.txt. В этой статье — готовый шаблон, который мы используем на oqapps.pro, таблица AI-ботов с правилами для robots.txt, настройка IndexNow с примером команды и минимальный набор Schema-разметки. По сути — полный чек-лист подготовки сайта к ИИ-поиску, который можно пройти за 30 минут.

Зачем вообще настраивать сайт под ИИ-поиск

Люди всё чаще спрашивают не Google, а ChatGPT, Perplexity и Алису. По данным Cloudflare за 2025 год, трафик AI-краулеров вырос взрывообразно: запросы агента ChatGPT-User увеличились более чем на 2 800% за год, а PerplexityBot показал рост в сотни раз. При этом посетители, пришедшие из ответов нейросетей, конвертируются заметно лучше обычного поиска — исследование Semrush (2025) оценивает разницу примерно в 4,4 раза. Логика простая: нейросеть уже «продала» вас пользователю, он приходит с готовым доверием.

Проблема в том, что нейросети видят ваш сайт не так, как люди. Они не ждут загрузки JavaScript, не кликают по меню и берут ответы кусками. Значит, сайту нужны три вещи: разрешение на доступ (robots.txt), карта смыслов (llms.txt + Schema) и присутствие в индексах, из которых нейросети берут факты (Bing через IndexNow, Яндекс для Алисы). Разберём всё по порядку.

Мы в OQapps прошли этот путь на собственном сайте и на посадочных страницах наших приложений — у нас 4 продукта в App Store, и веб-трафик из нейросетей для них уже не экзотика, а измеримый канал. Всё, что ниже, — не теория, а рабочий регламент.

Что такое llms.txt: коротко о стандарте

Стандарт llms.txt предложил Джереми Ховард (сооснователь Answer.AI) в сентябре 2024 года. Идея: robots.txt говорит роботам, куда можно ходить, а llms.txt объясняет языковым моделям, что на сайте важно и как это устроено. Файл пишется в Markdown — формате, который языковые модели понимают лучше всего.

Структура стандарта жёсткая и простая:

H1-заголовок (#) — название сайта или проекта. Единственный обязательный элемент.
Цитата (>) — краткое описание сути проекта в одно-два предложения.
Секции H2 (##) — тематические группы ссылок: продукты, услуги, ключевые статьи.
Списки ссылок — формат [название](URL): пояснение, зачем страница нужна.
Секция Optional — второстепенные ссылки, которые модель может пропустить при нехватке контекста.

Важно понимать статус: llms.txt — пока предложенный стандарт, а не официальный протокол. OpenAI и Anthropic формально не обещают его читать. Но файл уже поддержали сотни документационных платформ (Mintlify, Anthropic Docs, Cloudflare Docs), краулеры реально его запрашивают — это видно в логах, — а затраты на внедрение равны нулю. Это ставка с бесплатным входом и растущим потенциальным выигрышем.

Готовый шаблон llms.txt: копируйте и адаптируйте

Вот сокращённая версия файла, который мы держим на oqapps.pro. Замените названия и ссылки на свои — структура универсальна для любого бизнес-сайта:

# OQapps

> OQapps — студия мобильных приложений: 4 собственных продукта
> в App Store, партнёрская программа и услуги по продвижению
> приложений и сайтов в нейросетях (GEO).

## Продукты

- [Приложения студии](https://oqapps.pro/products): каталог
  наших iOS-приложений с описанием и ссылками на App Store
- [Для авторов](https://oqapps.pro/for-creators): условия
  сотрудничества с блогерами и создателями контента

## Услуги

- [Услуги и GEO-продвижение](https://oqapps.pro/services):
  аудит цитируемости в ChatGPT и Perplexity, настройка сайта
  под ИИ-поиск, пилотные проекты
- [Партнёрская программа](https://oqapps.pro/affiliate):
  комиссия за привлечённых пользователей приложений

## Блог

- [llms.txt и Schema для ИИ-поиска](https://oqapps.pro/blog/llms-txt-nastroyka-sayta-pod-ii-poisk):
  практический гайд по настройке сайта под нейросети

## Optional

- [О студии](https://oqapps.pro/about): команда и история

Три правила, которые делают файл полезным, а не декоративным:

Пояснение после каждой ссылки обязательно. Модель решает, переходить ли по ссылке, именно по этому описанию. «Страница услуг» — плохо. «Аудит цитируемости в ChatGPT с примерами запросов» — хорошо.
10–30 ссылок, не 300. llms.txt — это не карта сайта, а витрина. Полный список страниц у вас уже есть в sitemap.xml.
Кладите файл в корень. Он должен открываться по адресу домен/llms.txt и отдавать обычный текст (Content-Type: text/plain или text/markdown). Проверка: откройте адрес в браузере в режиме инкогнито.

Какой бот что читает: таблица и правила robots.txt

Самая частая ошибка 2025–2026 годов — заблокировать «всех этих AI-ботов» одним махом и выпасть из ответов нейросетей. У OpenAI, например, три разных бота с разными задачами, и блокировка одного не влияет на остальные. Разбираемся, кто есть кто:

Бот (User-agent)	Компания	Что делает	Разрешать?
GPTBot	OpenAI	Собирает данные для обучения моделей	Да, если хотите попадать в «знания» будущих GPT
OAI-SearchBot	OpenAI	Индексирует сайты для поиска ChatGPT	Обязательно — без него вас нет в ответах ChatGPT Search
ChatGPT-User	OpenAI	Заходит на страницу, когда пользователь просит ChatGPT её открыть	Обязательно
ClaudeBot	Anthropic	Сбор данных для обучения Claude	Да
Claude-SearchBot / Claude-User	Anthropic	Индексация для поиска Claude и живые запросы пользователей	Обязательно
PerplexityBot / Perplexity-User	Perplexity	Индекс Perplexity и переходы по запросам пользователей	Обязательно — Perplexity цитирует источники ссылками
Google-Extended	Google	Управляет использованием контента для Gemini (не влияет на обычный поиск)	Да
YandexBot	Яндекс	Единый краулер: и поиск, и Нейро, и ответы Алисы	Обязательно для русскоязычной аудитории

Минимальный блок для robots.txt, который открывает дверь всем перечисленным (по умолчанию правило User-agent: * с Allow уже покрывает их, но явные секции защищают от случайных запретов и наглядны при аудите):

User-agent: GPTBot
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

Sitemap: https://ваш-домен/sitemap.xml

Если вы принципиально против обучения моделей на вашем контенте — заблокируйте GPTBot и ClaudeBot, но оставьте поисковые боты (OAI-SearchBot, Claude-SearchBot, PerplexityBot). Иначе вы исчезнете из ответов с живыми ссылками — а это как раз тот трафик, ради которого всё затевается.

IndexNow: почему без Bing вас нет в ChatGPT

Ключевой факт, который упускают почти все русскоязычные материалы: поиск ChatGPT опирается на индекс Bing. Если страницы нет в Bing — ChatGPT не найдёт её при живом поиске, какая бы прекрасная Schema на ней ни стояла. А Bing индексирует рунет заметно ленивее Google. Решение — протокол IndexNow: вы сами сообщаете Bing о новых и обновлённых страницах, и индексация занимает часы вместо недель.

Настройка за четыре шага:

Сгенерируйте ключ — любая строка из 32 шестнадцатеричных символов. Можно взять на bing.com/indexnow или создать командой openssl rand -hex 16.
Положите ключ в корень сайта файлом: если ключ abc123…, создайте файл домен/abc123….txt, внутри — сам ключ одной строкой. Так Bing проверяет, что сайт ваш.
Отправьте URL-ы. Один запрос — до 10 000 адресов:

curl -X POST "https://api.indexnow.org/indexnow" \
  -H "Content-Type: application/json" \
  -d '{
    "host": "oqapps.pro",
    "key": "ВАШ_КЛЮЧ",
    "keyLocation": "https://oqapps.pro/ВАШ_КЛЮЧ.txt",
    "urlList": [
      "https://oqapps.pro/blog/llms-txt-nastroyka-sayta-pod-ii-poisk",
      "https://oqapps.pro/services"
    ]
  }'

Автоматизируйте. Добавьте вызов IndexNow в процесс публикации: новая статья вышла — запрос ушёл. Ответ 200 или 202 означает «принято». Бонус: тот же запрос уходит и в Яндекс — он тоже участник протокола IndexNow, так что одной командой вы уведомляете оба индекса.

Дополнительно заведите сайт в Bing Webmaster Tools (бесплатно, вход через аккаунт Microsoft): там видно, какие страницы попали в индекс, а подтверждение прав можно импортировать прямо из Google Search Console.

Минимальный набор Schema.org для нейросетей

Schema-разметка (JSON-LD в теге script) — это способ сказать машине: «вот статья, вот автор, вот дата обновления, вот вопросы и ответы». Нейросетям и поисковикам с AI-ответами она помогает извлекать факты без угадывания. Минимальный рабочий набор — три типа.

1. Organization — кто вы такие

Ставится на главную страницу. Связывает бренд, сайт и профили в один узнаваемый объект:

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "OQapps",
  "url": "https://oqapps.pro",
  "logo": "https://oqapps.pro/images/logo.png",
  "description": "Студия мобильных приложений и GEO-продвижения",
  "sameAs": ["https://apps.apple.com/developer/..."]
}
</script>

2. Article с dateModified — что это и насколько свежее

Поле dateModified — одно из самых недооценённых. ИИ-поиск явно предпочитает свежие источники: при прочих равных процитируют статью, обновлённую месяц назад, а не два года назад. Обновили текст — обновите и дату (честно, вместе с реальными правками):

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "llms.txt и Schema: настройка сайта под ИИ-поиск",
  "datePublished": "2026-06-28",
  "dateModified": "2026-06-28",
  "author": { "@type": "Organization", "name": "OQapps" },
  "publisher": { "@type": "Organization", "name": "OQapps" }
}
</script>

3. FAQPage — готовые пары «вопрос-ответ»

FAQ-разметка — самый «извлекаемый» формат: вопрос пользователя нейросети часто дословно совпадает с вопросом из вашего FAQ, и модель берёт ответ целиком:

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [{
    "@type": "Question",
    "name": "Что такое llms.txt?",
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "Файл в корне сайта, который в формате Markdown
      описывает нейросетям структуру и ключевые страницы сайта."
    }
  }]
}
</script>

Проверить разметку можно бесплатно в валидаторе validator.schema.org. Внедрение всего набора на типовой сайт занимает вечер работы разработчика — или входит в GEO-настройку, которую мы делаем в рамках услуг по продвижению в нейросетях.

Answer-first: структура статьи, которую цитируют

Техническая обвязка бесполезна, если сам текст невозможно разобрать на цитаты. Нейросеть извлекает из страницы фрагменты — и чем чище фрагмент отвечает на вопрос, тем выше шанс цитирования. Правила простые:

Первый абзац = прямой ответ на главный запрос. Не «в современном мире всё меняется», а сразу определение и суть. Перечитайте первый абзац этой статьи — он построен именно так.
Заголовки-вопросы. H2/H3 в формате реальных запросов пользователей: «Как разрешить GPTBot в robots.txt», а не «Технические аспекты».
Один раздел — один ответ. Под заголовком первые 2–3 предложения должны отвечать на вопрос заголовка автономно, без «как мы говорили выше».
Таблицы, нумерованные шаги, списки. Структурированные блоки модели извлекают охотнее сплошного текста.
Цифры с источниками. «Конверсия выше в 4,4 раза по данным Semrush» цитируется; «конверсия значительно выше» — нет.

Регламент обновления: каждые 30–45 дней

ИИ-поиск любит свежесть сильнее классического SEO: Perplexity и ChatGPT Search при выборе источников заметно взвешивают дату. Наш рабочий регламент для контента, который должен цитироваться:

Раз в 30–45 дней проходить по ключевым статьям: обновить цифры, добавить новый пример или раздел, поправить устаревшее.
Обновить dateModified в Schema и видимую дату на странице.
Отправить обновлённый URL через IndexNow.
Раз в месяц проверять цитируемость руками: задать ChatGPT, Perplexity и Алисе 5–10 целевых вопросов и записать, кого они называют. Это ваша главная метрика.

Затраты на регламент — 2–3 часа в месяц на сайт. В деньгах — от 0 ₽, если делаете сами, до примерно $200–400 в месяц на подрядчике. Для сравнения: одна заметная цитата в ответах ChatGPT по коммерческому запросу работает как бесплатная рекомендация 24/7.

Аудит за 30 минут: чек-лист из 10 пунктов

Пройдите по своему сайту прямо сейчас — на каждый пункт нужно 2–3 минуты:

Откройте домен/robots.txt — нет ли запрета для GPTBot, OAI-SearchBot, PerplexityBot, ClaudeBot? Частый сюрприз: хостинг или CDN-защита блокирует их без вашего ведома.
Откройте домен/llms.txt — файл существует и описывает ключевые страницы? Нет — создайте по шаблону выше.
Проверьте, отдаёт ли сайт основной текст без JavaScript: откройте страницу с отключённым JS или командой curl https://ваш-домен | grep "ключевая фраза". Пустой ответ — критическая проблема: большинство AI-краулеров не исполняют JS.
Наберите site:ваш-домен в Bing — сколько страниц в индексе?
Настроен ли IndexNow (ключ-файл в корне + отправка при публикации)?
Есть ли Organization-разметка на главной? Проверка через validator.schema.org.
Есть ли Article + dateModified на статьях блога?
Есть ли FAQPage хотя бы на 3–5 ключевых страницах?
Отвечает ли первый абзац каждой важной страницы на главный запрос напрямую?
Спросите ChatGPT (с включённым поиском) и Perplexity 5 вопросов, по которым вас должны находить. Вас цитируют? Зафиксируйте результат — это точка отсчёта.

Если из 10 пунктов у вас закрыто меньше половины — вы в большинстве: по нашим наблюдениям, у типового сайта малого бизнеса выполнены 2–3 пункта. Это и есть окно возможностей: конкуренция в ИИ-выдаче пока на порядок ниже, чем в классическом SEO. Не хочется разбираться самостоятельно — закажите аудит цитируемости и GEO-пилот у нас: пройдём чек-лист за вас, настроим файлы и разметку и покажем динамику цитирований. А если у вас мобильное приложение — посмотрите, как мы применяем этот же подход к собственным продуктам.

Частые вопросы

Что такое llms.txt простыми словами?

Это текстовый файл в корне сайта (домен/llms.txt), написанный в Markdown. Он рассказывает нейросетям, о чём сайт и какие страницы главные, — как визитка для ИИ. Создаётся за 15 минут вручную или генератором, стоит 0 ₽.

llms.txt заменяет robots.txt или sitemap.xml?

Нет, это три разных файла. robots.txt управляет доступом роботов, sitemap.xml перечисляет все страницы для индексации, llms.txt объясняет смысл и приоритеты сайта языковым моделям. Нужны все три.

Как разрешить GPTBot в robots.txt?

Добавьте две строки: «User-agent: GPTBot» и «Allow: /». Но помните: GPTBot отвечает только за обучение моделей. Чтобы попадать в ответы поиска ChatGPT, разрешите ещё OAI-SearchBot и ChatGPT-User — это отдельные боты.

Почему для ChatGPT важен именно Bing?

Поиск ChatGPT берёт результаты из индекса Bing, а не Google. Если страницы нет в Bing, ChatGPT её не процитирует. Ускорить попадание в индекс помогает протокол IndexNow: вы отправляете URL сразу после публикации, и страница появляется в индексе за часы, а не недели.

Через сколько появится эффект от настройки?

Технические изменения (robots.txt, llms.txt, IndexNow, Schema) начинают работать в течение 1–4 недель — по мере переобхода сайта ботами. Устойчивые цитирования по конкурентным запросам — вопрос 2–4 месяцев регулярных обновлений контента. Точных гарантий здесь никто дать не может: алгоритмы выбора источников закрыты, поэтому единственная честная метрика — ежемесячная ручная проверка цитируемости.

Хочешь зарабатывать с мобильных приложений?

Блогерам от 10k подписчиков — до 80% с подписок. Крупным каналам от 500k — свой продукт и 90% выручки. Выплаты в USDT.

Стать партнёром →

Евгений Агафонов

10+ лет в мобильной разработке. Основатель OQapps.

Подробнее об авторе →