ГлавнаяПартнёркаСвой продуктПродуктыРазработкаБлогО нас Стать партнёром →

llms.txt и Schema: настройка сайта под ИИ-поиск в 2026

llms.txt: что это и как создать — рабочий шаблон файла, правила robots.txt для GPTBot, настройка IndexNow и Schema-разметка. Чек-лист аудита за 30 минут.

llms.txt что это и как создать — файл сайта, связанный с ИИ-ботами и Schema-разметкой для ИИ-поиска

llms.txt — это текстовый файл в корне сайта (домен/llms.txt), который в формате Markdown объясняет нейросетям, о чём ваш сайт и какие страницы на нём главные. Создать его можно за 15 минут: пишете заголовок с названием проекта, короткое описание и список ключевых страниц со ссылками, сохраняете как llms.txt и кладёте в корень рядом с robots.txt. В этой статье — готовый шаблон, который мы используем на oqapps.pro, таблица AI-ботов с правилами для robots.txt, настройка IndexNow с примером команды и минимальный набор Schema-разметки. По сути — полный чек-лист подготовки сайта к ИИ-поиску, который можно пройти за 30 минут.

Зачем вообще настраивать сайт под ИИ-поиск

Люди всё чаще спрашивают не Google, а ChatGPT, Perplexity и Алису. По данным Cloudflare за 2025 год, трафик AI-краулеров вырос взрывообразно: запросы агента ChatGPT-User увеличились более чем на 2 800% за год, а PerplexityBot показал рост в сотни раз. При этом посетители, пришедшие из ответов нейросетей, конвертируются заметно лучше обычного поиска — исследование Semrush (2025) оценивает разницу примерно в 4,4 раза. Логика простая: нейросеть уже «продала» вас пользователю, он приходит с готовым доверием.

Проблема в том, что нейросети видят ваш сайт не так, как люди. Они не ждут загрузки JavaScript, не кликают по меню и берут ответы кусками. Значит, сайту нужны три вещи: разрешение на доступ (robots.txt), карта смыслов (llms.txt + Schema) и присутствие в индексах, из которых нейросети берут факты (Bing через IndexNow, Яндекс для Алисы). Разберём всё по порядку.

Мы в OQapps прошли этот путь на собственном сайте и на посадочных страницах наших приложений — у нас 4 продукта в App Store, и веб-трафик из нейросетей для них уже не экзотика, а измеримый канал. Всё, что ниже, — не теория, а рабочий регламент.

Что такое llms.txt: коротко о стандарте

Стандарт llms.txt предложил Джереми Ховард (сооснователь Answer.AI) в сентябре 2024 года. Идея: robots.txt говорит роботам, куда можно ходить, а llms.txt объясняет языковым моделям, что на сайте важно и как это устроено. Файл пишется в Markdown — формате, который языковые модели понимают лучше всего.

Структура стандарта жёсткая и простая:

Важно понимать статус: llms.txt — пока предложенный стандарт, а не официальный протокол. OpenAI и Anthropic формально не обещают его читать. Но файл уже поддержали сотни документационных платформ (Mintlify, Anthropic Docs, Cloudflare Docs), краулеры реально его запрашивают — это видно в логах, — а затраты на внедрение равны нулю. Это ставка с бесплатным входом и растущим потенциальным выигрышем.

Готовый шаблон llms.txt: копируйте и адаптируйте

Вот сокращённая версия файла, который мы держим на oqapps.pro. Замените названия и ссылки на свои — структура универсальна для любого бизнес-сайта:

# OQapps

> OQapps — студия мобильных приложений: 4 собственных продукта
> в App Store, партнёрская программа и услуги по продвижению
> приложений и сайтов в нейросетях (GEO).

## Продукты

- [Приложения студии](https://oqapps.pro/products): каталог
  наших iOS-приложений с описанием и ссылками на App Store
- [Для авторов](https://oqapps.pro/for-creators): условия
  сотрудничества с блогерами и создателями контента

## Услуги

- [Услуги и GEO-продвижение](https://oqapps.pro/services):
  аудит цитируемости в ChatGPT и Perplexity, настройка сайта
  под ИИ-поиск, пилотные проекты
- [Партнёрская программа](https://oqapps.pro/affiliate):
  комиссия за привлечённых пользователей приложений

## Блог

- [llms.txt и Schema для ИИ-поиска](https://oqapps.pro/blog/llms-txt-nastroyka-sayta-pod-ii-poisk):
  практический гайд по настройке сайта под нейросети

## Optional

- [О студии](https://oqapps.pro/about): команда и история

Три правила, которые делают файл полезным, а не декоративным:

  1. Пояснение после каждой ссылки обязательно. Модель решает, переходить ли по ссылке, именно по этому описанию. «Страница услуг» — плохо. «Аудит цитируемости в ChatGPT с примерами запросов» — хорошо.
  2. 10–30 ссылок, не 300. llms.txt — это не карта сайта, а витрина. Полный список страниц у вас уже есть в sitemap.xml.
  3. Кладите файл в корень. Он должен открываться по адресу домен/llms.txt и отдавать обычный текст (Content-Type: text/plain или text/markdown). Проверка: откройте адрес в браузере в режиме инкогнито.

Какой бот что читает: таблица и правила robots.txt

Самая частая ошибка 2025–2026 годов — заблокировать «всех этих AI-ботов» одним махом и выпасть из ответов нейросетей. У OpenAI, например, три разных бота с разными задачами, и блокировка одного не влияет на остальные. Разбираемся, кто есть кто:

Бот (User-agent)КомпанияЧто делаетРазрешать?
GPTBotOpenAIСобирает данные для обучения моделейДа, если хотите попадать в «знания» будущих GPT
OAI-SearchBotOpenAIИндексирует сайты для поиска ChatGPTОбязательно — без него вас нет в ответах ChatGPT Search
ChatGPT-UserOpenAIЗаходит на страницу, когда пользователь просит ChatGPT её открытьОбязательно
ClaudeBotAnthropicСбор данных для обучения ClaudeДа
Claude-SearchBot / Claude-UserAnthropicИндексация для поиска Claude и живые запросы пользователейОбязательно
PerplexityBot / Perplexity-UserPerplexityИндекс Perplexity и переходы по запросам пользователейОбязательно — Perplexity цитирует источники ссылками
Google-ExtendedGoogleУправляет использованием контента для Gemini (не влияет на обычный поиск)Да
YandexBotЯндексЕдиный краулер: и поиск, и Нейро, и ответы АлисыОбязательно для русскоязычной аудитории

Минимальный блок для robots.txt, который открывает дверь всем перечисленным (по умолчанию правило User-agent: * с Allow уже покрывает их, но явные секции защищают от случайных запретов и наглядны при аудите):

User-agent: GPTBot
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

Sitemap: https://ваш-домен/sitemap.xml

Если вы принципиально против обучения моделей на вашем контенте — заблокируйте GPTBot и ClaudeBot, но оставьте поисковые боты (OAI-SearchBot, Claude-SearchBot, PerplexityBot). Иначе вы исчезнете из ответов с живыми ссылками — а это как раз тот трафик, ради которого всё затевается.

IndexNow: почему без Bing вас нет в ChatGPT

Ключевой факт, который упускают почти все русскоязычные материалы: поиск ChatGPT опирается на индекс Bing. Если страницы нет в Bing — ChatGPT не найдёт её при живом поиске, какая бы прекрасная Schema на ней ни стояла. А Bing индексирует рунет заметно ленивее Google. Решение — протокол IndexNow: вы сами сообщаете Bing о новых и обновлённых страницах, и индексация занимает часы вместо недель.

Настройка за четыре шага:

  1. Сгенерируйте ключ — любая строка из 32 шестнадцатеричных символов. Можно взять на bing.com/indexnow или создать командой openssl rand -hex 16.
  2. Положите ключ в корень сайта файлом: если ключ abc123…, создайте файл домен/abc123….txt, внутри — сам ключ одной строкой. Так Bing проверяет, что сайт ваш.
  3. Отправьте URL-ы. Один запрос — до 10 000 адресов:
curl -X POST "https://api.indexnow.org/indexnow" \
  -H "Content-Type: application/json" \
  -d '{
    "host": "oqapps.pro",
    "key": "ВАШ_КЛЮЧ",
    "keyLocation": "https://oqapps.pro/ВАШ_КЛЮЧ.txt",
    "urlList": [
      "https://oqapps.pro/blog/llms-txt-nastroyka-sayta-pod-ii-poisk",
      "https://oqapps.pro/services"
    ]
  }'
  1. Автоматизируйте. Добавьте вызов IndexNow в процесс публикации: новая статья вышла — запрос ушёл. Ответ 200 или 202 означает «принято». Бонус: тот же запрос уходит и в Яндекс — он тоже участник протокола IndexNow, так что одной командой вы уведомляете оба индекса.

Дополнительно заведите сайт в Bing Webmaster Tools (бесплатно, вход через аккаунт Microsoft): там видно, какие страницы попали в индекс, а подтверждение прав можно импортировать прямо из Google Search Console.

Минимальный набор Schema.org для нейросетей

Schema-разметка (JSON-LD в теге script) — это способ сказать машине: «вот статья, вот автор, вот дата обновления, вот вопросы и ответы». Нейросетям и поисковикам с AI-ответами она помогает извлекать факты без угадывания. Минимальный рабочий набор — три типа.

1. Organization — кто вы такие

Ставится на главную страницу. Связывает бренд, сайт и профили в один узнаваемый объект:

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "OQapps",
  "url": "https://oqapps.pro",
  "logo": "https://oqapps.pro/images/logo.png",
  "description": "Студия мобильных приложений и GEO-продвижения",
  "sameAs": ["https://apps.apple.com/developer/..."]
}
</script>

2. Article с dateModified — что это и насколько свежее

Поле dateModified — одно из самых недооценённых. ИИ-поиск явно предпочитает свежие источники: при прочих равных процитируют статью, обновлённую месяц назад, а не два года назад. Обновили текст — обновите и дату (честно, вместе с реальными правками):

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "llms.txt и Schema: настройка сайта под ИИ-поиск",
  "datePublished": "2026-06-28",
  "dateModified": "2026-06-28",
  "author": { "@type": "Organization", "name": "OQapps" },
  "publisher": { "@type": "Organization", "name": "OQapps" }
}
</script>

3. FAQPage — готовые пары «вопрос-ответ»

FAQ-разметка — самый «извлекаемый» формат: вопрос пользователя нейросети часто дословно совпадает с вопросом из вашего FAQ, и модель берёт ответ целиком:

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [{
    "@type": "Question",
    "name": "Что такое llms.txt?",
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "Файл в корне сайта, который в формате Markdown
      описывает нейросетям структуру и ключевые страницы сайта."
    }
  }]
}
</script>

Проверить разметку можно бесплатно в валидаторе validator.schema.org. Внедрение всего набора на типовой сайт занимает вечер работы разработчика — или входит в GEO-настройку, которую мы делаем в рамках услуг по продвижению в нейросетях.

Answer-first: структура статьи, которую цитируют

Техническая обвязка бесполезна, если сам текст невозможно разобрать на цитаты. Нейросеть извлекает из страницы фрагменты — и чем чище фрагмент отвечает на вопрос, тем выше шанс цитирования. Правила простые:

Регламент обновления: каждые 30–45 дней

ИИ-поиск любит свежесть сильнее классического SEO: Perplexity и ChatGPT Search при выборе источников заметно взвешивают дату. Наш рабочий регламент для контента, который должен цитироваться:

  1. Раз в 30–45 дней проходить по ключевым статьям: обновить цифры, добавить новый пример или раздел, поправить устаревшее.
  2. Обновить dateModified в Schema и видимую дату на странице.
  3. Отправить обновлённый URL через IndexNow.
  4. Раз в месяц проверять цитируемость руками: задать ChatGPT, Perplexity и Алисе 5–10 целевых вопросов и записать, кого они называют. Это ваша главная метрика.

Затраты на регламент — 2–3 часа в месяц на сайт. В деньгах — от 0 ₽, если делаете сами, до примерно $200–400 в месяц на подрядчике. Для сравнения: одна заметная цитата в ответах ChatGPT по коммерческому запросу работает как бесплатная рекомендация 24/7.

Аудит за 30 минут: чек-лист из 10 пунктов

Пройдите по своему сайту прямо сейчас — на каждый пункт нужно 2–3 минуты:

  1. Откройте домен/robots.txt — нет ли запрета для GPTBot, OAI-SearchBot, PerplexityBot, ClaudeBot? Частый сюрприз: хостинг или CDN-защита блокирует их без вашего ведома.
  2. Откройте домен/llms.txt — файл существует и описывает ключевые страницы? Нет — создайте по шаблону выше.
  3. Проверьте, отдаёт ли сайт основной текст без JavaScript: откройте страницу с отключённым JS или командой curl https://ваш-домен | grep "ключевая фраза". Пустой ответ — критическая проблема: большинство AI-краулеров не исполняют JS.
  4. Наберите site:ваш-домен в Bing — сколько страниц в индексе?
  5. Настроен ли IndexNow (ключ-файл в корне + отправка при публикации)?
  6. Есть ли Organization-разметка на главной? Проверка через validator.schema.org.
  7. Есть ли Article + dateModified на статьях блога?
  8. Есть ли FAQPage хотя бы на 3–5 ключевых страницах?
  9. Отвечает ли первый абзац каждой важной страницы на главный запрос напрямую?
  10. Спросите ChatGPT (с включённым поиском) и Perplexity 5 вопросов, по которым вас должны находить. Вас цитируют? Зафиксируйте результат — это точка отсчёта.

Если из 10 пунктов у вас закрыто меньше половины — вы в большинстве: по нашим наблюдениям, у типового сайта малого бизнеса выполнены 2–3 пункта. Это и есть окно возможностей: конкуренция в ИИ-выдаче пока на порядок ниже, чем в классическом SEO. Не хочется разбираться самостоятельно — закажите аудит цитируемости и GEO-пилот у нас: пройдём чек-лист за вас, настроим файлы и разметку и покажем динамику цитирований. А если у вас мобильное приложение — посмотрите, как мы применяем этот же подход к собственным продуктам.

Частые вопросы

Что такое llms.txt простыми словами?

Это текстовый файл в корне сайта (домен/llms.txt), написанный в Markdown. Он рассказывает нейросетям, о чём сайт и какие страницы главные, — как визитка для ИИ. Создаётся за 15 минут вручную или генератором, стоит 0 ₽.

llms.txt заменяет robots.txt или sitemap.xml?

Нет, это три разных файла. robots.txt управляет доступом роботов, sitemap.xml перечисляет все страницы для индексации, llms.txt объясняет смысл и приоритеты сайта языковым моделям. Нужны все три.

Как разрешить GPTBot в robots.txt?

Добавьте две строки: «User-agent: GPTBot» и «Allow: /». Но помните: GPTBot отвечает только за обучение моделей. Чтобы попадать в ответы поиска ChatGPT, разрешите ещё OAI-SearchBot и ChatGPT-User — это отдельные боты.

Почему для ChatGPT важен именно Bing?

Поиск ChatGPT берёт результаты из индекса Bing, а не Google. Если страницы нет в Bing, ChatGPT её не процитирует. Ускорить попадание в индекс помогает протокол IndexNow: вы отправляете URL сразу после публикации, и страница появляется в индексе за часы, а не недели.

Через сколько появится эффект от настройки?

Технические изменения (robots.txt, llms.txt, IndexNow, Schema) начинают работать в течение 1–4 недель — по мере переобхода сайта ботами. Устойчивые цитирования по конкурентным запросам — вопрос 2–4 месяцев регулярных обновлений контента. Точных гарантий здесь никто дать не может: алгоритмы выбора источников закрыты, поэтому единственная честная метрика — ежемесячная ручная проверка цитируемости.


Хочешь зарабатывать с мобильных приложений?

Блогерам от 10k подписчиков — до 80% с подписок. Крупным каналам от 500k — свой продукт и 90% выручки. Выплаты в USDT.

Стать партнёром →
Евгений Агафонов

Евгений Агафонов

10+ лет в мобильной разработке. Основатель OQapps.

Подробнее об авторе →