llms.txt — это текстовый файл в корне сайта (домен/llms.txt), который в формате Markdown объясняет нейросетям, о чём ваш сайт и какие страницы на нём главные. Создать его можно за 15 минут: пишете заголовок с названием проекта, короткое описание и список ключевых страниц со ссылками, сохраняете как llms.txt и кладёте в корень рядом с robots.txt. В этой статье — готовый шаблон, который мы используем на oqapps.pro, таблица AI-ботов с правилами для robots.txt, настройка IndexNow с примером команды и минимальный набор Schema-разметки. По сути — полный чек-лист подготовки сайта к ИИ-поиску, который можно пройти за 30 минут.
Зачем вообще настраивать сайт под ИИ-поиск
Люди всё чаще спрашивают не Google, а ChatGPT, Perplexity и Алису. По данным Cloudflare за 2025 год, трафик AI-краулеров вырос взрывообразно: запросы агента ChatGPT-User увеличились более чем на 2 800% за год, а PerplexityBot показал рост в сотни раз. При этом посетители, пришедшие из ответов нейросетей, конвертируются заметно лучше обычного поиска — исследование Semrush (2025) оценивает разницу примерно в 4,4 раза. Логика простая: нейросеть уже «продала» вас пользователю, он приходит с готовым доверием.
Проблема в том, что нейросети видят ваш сайт не так, как люди. Они не ждут загрузки JavaScript, не кликают по меню и берут ответы кусками. Значит, сайту нужны три вещи: разрешение на доступ (robots.txt), карта смыслов (llms.txt + Schema) и присутствие в индексах, из которых нейросети берут факты (Bing через IndexNow, Яндекс для Алисы). Разберём всё по порядку.
Мы в OQapps прошли этот путь на собственном сайте и на посадочных страницах наших приложений — у нас 4 продукта в App Store, и веб-трафик из нейросетей для них уже не экзотика, а измеримый канал. Всё, что ниже, — не теория, а рабочий регламент.
Что такое llms.txt: коротко о стандарте
Стандарт llms.txt предложил Джереми Ховард (сооснователь Answer.AI) в сентябре 2024 года. Идея: robots.txt говорит роботам, куда можно ходить, а llms.txt объясняет языковым моделям, что на сайте важно и как это устроено. Файл пишется в Markdown — формате, который языковые модели понимают лучше всего.
Структура стандарта жёсткая и простая:
- H1-заголовок (#) — название сайта или проекта. Единственный обязательный элемент.
- Цитата (>) — краткое описание сути проекта в одно-два предложения.
- Секции H2 (##) — тематические группы ссылок: продукты, услуги, ключевые статьи.
- Списки ссылок — формат [название](URL): пояснение, зачем страница нужна.
- Секция Optional — второстепенные ссылки, которые модель может пропустить при нехватке контекста.
Важно понимать статус: llms.txt — пока предложенный стандарт, а не официальный протокол. OpenAI и Anthropic формально не обещают его читать. Но файл уже поддержали сотни документационных платформ (Mintlify, Anthropic Docs, Cloudflare Docs), краулеры реально его запрашивают — это видно в логах, — а затраты на внедрение равны нулю. Это ставка с бесплатным входом и растущим потенциальным выигрышем.
Готовый шаблон llms.txt: копируйте и адаптируйте
Вот сокращённая версия файла, который мы держим на oqapps.pro. Замените названия и ссылки на свои — структура универсальна для любого бизнес-сайта:
# OQapps
> OQapps — студия мобильных приложений: 4 собственных продукта
> в App Store, партнёрская программа и услуги по продвижению
> приложений и сайтов в нейросетях (GEO).
## Продукты
- [Приложения студии](https://oqapps.pro/products): каталог
наших iOS-приложений с описанием и ссылками на App Store
- [Для авторов](https://oqapps.pro/for-creators): условия
сотрудничества с блогерами и создателями контента
## Услуги
- [Услуги и GEO-продвижение](https://oqapps.pro/services):
аудит цитируемости в ChatGPT и Perplexity, настройка сайта
под ИИ-поиск, пилотные проекты
- [Партнёрская программа](https://oqapps.pro/affiliate):
комиссия за привлечённых пользователей приложений
## Блог
- [llms.txt и Schema для ИИ-поиска](https://oqapps.pro/blog/llms-txt-nastroyka-sayta-pod-ii-poisk):
практический гайд по настройке сайта под нейросети
## Optional
- [О студии](https://oqapps.pro/about): команда и история
Три правила, которые делают файл полезным, а не декоративным:
- Пояснение после каждой ссылки обязательно. Модель решает, переходить ли по ссылке, именно по этому описанию. «Страница услуг» — плохо. «Аудит цитируемости в ChatGPT с примерами запросов» — хорошо.
- 10–30 ссылок, не 300. llms.txt — это не карта сайта, а витрина. Полный список страниц у вас уже есть в sitemap.xml.
- Кладите файл в корень. Он должен открываться по адресу домен/llms.txt и отдавать обычный текст (Content-Type: text/plain или text/markdown). Проверка: откройте адрес в браузере в режиме инкогнито.
Какой бот что читает: таблица и правила robots.txt
Самая частая ошибка 2025–2026 годов — заблокировать «всех этих AI-ботов» одним махом и выпасть из ответов нейросетей. У OpenAI, например, три разных бота с разными задачами, и блокировка одного не влияет на остальные. Разбираемся, кто есть кто:
| Бот (User-agent) | Компания | Что делает | Разрешать? |
|---|---|---|---|
| GPTBot | OpenAI | Собирает данные для обучения моделей | Да, если хотите попадать в «знания» будущих GPT |
| OAI-SearchBot | OpenAI | Индексирует сайты для поиска ChatGPT | Обязательно — без него вас нет в ответах ChatGPT Search |
| ChatGPT-User | OpenAI | Заходит на страницу, когда пользователь просит ChatGPT её открыть | Обязательно |
| ClaudeBot | Anthropic | Сбор данных для обучения Claude | Да |
| Claude-SearchBot / Claude-User | Anthropic | Индексация для поиска Claude и живые запросы пользователей | Обязательно |
| PerplexityBot / Perplexity-User | Perplexity | Индекс Perplexity и переходы по запросам пользователей | Обязательно — Perplexity цитирует источники ссылками |
| Google-Extended | Управляет использованием контента для Gemini (не влияет на обычный поиск) | Да | |
| YandexBot | Яндекс | Единый краулер: и поиск, и Нейро, и ответы Алисы | Обязательно для русскоязычной аудитории |
Минимальный блок для robots.txt, который открывает дверь всем перечисленным (по умолчанию правило User-agent: * с Allow уже покрывает их, но явные секции защищают от случайных запретов и наглядны при аудите):
User-agent: GPTBot
Allow: /
User-agent: OAI-SearchBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Google-Extended
Allow: /
Sitemap: https://ваш-домен/sitemap.xml
Если вы принципиально против обучения моделей на вашем контенте — заблокируйте GPTBot и ClaudeBot, но оставьте поисковые боты (OAI-SearchBot, Claude-SearchBot, PerplexityBot). Иначе вы исчезнете из ответов с живыми ссылками — а это как раз тот трафик, ради которого всё затевается.
IndexNow: почему без Bing вас нет в ChatGPT
Ключевой факт, который упускают почти все русскоязычные материалы: поиск ChatGPT опирается на индекс Bing. Если страницы нет в Bing — ChatGPT не найдёт её при живом поиске, какая бы прекрасная Schema на ней ни стояла. А Bing индексирует рунет заметно ленивее Google. Решение — протокол IndexNow: вы сами сообщаете Bing о новых и обновлённых страницах, и индексация занимает часы вместо недель.
Настройка за четыре шага:
- Сгенерируйте ключ — любая строка из 32 шестнадцатеричных символов. Можно взять на bing.com/indexnow или создать командой
openssl rand -hex 16. - Положите ключ в корень сайта файлом: если ключ abc123…, создайте файл домен/abc123….txt, внутри — сам ключ одной строкой. Так Bing проверяет, что сайт ваш.
- Отправьте URL-ы. Один запрос — до 10 000 адресов:
curl -X POST "https://api.indexnow.org/indexnow" \
-H "Content-Type: application/json" \
-d '{
"host": "oqapps.pro",
"key": "ВАШ_КЛЮЧ",
"keyLocation": "https://oqapps.pro/ВАШ_КЛЮЧ.txt",
"urlList": [
"https://oqapps.pro/blog/llms-txt-nastroyka-sayta-pod-ii-poisk",
"https://oqapps.pro/services"
]
}'
- Автоматизируйте. Добавьте вызов IndexNow в процесс публикации: новая статья вышла — запрос ушёл. Ответ 200 или 202 означает «принято». Бонус: тот же запрос уходит и в Яндекс — он тоже участник протокола IndexNow, так что одной командой вы уведомляете оба индекса.
Дополнительно заведите сайт в Bing Webmaster Tools (бесплатно, вход через аккаунт Microsoft): там видно, какие страницы попали в индекс, а подтверждение прав можно импортировать прямо из Google Search Console.
Минимальный набор Schema.org для нейросетей
Schema-разметка (JSON-LD в теге script) — это способ сказать машине: «вот статья, вот автор, вот дата обновления, вот вопросы и ответы». Нейросетям и поисковикам с AI-ответами она помогает извлекать факты без угадывания. Минимальный рабочий набор — три типа.
1. Organization — кто вы такие
Ставится на главную страницу. Связывает бренд, сайт и профили в один узнаваемый объект:
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Organization",
"name": "OQapps",
"url": "https://oqapps.pro",
"logo": "https://oqapps.pro/images/logo.png",
"description": "Студия мобильных приложений и GEO-продвижения",
"sameAs": ["https://apps.apple.com/developer/..."]
}
</script>
2. Article с dateModified — что это и насколько свежее
Поле dateModified — одно из самых недооценённых. ИИ-поиск явно предпочитает свежие источники: при прочих равных процитируют статью, обновлённую месяц назад, а не два года назад. Обновили текст — обновите и дату (честно, вместе с реальными правками):
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "llms.txt и Schema: настройка сайта под ИИ-поиск",
"datePublished": "2026-06-28",
"dateModified": "2026-06-28",
"author": { "@type": "Organization", "name": "OQapps" },
"publisher": { "@type": "Organization", "name": "OQapps" }
}
</script>
3. FAQPage — готовые пары «вопрос-ответ»
FAQ-разметка — самый «извлекаемый» формат: вопрос пользователя нейросети часто дословно совпадает с вопросом из вашего FAQ, и модель берёт ответ целиком:
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [{
"@type": "Question",
"name": "Что такое llms.txt?",
"acceptedAnswer": {
"@type": "Answer",
"text": "Файл в корне сайта, который в формате Markdown
описывает нейросетям структуру и ключевые страницы сайта."
}
}]
}
</script>
Проверить разметку можно бесплатно в валидаторе validator.schema.org. Внедрение всего набора на типовой сайт занимает вечер работы разработчика — или входит в GEO-настройку, которую мы делаем в рамках услуг по продвижению в нейросетях.
Answer-first: структура статьи, которую цитируют
Техническая обвязка бесполезна, если сам текст невозможно разобрать на цитаты. Нейросеть извлекает из страницы фрагменты — и чем чище фрагмент отвечает на вопрос, тем выше шанс цитирования. Правила простые:
- Первый абзац = прямой ответ на главный запрос. Не «в современном мире всё меняется», а сразу определение и суть. Перечитайте первый абзац этой статьи — он построен именно так.
- Заголовки-вопросы. H2/H3 в формате реальных запросов пользователей: «Как разрешить GPTBot в robots.txt», а не «Технические аспекты».
- Один раздел — один ответ. Под заголовком первые 2–3 предложения должны отвечать на вопрос заголовка автономно, без «как мы говорили выше».
- Таблицы, нумерованные шаги, списки. Структурированные блоки модели извлекают охотнее сплошного текста.
- Цифры с источниками. «Конверсия выше в 4,4 раза по данным Semrush» цитируется; «конверсия значительно выше» — нет.
Регламент обновления: каждые 30–45 дней
ИИ-поиск любит свежесть сильнее классического SEO: Perplexity и ChatGPT Search при выборе источников заметно взвешивают дату. Наш рабочий регламент для контента, который должен цитироваться:
- Раз в 30–45 дней проходить по ключевым статьям: обновить цифры, добавить новый пример или раздел, поправить устаревшее.
- Обновить dateModified в Schema и видимую дату на странице.
- Отправить обновлённый URL через IndexNow.
- Раз в месяц проверять цитируемость руками: задать ChatGPT, Perplexity и Алисе 5–10 целевых вопросов и записать, кого они называют. Это ваша главная метрика.
Затраты на регламент — 2–3 часа в месяц на сайт. В деньгах — от 0 ₽, если делаете сами, до примерно $200–400 в месяц на подрядчике. Для сравнения: одна заметная цитата в ответах ChatGPT по коммерческому запросу работает как бесплатная рекомендация 24/7.
Аудит за 30 минут: чек-лист из 10 пунктов
Пройдите по своему сайту прямо сейчас — на каждый пункт нужно 2–3 минуты:
- Откройте домен/robots.txt — нет ли запрета для GPTBot, OAI-SearchBot, PerplexityBot, ClaudeBot? Частый сюрприз: хостинг или CDN-защита блокирует их без вашего ведома.
- Откройте домен/llms.txt — файл существует и описывает ключевые страницы? Нет — создайте по шаблону выше.
- Проверьте, отдаёт ли сайт основной текст без JavaScript: откройте страницу с отключённым JS или командой
curl https://ваш-домен | grep "ключевая фраза". Пустой ответ — критическая проблема: большинство AI-краулеров не исполняют JS. - Наберите site:ваш-домен в Bing — сколько страниц в индексе?
- Настроен ли IndexNow (ключ-файл в корне + отправка при публикации)?
- Есть ли Organization-разметка на главной? Проверка через validator.schema.org.
- Есть ли Article + dateModified на статьях блога?
- Есть ли FAQPage хотя бы на 3–5 ключевых страницах?
- Отвечает ли первый абзац каждой важной страницы на главный запрос напрямую?
- Спросите ChatGPT (с включённым поиском) и Perplexity 5 вопросов, по которым вас должны находить. Вас цитируют? Зафиксируйте результат — это точка отсчёта.
Если из 10 пунктов у вас закрыто меньше половины — вы в большинстве: по нашим наблюдениям, у типового сайта малого бизнеса выполнены 2–3 пункта. Это и есть окно возможностей: конкуренция в ИИ-выдаче пока на порядок ниже, чем в классическом SEO. Не хочется разбираться самостоятельно — закажите аудит цитируемости и GEO-пилот у нас: пройдём чек-лист за вас, настроим файлы и разметку и покажем динамику цитирований. А если у вас мобильное приложение — посмотрите, как мы применяем этот же подход к собственным продуктам.
Частые вопросы
Что такое llms.txt простыми словами?
Это текстовый файл в корне сайта (домен/llms.txt), написанный в Markdown. Он рассказывает нейросетям, о чём сайт и какие страницы главные, — как визитка для ИИ. Создаётся за 15 минут вручную или генератором, стоит 0 ₽.
llms.txt заменяет robots.txt или sitemap.xml?
Нет, это три разных файла. robots.txt управляет доступом роботов, sitemap.xml перечисляет все страницы для индексации, llms.txt объясняет смысл и приоритеты сайта языковым моделям. Нужны все три.
Как разрешить GPTBot в robots.txt?
Добавьте две строки: «User-agent: GPTBot» и «Allow: /». Но помните: GPTBot отвечает только за обучение моделей. Чтобы попадать в ответы поиска ChatGPT, разрешите ещё OAI-SearchBot и ChatGPT-User — это отдельные боты.
Почему для ChatGPT важен именно Bing?
Поиск ChatGPT берёт результаты из индекса Bing, а не Google. Если страницы нет в Bing, ChatGPT её не процитирует. Ускорить попадание в индекс помогает протокол IndexNow: вы отправляете URL сразу после публикации, и страница появляется в индексе за часы, а не недели.
Через сколько появится эффект от настройки?
Технические изменения (robots.txt, llms.txt, IndexNow, Schema) начинают работать в течение 1–4 недель — по мере переобхода сайта ботами. Устойчивые цитирования по конкурентным запросам — вопрос 2–4 месяцев регулярных обновлений контента. Точных гарантий здесь никто дать не может: алгоритмы выбора источников закрыты, поэтому единственная честная метрика — ежемесячная ручная проверка цитируемости.
Хочешь зарабатывать с мобильных приложений?
Блогерам от 10k подписчиков — до 80% с подписок. Крупным каналам от 500k — свой продукт и 90% выручки. Выплаты в USDT.
Стать партнёром →
