Zero-shot и Few-shot

zero-shot и few-shot prompting — без примеров и с примерами

Раздел: Промпты
Обновлено: 18.05.26

Zero-shot и Few-shot — два основных подхода к обращению к LLM. Zero-shot: даём задачу без примеров, модель отвечает «с чистого листа». Few-shot: показываем 2–8 примеров «вход → выход», модель копирует стиль. Few-shot обычно даёт стабильнее результат на форматных задачах (классификация, извлечение, ответ в шаблоне), но занимает больше токенов и работает только до определённой длины.

Коротко

Коротко. Zero-shot — попросить LLM решить задачу без примеров. Few-shot — показать 2–8 примеров «вход → выход», и попросить продолжить шаблон. Few-shot работает лучше для строгих форматов (категория, JSON, ответ по шаблону), zero-shot — для творческих задач (написать текст, объяснить тему). К 2026-му многие модели стали настолько умными, что zero-shot стал стандартом, но для производственных задач few-shot всё ещё надёжнее.

Что это такое

Программист пишет классификатор отзывов на товары: «положительный», «отрицательный», «нейтральный».

Zero-shot подход:

Определи тональность отзыва. Ответь одним словом: 
"положительный", "отрицательный" или "нейтральный".

Отзыв: «Купил, работает. Доставка быстрая.»
Ответ:

GPT-4 справится в 90% случаев. На остальных 10% выдаст «smешанный», «положительная», «нейтрально (с уточнениями)» — формат поплывёт.

Few-shot подход:

Определи тональность отзыва.

Пример 1:
Отзыв: «Полная фигня, не покупайте»
Ответ: отрицательный

Пример 2:
Отзыв: «Хороший товар, рекомендую»
Ответ: положительный

Пример 3:
Отзыв: «Норм, цена соответствует»
Ответ: нейтральный

Теперь определи:
Отзыв: «Купил, работает. Доставка быстрая.»
Ответ:

Та же модель почти на 100% даёт ровно одно из трёх слов. Формат фиксирован, поведение предсказуемо.

Это и есть разница: zero-shot — на доверии модели; few-shot — обучение на лету через примеры в самом промпте.

К 2026-му:

Zero-shot: стандарт для общения, рассуждений, длинных текстов, креатива.
Few-shot: стандарт для классификации, извлечения данных, конкретных форматов.

Как это работает

Few-shot называют ещё «in-context learning» — модель «учится» прямо во время одного запроса, не меняя свои веса. Это уникальная способность больших моделей: они умеют подражать паттерну, не нужна отдельная тренировка.

Механизм:

Модель видит несколько пар «вход → выход».
Через attention строит связь: «когда вход выглядит так — выход выглядит так».
На новом входе применяет ту же связь.

Сколько примеров оптимально:

Zero-shot (0 примеров): для простых ясных задач или творческих.
One-shot (1 пример): показать формат, минимальное обучение.
Few-shot (2–8 примеров): стандарт. Стабилизирует поведение.
Many-shot (50–1000+): иногда работает лучше, но ест много токенов и контекста.

Хорошие практики few-shot:

Примеры должны быть разнообразными (разные категории, форматы, длины).
Примеры в том же стиле, что и тестовый вход.
Не больше 5–8 примеров — дальше отдача убывает.
Один пример на одну строку формата — модель поймёт быстрее.

Пример на практике

Видеомонтажёр пишет скрипт для автоматической категоризации YouTube-комментариев. Задача: определить, нужен ли ответ автора.

Zero-shot:

Категории: НУЖЕН_ОТВЕТ, СПАМ, ПОЗИТИВ, БЛАГОДАРНОСТЬ.
Комментарий: «{text}»
Категория:

GPT-3.5 на 10000 комментариях даёт 78% правильных классификаций. Иногда возвращает «требуется_ответ» вместо «НУЖЕН_ОТВЕТ» — формат уплывает.

Few-shot с 6 примерами:

Определи категорию комментария.

«Подскажите, какой пресет вы использовали?» → НУЖЕН_ОТВЕТ
«Купите крипту по моей ссылке!» → СПАМ
«Класс! Спасибо большое» → БЛАГОДАРНОСТЬ
«Огонь видео!» → ПОЗИТИВ
«А что за музыка на 2:30?» → НУЖЕН_ОТВЕТ
«🔥🔥🔥» → ПОЗИТИВ

Комментарий: «{text}»
Категория:

Та же GPT-3.5 даёт 92% правильных. Формат всегда из четырёх вариантов. Стабильность поднялась за счёт 6 примеров — это в среднем 60 дополнительных токенов на запрос, недорого.

В Claude и Gemini few-shot работает идентично. У GPT иногда лучше работают примеры в system prompt, у Claude — в первых user-сообщениях.

С чем часто путают

Few-shot Prompting и Fine-tuning — Few-shot не меняет веса модели, обучение «на лету» в одном запросе. Fine-tuning меняет веса навсегда.
Few-shot и In-Context Learning — это синонимы. ICL — академическое название.
Zero-shot и One-shot — Zero-shot вообще без примеров, One-shot с одним примером. One-shot часто эффективен против Zero-shot для форматных задач.
Few-shot и Chain-of-Thought — CoT это «рассуждай шагами». Few-shot CoT — примеры с подробными рассуждениями. Это две независимых техники, можно комбинировать.
Few-shot и RAG — Few-shot подсовывает примеры формата в промпт. RAG подсовывает релевантные документы. Разные цели.

Частые ошибки и заблуждения

«Чем больше примеров, тем лучше». Только до 5–8. Дальше — диминишинг ретёрнс, забивание контекстного окна. Иногда 3 хорошо подобранных примера лучше 20 случайных.
«Few-shot работает только в Few-shot моделях». Все современные LLM (GPT, Claude, Gemini, Llama) поддерживают few-shot. Это эмерджентное свойство больших моделей.
«Zero-shot — это плохо, всегда нужны примеры». Не всегда. На простых, ясных, типичных задачах zero-shot экономит токены и часто даёт тот же результат.
«Few-shot всегда стабильнее zero-shot». Не всегда. Если примеры неудачные (содержат ошибки или нетипичны) — могут ухудшить результат.
«One-shot не имеет смысла». Имеет. Один пример показывает формат, что часто достаточно для стабильности.

Связанные термины

In-Context Learning — академическое название few-shot.
System Prompt — частое место для few-shot примеров.
Chain-of-Thought — техника, часто комбинируется с few-shot.
Prompt Engineering — общая дисциплина.
Fine-tuning — альтернатива при больших объёмах.
Context Window — ограничивает количество примеров.
RAG — другой подход для подачи релевантной информации.

Частые вопросы

Сколько few-shot примеров оптимально? 3–5 для большинства задач. До 8 для сложных. Больше — обычно не помогает.

Few-shot работает в FLUX или Stable Diffusion? Нет, это техника для LLM. У моделей генерации изображений другие механизмы (LoRA, Textual Inversion, IP-Adapter).

Можно ли использовать few-shot в API-вызове? Да. Просто включите примеры либо в system prompt, либо в первом user-сообщении.

Few-shot увеличивает стоимость? Да, на стоимость дополнительных input-токенов. Но это обычно копейки, и качество часто оправдывает.

Что лучше: few-shot или fine-tuning? Few-shot — для редких задач или быстрых экспериментов. Fine-tuning — когда ту же задачу решаете десятки тысяч раз и хотите экономить токены и улучшить качество.

Что такое «zero-shot reasoning»? Модель решает задачу с пошаговым рассуждением без примеров. Особенность современных моделей (GPT-4, Claude 3.5, o1) — могут сами включать reasoning по нужде.

Главное

Zero-shot и Few-shot — это про то, давать ли модели примеры перед основной задачей. Zero-shot экономит токены и работает на простых задачах с современными большими моделями. Few-shot стабилизирует формат для строгих задач (классификация, извлечение, JSON-ответы) через 3–5 пар «вход → выход» в самом промпте. Главное правило: попробуйте zero-shot первым, если плавает формат — добавьте few-shot. К 2026-му в ComfyUI-нодах с LLM, в API-обёртках, в чат-ботах — везде используются оба подхода в зависимости от типа задачи. Few-shot также называют «in-context learning» — модель «обучается» прямо во время одного запроса.

Большие разборы по теме

Все разборы →

Большой разбор 25 мин чтения

Как писать промпты: гид по prompt engineering для ChatGPT, Claude и Gemini

Промпт — это инструкция модели. Хороший промпт даёт хороший ответ, плохой даёт мусор — даже у одной и той же модели. Это…

Что дальше:

Этот раздел Все термины: Промпты → Изучить тему системно — от базовых понятий до продвинутых. Если вы новичок Начать с основ: что такое AI → Один термин, с которого стоит начать знакомство с темой. Удиви меня Случайный термин → Серендипити: попасть на что-то неожиданное из 156 статей.