Zero-shot и Few-shot
zero-shot и few-shot prompting — без примеров и с примерами
Zero-shot и Few-shot — два основных подхода к обращению к LLM. Zero-shot: даём задачу без примеров, модель отвечает «с чистого листа». Few-shot: показываем 2–8 примеров «вход → выход», модель копирует стиль. Few-shot обычно даёт стабильнее результат на форматных задачах (классификация, извлечение, ответ в шаблоне), но занимает больше токенов и работает только до определённой длины.
Коротко
Коротко. Zero-shot — попросить LLM решить задачу без примеров. Few-shot — показать 2–8 примеров «вход → выход», и попросить продолжить шаблон. Few-shot работает лучше для строгих форматов (категория, JSON, ответ по шаблону), zero-shot — для творческих задач (написать текст, объяснить тему). К 2026-му многие модели стали настолько умными, что zero-shot стал стандартом, но для производственных задач few-shot всё ещё надёжнее.
Что это такое
Программист пишет классификатор отзывов на товары: «положительный», «отрицательный», «нейтральный».
Zero-shot подход:
Определи тональность отзыва. Ответь одним словом:
"положительный", "отрицательный" или "нейтральный".
Отзыв: «Купил, работает. Доставка быстрая.»
Ответ:
GPT-4 справится в 90% случаев. На остальных 10% выдаст «smешанный», «положительная», «нейтрально (с уточнениями)» — формат поплывёт.
Few-shot подход:
Определи тональность отзыва.
Пример 1:
Отзыв: «Полная фигня, не покупайте»
Ответ: отрицательный
Пример 2:
Отзыв: «Хороший товар, рекомендую»
Ответ: положительный
Пример 3:
Отзыв: «Норм, цена соответствует»
Ответ: нейтральный
Теперь определи:
Отзыв: «Купил, работает. Доставка быстрая.»
Ответ:
Та же модель почти на 100% даёт ровно одно из трёх слов. Формат фиксирован, поведение предсказуемо.
Это и есть разница: zero-shot — на доверии модели; few-shot — обучение на лету через примеры в самом промпте.
К 2026-му:
- Zero-shot: стандарт для общения, рассуждений, длинных текстов, креатива.
- Few-shot: стандарт для классификации, извлечения данных, конкретных форматов.
Как это работает
Few-shot называют ещё «in-context learning» — модель «учится» прямо во время одного запроса, не меняя свои веса. Это уникальная способность больших моделей: они умеют подражать паттерну, не нужна отдельная тренировка.
Механизм:
- Модель видит несколько пар «вход → выход».
- Через attention строит связь: «когда вход выглядит так — выход выглядит так».
- На новом входе применяет ту же связь.
Сколько примеров оптимально:
- Zero-shot (0 примеров): для простых ясных задач или творческих.
- One-shot (1 пример): показать формат, минимальное обучение.
- Few-shot (2–8 примеров): стандарт. Стабилизирует поведение.
- Many-shot (50–1000+): иногда работает лучше, но ест много токенов и контекста.
Хорошие практики few-shot:
- Примеры должны быть разнообразными (разные категории, форматы, длины).
- Примеры в том же стиле, что и тестовый вход.
- Не больше 5–8 примеров — дальше отдача убывает.
- Один пример на одну строку формата — модель поймёт быстрее.
Пример на практике
Видеомонтажёр пишет скрипт для автоматической категоризации YouTube-комментариев. Задача: определить, нужен ли ответ автора.
Zero-shot:
Категории: НУЖЕН_ОТВЕТ, СПАМ, ПОЗИТИВ, БЛАГОДАРНОСТЬ.
Комментарий: «{text}»
Категория:
GPT-3.5 на 10000 комментариях даёт 78% правильных классификаций. Иногда возвращает «требуется_ответ» вместо «НУЖЕН_ОТВЕТ» — формат уплывает.
Few-shot с 6 примерами:
Определи категорию комментария.
«Подскажите, какой пресет вы использовали?» → НУЖЕН_ОТВЕТ
«Купите крипту по моей ссылке!» → СПАМ
«Класс! Спасибо большое» → БЛАГОДАРНОСТЬ
«Огонь видео!» → ПОЗИТИВ
«А что за музыка на 2:30?» → НУЖЕН_ОТВЕТ
«🔥🔥🔥» → ПОЗИТИВ
Комментарий: «{text}»
Категория:
Та же GPT-3.5 даёт 92% правильных. Формат всегда из четырёх вариантов. Стабильность поднялась за счёт 6 примеров — это в среднем 60 дополнительных токенов на запрос, недорого.
В Claude и Gemini few-shot работает идентично. У GPT иногда лучше работают примеры в system prompt, у Claude — в первых user-сообщениях.
С чем часто путают
- Few-shot Prompting и Fine-tuning — Few-shot не меняет веса модели, обучение «на лету» в одном запросе. Fine-tuning меняет веса навсегда.
- Few-shot и In-Context Learning — это синонимы. ICL — академическое название.
- Zero-shot и One-shot — Zero-shot вообще без примеров, One-shot с одним примером. One-shot часто эффективен против Zero-shot для форматных задач.
- Few-shot и Chain-of-Thought — CoT это «рассуждай шагами». Few-shot CoT — примеры с подробными рассуждениями. Это две независимых техники, можно комбинировать.
- Few-shot и RAG — Few-shot подсовывает примеры формата в промпт. RAG подсовывает релевантные документы. Разные цели.
Частые ошибки и заблуждения
- «Чем больше примеров, тем лучше». Только до 5–8. Дальше — диминишинг ретёрнс, забивание контекстного окна. Иногда 3 хорошо подобранных примера лучше 20 случайных.
- «Few-shot работает только в Few-shot моделях». Все современные LLM (GPT, Claude, Gemini, Llama) поддерживают few-shot. Это эмерджентное свойство больших моделей.
- «Zero-shot — это плохо, всегда нужны примеры». Не всегда. На простых, ясных, типичных задачах zero-shot экономит токены и часто даёт тот же результат.
- «Few-shot всегда стабильнее zero-shot». Не всегда. Если примеры неудачные (содержат ошибки или нетипичны) — могут ухудшить результат.
- «One-shot не имеет смысла». Имеет. Один пример показывает формат, что часто достаточно для стабильности.
Связанные термины
- In-Context Learning — академическое название few-shot.
- System Prompt — частое место для few-shot примеров.
- Chain-of-Thought — техника, часто комбинируется с few-shot.
- Prompt Engineering — общая дисциплина.
- Fine-tuning — альтернатива при больших объёмах.
- Context Window — ограничивает количество примеров.
- RAG — другой подход для подачи релевантной информации.
Частые вопросы
Сколько few-shot примеров оптимально? 3–5 для большинства задач. До 8 для сложных. Больше — обычно не помогает.
Few-shot работает в FLUX или Stable Diffusion? Нет, это техника для LLM. У моделей генерации изображений другие механизмы (LoRA, Textual Inversion, IP-Adapter).
Можно ли использовать few-shot в API-вызове? Да. Просто включите примеры либо в system prompt, либо в первом user-сообщении.
Few-shot увеличивает стоимость? Да, на стоимость дополнительных input-токенов. Но это обычно копейки, и качество часто оправдывает.
Что лучше: few-shot или fine-tuning? Few-shot — для редких задач или быстрых экспериментов. Fine-tuning — когда ту же задачу решаете десятки тысяч раз и хотите экономить токены и улучшить качество.
Что такое «zero-shot reasoning»? Модель решает задачу с пошаговым рассуждением без примеров. Особенность современных моделей (GPT-4, Claude 3.5, o1) — могут сами включать reasoning по нужде.
Главное
Zero-shot и Few-shot — это про то, давать ли модели примеры перед основной задачей. Zero-shot экономит токены и работает на простых задачах с современными большими моделями. Few-shot стабилизирует формат для строгих задач (классификация, извлечение, JSON-ответы) через 3–5 пар «вход → выход» в самом промпте. Главное правило: попробуйте zero-shot первым, если плавает формат — добавьте few-shot. К 2026-му в ComfyUI-нодах с LLM, в API-обёртках, в чат-ботах — везде используются оба подхода в зависимости от типа задачи. Few-shot также называют «in-context learning» — модель «обучается» прямо во время одного запроса.