Guidance

guidance — управление силой следования модели промпту или условию

Раздел
Параметры
Обновлено
18.05.26

Guidance — общее понятие управления тем, насколько модель следует заданному условию: промпту, изображению, ControlNet-карте. В Stable Diffusion проявляется как CFG Scale (Classifier-Free Guidance), в FLUX как `guidance` (нативный параметр), в ControlNet как strength. Низкие значения дают творческую свободу, высокие — жёсткое следование. Сбалансировать guidance — главный навык работы с любой генеративной моделью.

Коротко

Коротко. Guidance — это сила, с которой модель следует заданному условию. Главные проявления: CFG Scale в Stable Diffusion (как сильно держаться промпта), guidance в FLUX (нативный аналог CFG), ControlNet strength (как сильно учитывать карту). Низкие значения — творческая свобода и художественность. Высокие — жёсткое следование, риск пересатурации и артефактов. Стандартный CFG для SDXL — 7, для FLUX — 3.5, для ControlNet — 0.7–0.85.

Что это такое

Художник пишет промпт vintage poster, art deco, 1920s typography, golden accents. Запускает с CFG=2 — получает что-то художественное, плакатно-абстрактное, но «по мотивам». С CFG=7 — нормальный плакат, держит указанный стиль. С CFG=15 — изображение с пересатурированными цветами, странной композицией, видны артефакты.

Это и есть guidance в действии. Один параметр сдвигает результат от «модель импровизирует» к «модель следует букве промпта», но за крайностями ждёт потеря качества.

К 2026-му понятие «guidance» широкое:

  • Classifier-Free Guidance (CFG) — главный механизм в SD. Появился в 2022-м, до сих пор стандарт.
  • FLUX guidance — нативный параметр FLUX, заменяющий CFG.
  • ControlNet strength — guidance для структурных условий (поза, контуры).
  • IP-Adapter weight — guidance для image-условий (стиль референса).
  • LoRA strength — guidance силы LoRA-влияния.
  • Prompt weighting — локальный guidance для отдельных слов.

Все они — варианты одной идеи: «насколько следовать инструкции».

Как это работает

В классическом CFG модель на каждом шаге считает два прогноза:

  1. Conditional — что нарисовать с учётом промпта.
  2. Unconditional — что нарисовать без промпта.

Финальный шаг — линейная комбинация:

final = unconditional + cfg_scale × (conditional − unconditional)

При cfg_scale=1 берётся только conditional (стандартное поведение). При cfg_scale=7 модель «увеличивает» направление к conditional на 7×. При cfg_scale=15 это уже большой push, картинка начинает «пересатурироваться».

В FLUX механизм другой: guidance подаётся как дополнительный токен в текстовый энкодер. Модель училась с конкретными значениями guidance, и на нестандартных значениях ведёт себя предсказуемо. Стандарт FLUX.dev — 3.5, FLUX.schnell — 0 (без guidance, модель тренировалась без него).

Для ControlNet strength работает похоже: умножает влияние карты (depth, canny, openpose) на финальный sampling-шаг. 1.0 — полное влияние, 0.0 — игнорирование.

Пример на практике

Дизайнер тестирует 4 уровня guidance в одном промпте gothic cathedral interior, stained glass windows, dramatic light на SDXL:

  • CFG 3: Художественная интерпретация. Окна не строго готические, скорее «вдохновлено». Свет мягкий. Хорошо для атмосферы.
  • CFG 7: Идеальный баланс. Готика чётко, окна витражные, свет драматичный. Рабочий стандарт.
  • CFG 11: Очень буквально. Каждое слово промпта прочитано: окна точно витражные, свет точно драматичный, готические арки. Чуть пересатурированно.
  • CFG 18: Слом. Цвета кричащие, неестественная глубина, артефакты на стенах. Модель «перенапряглась».

Для FLUX тот же промпт:

  • guidance 1.5: Очень мягкое следование. Картинка свободная, как импрессионизм.
  • guidance 3.5: Стандарт FLUX. Чистая готика, правильные окна, реалистичный свет.
  • guidance 7: Уже пересатурированно для FLUX. Модель училась на 3–5, дальше — выход за тренировочные значения.

Главное — у каждой модели свой оптимум guidance. Перенос значения с SDXL на FLUX (или наоборот) ломает результат.

В ComfyUI guidance — это поле в KSampler (для CFG) или отдельная нода FluxGuidance для FLUX. В AUTOMATIC1111 — слайдер «CFG Scale» в основном интерфейсе.

С чем часто путают

  • Guidance и CFG Scale — CFG это конкретная реализация guidance в SD. Guidance — общее понятие, охватывающее CFG, FLUX guidance, strength, weight.
  • CFG в SD и guidance в FLUX — численно разные диапазоны (7 vs 3.5), реализованы по-разному. Не переносятся 1:1.
  • Guidance и Prompt Strength — Prompt Strength это вес отдельных слов в промпте. Guidance — сила всего промпта целиком.
  • Guidance и Negative Prompt — negative prompt отдельный механизм (что не должно быть). Guidance работает вместе с positive промптом.
  • Guidance Scale и Sampling Steps — guidance это про силу следования, steps про точность. Перпендикулярные оси.

Частые ошибки и заблуждения

  • «Чем выше guidance, тем лучше следование промпту». Только до определённого предела. После порога модель «перенапрягается»: появляются артефакты, ломается анатомия, цвета пересатурируются.
  • «Стандартный CFG=7 всегда подходит». Не всегда. Для SD-Lightning/Turbo это слишком много (модели тренировались с низким CFG). Для FLUX — другой диапазон вообще.
  • «Низкий guidance — это плохо». Часто наоборот: художественнее, мягче, естественнее. Для портретов, художественных стилей — низкий guidance может работать лучше.
  • «ControlNet strength=1 даёт самый точный результат». Часто — пересатурацию контроля, видно «обводку» исходной карты. Стандарт 0.7–0.85.
  • «Guidance ускоряет sampling». Нет. Скорость почти не зависит от значения. Время определяется steps, batch и размером латента.

Связанные термины

  • CFG Scale — главный реализатор guidance в Stable Diffusion.
  • FLUX Guidance — нативный параметр FLUX-моделей.
  • ControlNetstrength это тоже guidance.
  • IP-Adapter — weight это guidance для изображения-референса.
  • Prompt Weighting — локальный guidance для слов в промпте.
  • Negative Prompt — отдельный механизм отрицательного guidance.
  • LoRA Strength — guidance силы LoRA-эффекта.

Частые вопросы

Какое значение guidance выбрать для SDXL? Стандарт — 7. Для художественных задач — 4–5. Для строгих фотореалистичных — 8. Выше 10 редко полезно.

Почему FLUX.schnell не имеет guidance? FLUX.schnell — distilled-модель с 4 шагами. Обучена работать с фиксированной guidance=0 для скорости. Менять не имеет смысла.

Что такое «zero-CFG sampling»? Sampling с CFG=1 (только conditional, без unconditional). Быстрее в 2 раза, но менее «строго» следует промпту. Подходит для дешёвых черновиков.

Можно ли менять guidance во время sampling'а? Да, есть техника CFG Schedule (динамический CFG). Например, начать с 7, плавно снижать до 3 к концу. Помогает с артефактами на финальных шагах.

Различается ли guidance в ComfyUI и A1111? Численно одинаково для CFG. Но в ComfyUI для FLUX отдельная нода FluxGuidance, в A1111 — отдельный слайдер. Просто разный UI.

Какой guidance для ControlNet? По умолчанию 1.0, но почти всегда снижают до 0.7–0.85. На 1.0 видна «обводка» исходной карты, генерация выглядит технично.

Главное

Guidance — это сила следования модели заданному условию. Универсальное понятие, реализованное по-разному в каждом инструменте: CFG в SD, нативный guidance в FLUX, strength в ControlNet, weight в LoRA и IP-Adapter. Логика всегда одна: низкое значение — творческая свобода, высокое — жёсткое следование, экстремум — артефакты. У каждой модели свой оптимум: SDXL — 7, FLUX.dev — 3.5, ControlNet — 0.7–0.85. Главный навык работы с генеративкой — чувствовать guidance под задачу, а не использовать дефолт. Для творческих задач часто полезнее снизить, для точных — поднять, но не выходить за рекомендованный диапазон.