Guidance
guidance — управление силой следования модели промпту или условию
Guidance — общее понятие управления тем, насколько модель следует заданному условию: промпту, изображению, ControlNet-карте. В Stable Diffusion проявляется как CFG Scale (Classifier-Free Guidance), в FLUX как `guidance` (нативный параметр), в ControlNet как strength. Низкие значения дают творческую свободу, высокие — жёсткое следование. Сбалансировать guidance — главный навык работы с любой генеративной моделью.
Коротко
Коротко. Guidance — это сила, с которой модель следует заданному условию. Главные проявления: CFG Scale в Stable Diffusion (как сильно держаться промпта), guidance в FLUX (нативный аналог CFG), ControlNet strength (как сильно учитывать карту). Низкие значения — творческая свобода и художественность. Высокие — жёсткое следование, риск пересатурации и артефактов. Стандартный CFG для SDXL — 7, для FLUX — 3.5, для ControlNet — 0.7–0.85.
Что это такое
Художник пишет промпт vintage poster, art deco, 1920s typography, golden accents. Запускает с CFG=2 — получает что-то художественное, плакатно-абстрактное, но «по мотивам». С CFG=7 — нормальный плакат, держит указанный стиль. С CFG=15 — изображение с пересатурированными цветами, странной композицией, видны артефакты.
Это и есть guidance в действии. Один параметр сдвигает результат от «модель импровизирует» к «модель следует букве промпта», но за крайностями ждёт потеря качества.
К 2026-му понятие «guidance» широкое:
- Classifier-Free Guidance (CFG) — главный механизм в SD. Появился в 2022-м, до сих пор стандарт.
- FLUX guidance — нативный параметр FLUX, заменяющий CFG.
- ControlNet strength — guidance для структурных условий (поза, контуры).
- IP-Adapter weight — guidance для image-условий (стиль референса).
- LoRA strength — guidance силы LoRA-влияния.
- Prompt weighting — локальный guidance для отдельных слов.
Все они — варианты одной идеи: «насколько следовать инструкции».
Как это работает
В классическом CFG модель на каждом шаге считает два прогноза:
- Conditional — что нарисовать с учётом промпта.
- Unconditional — что нарисовать без промпта.
Финальный шаг — линейная комбинация:
final = unconditional + cfg_scale × (conditional − unconditional)
При cfg_scale=1 берётся только conditional (стандартное поведение). При cfg_scale=7 модель «увеличивает» направление к conditional на 7×. При cfg_scale=15 это уже большой push, картинка начинает «пересатурироваться».
В FLUX механизм другой: guidance подаётся как дополнительный токен в текстовый энкодер. Модель училась с конкретными значениями guidance, и на нестандартных значениях ведёт себя предсказуемо. Стандарт FLUX.dev — 3.5, FLUX.schnell — 0 (без guidance, модель тренировалась без него).
Для ControlNet strength работает похоже: умножает влияние карты (depth, canny, openpose) на финальный sampling-шаг. 1.0 — полное влияние, 0.0 — игнорирование.
Пример на практике
Дизайнер тестирует 4 уровня guidance в одном промпте gothic cathedral interior, stained glass windows, dramatic light на SDXL:
- CFG 3: Художественная интерпретация. Окна не строго готические, скорее «вдохновлено». Свет мягкий. Хорошо для атмосферы.
- CFG 7: Идеальный баланс. Готика чётко, окна витражные, свет драматичный. Рабочий стандарт.
- CFG 11: Очень буквально. Каждое слово промпта прочитано: окна точно витражные, свет точно драматичный, готические арки. Чуть пересатурированно.
- CFG 18: Слом. Цвета кричащие, неестественная глубина, артефакты на стенах. Модель «перенапряглась».
Для FLUX тот же промпт:
- guidance 1.5: Очень мягкое следование. Картинка свободная, как импрессионизм.
- guidance 3.5: Стандарт FLUX. Чистая готика, правильные окна, реалистичный свет.
- guidance 7: Уже пересатурированно для FLUX. Модель училась на 3–5, дальше — выход за тренировочные значения.
Главное — у каждой модели свой оптимум guidance. Перенос значения с SDXL на FLUX (или наоборот) ломает результат.
В ComfyUI guidance — это поле в KSampler (для CFG) или отдельная нода FluxGuidance для FLUX. В AUTOMATIC1111 — слайдер «CFG Scale» в основном интерфейсе.
С чем часто путают
- Guidance и CFG Scale — CFG это конкретная реализация guidance в SD. Guidance — общее понятие, охватывающее CFG, FLUX guidance, strength, weight.
- CFG в SD и guidance в FLUX — численно разные диапазоны (7 vs 3.5), реализованы по-разному. Не переносятся 1:1.
- Guidance и Prompt Strength — Prompt Strength это вес отдельных слов в промпте. Guidance — сила всего промпта целиком.
- Guidance и Negative Prompt — negative prompt отдельный механизм (что не должно быть). Guidance работает вместе с positive промптом.
- Guidance Scale и Sampling Steps — guidance это про силу следования, steps про точность. Перпендикулярные оси.
Частые ошибки и заблуждения
- «Чем выше guidance, тем лучше следование промпту». Только до определённого предела. После порога модель «перенапрягается»: появляются артефакты, ломается анатомия, цвета пересатурируются.
- «Стандартный CFG=7 всегда подходит». Не всегда. Для SD-Lightning/Turbo это слишком много (модели тренировались с низким CFG). Для FLUX — другой диапазон вообще.
- «Низкий guidance — это плохо». Часто наоборот: художественнее, мягче, естественнее. Для портретов, художественных стилей — низкий guidance может работать лучше.
- «ControlNet strength=1 даёт самый точный результат». Часто — пересатурацию контроля, видно «обводку» исходной карты. Стандарт 0.7–0.85.
- «Guidance ускоряет sampling». Нет. Скорость почти не зависит от значения. Время определяется steps, batch и размером латента.
Связанные термины
- CFG Scale — главный реализатор guidance в Stable Diffusion.
- FLUX Guidance — нативный параметр FLUX-моделей.
- ControlNet — strength это тоже guidance.
- IP-Adapter — weight это guidance для изображения-референса.
- Prompt Weighting — локальный guidance для слов в промпте.
- Negative Prompt — отдельный механизм отрицательного guidance.
- LoRA Strength — guidance силы LoRA-эффекта.
Частые вопросы
Какое значение guidance выбрать для SDXL? Стандарт — 7. Для художественных задач — 4–5. Для строгих фотореалистичных — 8. Выше 10 редко полезно.
Почему FLUX.schnell не имеет guidance? FLUX.schnell — distilled-модель с 4 шагами. Обучена работать с фиксированной guidance=0 для скорости. Менять не имеет смысла.
Что такое «zero-CFG sampling»? Sampling с CFG=1 (только conditional, без unconditional). Быстрее в 2 раза, но менее «строго» следует промпту. Подходит для дешёвых черновиков.
Можно ли менять guidance во время sampling'а? Да, есть техника CFG Schedule (динамический CFG). Например, начать с 7, плавно снижать до 3 к концу. Помогает с артефактами на финальных шагах.
Различается ли guidance в ComfyUI и A1111?
Численно одинаково для CFG. Но в ComfyUI для FLUX отдельная нода FluxGuidance, в A1111 — отдельный слайдер. Просто разный UI.
Какой guidance для ControlNet? По умолчанию 1.0, но почти всегда снижают до 0.7–0.85. На 1.0 видна «обводка» исходной карты, генерация выглядит технично.
Главное
Guidance — это сила следования модели заданному условию. Универсальное понятие, реализованное по-разному в каждом инструменте: CFG в SD, нативный guidance в FLUX, strength в ControlNet, weight в LoRA и IP-Adapter. Логика всегда одна: низкое значение — творческая свобода, высокое — жёсткое следование, экстремум — артефакты. У каждой модели свой оптимум: SDXL — 7, FLUX.dev — 3.5, ControlNet — 0.7–0.85. Главный навык работы с генеративкой — чувствовать guidance под задачу, а не использовать дефолт. Для творческих задач часто полезнее снизить, для точных — поднять, но не выходить за рекомендованный диапазон.