Qwen
qwen — open-weight семейство моделей от Alibaba
Qwen (произносится «чвен») — семейство open-weight LLM от Alibaba Cloud. К 2026-му Qwen3 — гибридная модель: умеет переключаться между быстрым ответом и режимом reasoning. Главный конкурент DeepSeek и Llama в open-source. ~39 млн визитов/мес, Россия в топ странах по трафику. Размеры от 0.6B до 72B + reasoning-варианты. Сильна на multilingual: 100+ языков, отлично работает с русским.
Коротко
Коротко. Qwen — семейство open-weight моделей от Alibaba Cloud. К 2026-му — Qwen3 с hybrid thinking: гибрид быстрого ответа и reasoning-режима в одной модели. Размеры 0.6B–72B + Qwen3-Max (closed). Multilingual из коробки (100+ языков, отличный русский). ~39 млн визитов/мес на qwen.ai, Россия — топ-3 по трафику. Open-weights через Hugging Face. Главный конкурент DeepSeek в нише открытых моделей.
Что это такое
Дизайнер настраивает локальный AI-ассистент на RTX 4090. Перебирает варианты: Llama 3.1 8B (английский — отлично, русский — средне), DeepSeek-R1-distill (отличный, но reasoning-only). Пробует Qwen3-14B — русский на уровне ChatGPT, скорость хорошая, hybrid thinking режим (быстрые ответы + reasoning по запросу).
К 2026-му Qwen — один из главных open-weight брендов мира:
- Qwen3 — флагманская серия (0.6B, 1.7B, 4B, 8B, 14B, 32B, 72B).
- Qwen3-Max — closed-source, конкурент GPT-4, через Alibaba Cloud API.
- Qwen-VL — мультимодальная (текст + изображения), конкурент GPT-4V.
- Qwen-Coder — для программирования.
- Qwen-Audio — обработка звука.
Главное технологическое отличие Qwen3 — hybrid thinking mode. Одна модель, два режима:
- Non-thinking: быстрый ответ (как обычный чат).
- Thinking: reasoning с chain-of-thought (как DeepSeek-R1).
Переключение через специальный токен в промпте. Пользователь сам решает, нужен ли «думающий» режим.
В России Qwen популярен из-за: открытых весов, отличной поддержки русского, доступа без VPN, дружественной для РФ юрисдикции (Китай vs США).
Как это работает
Архитектура Qwen3 близка к Llama-style transformers, но с инновациями:
- Hybrid Attention. GQA (Grouped Query Attention) для эффективности + специальные слои для reasoning.
- Sliding Window Attention. Для длинного контекста (до 128K токенов).
- Reasoning Tokens. Специальные
<think>...</think>блоки в выводе для chain-of-thought. - Multilingual pretraining. На корпусе с акцентом на 100+ языков (китайский, английский, русский, испанский, арабский — лучше всего).
В hybrid режиме модель сама решает, нужен ли reasoning, или можно ответить быстро. Можно также явно включить через системный промпт enable_thinking: True.
Пример на практике
Программист в Москве делает локального ассистента для своей IDE. Бюджет — 0 (всё локально на RTX 4090).
Выбор модели:
- Llama 3.1 8B Instruct: на английском хорошо, на русском — средне.
- DeepSeek-R1-distill 14B: отличный reasoning, но медленный для casual вопросов.
- Qwen3-14B: hybrid thinking — быстрый ответ когда не нужно думать, reasoning по сложным задачам.
Запускает через Ollama:
ollama run qwen3:14b
Тест:
- «Объясни этот баг» → быстрый ответ за 2 секунды (non-thinking режим).
- «Найди логическую ошибку в этой архитектуре» → 30 секунд reasoning + развёрнутый анализ.
Через API Alibaba Cloud — Qwen3-Max доступен по $0.40/$1.20 за 1M токенов (дешевле GPT-4o, но дороже DeepSeek-V3).
В ComfyUI Qwen работает через Ollama-ноды или прямой загрузчик GGUF/safetensors. Многие LLM-workflow в ComfyUI используют Qwen-VL для понимания референс-картинок.
С чем часто путают
- Qwen и Qwen3 — Qwen это семейство, Qwen3 — текущее поколение (2025–2026). Раньше были Qwen, Qwen2, Qwen2.5.
- Qwen и DeepSeek — оба китайские open-weight. Qwen от Alibaba (Ханчжоу), DeepSeek от High-Flyer (тоже Ханчжоу). Конкуренты.
- Qwen3 и Qwen3-Max — Qwen3 open (до 72B). Qwen3-Max closed, через API Alibaba Cloud, конкурент GPT-4.
- Qwen и Qwen-VL — Qwen текст. Qwen-VL добавляет vision (текст + картинки).
- Hybrid thinking и Reasoning Models — Qwen3 hybrid: одна модель, два режима. Reasoning Models (o1, R1) — отдельные модели только под reasoning.
Частые ошибки и заблуждения
- «Qwen хуже Llama для английского». На английском они близки. Qwen лучше на русском, испанском, арабском, китайском. На английском — equivalent или чуть позади.
- «Hybrid thinking всегда полезен». Не всегда. Включение «thinking» режима замедляет ответ и тратит больше токенов. Для простых вопросов не нужно.
- «Open-weights = open-source». Qwen open-weight (можно скачать веса). Open-source строже (нужны код тренировки + датасет). Qwen ближе к open-weight.
- «Qwen для коммерции запрещён». Qwen2.5 и Qwen3 имеют Apache 2.0 lic для большинства размеров (free commercial). 72B — отдельная Qwen License.
- «Russian — основной язык». Нет, основные — китайский и английский. Русский — один из лучших non-Asian языков, но не приоритет.
Связанные термины
- DeepSeek — главный китайский конкурент в open-weight нише.
- Llama — главный западный open-weight.
- Mixture of Experts — некоторые версии Qwen используют.
- Reasoning Models — Qwen3 в thinking-режиме это reasoning.
- Open-source AI — категория, к которой относится.
- Ollama — главный способ запустить Qwen локально.
- Hugging Face — где скачать веса.
Частые вопросы
Какая разница между Qwen3 и Qwen3-Max? Qwen3 (0.6B–72B) — open-weight, можно скачать. Qwen3-Max — closed, только через API, конкурент GPT-4 по качеству.
Можно ли использовать в России? Да, без VPN. Hugging Face доступен (через зеркала / через VPN при иногда). Через Alibaba Cloud API — нужны не-РФ карты, но веса бесплатно для локального запуска.
Какая лицензия? Большинство размеров (≤32B) — Apache 2.0, полная коммерческая свобода. Qwen3-72B — отдельная Qwen License (в принципе свободная, но с уведомлениями).
Поддержка русского качественная? Да, на уровне ChatGPT-3.5 / Claude Haiku. Лучше Llama 3.1 8B по русскому. Для production задач на русском — отличный выбор.
Сколько VRAM нужно? Qwen3-8B Q4: 6 ГБ. Qwen3-14B Q4: 10 ГБ. Qwen3-32B Q4: 22 ГБ. Qwen3-72B Q4: 45 ГБ.
Qwen-VL для image-understanding — хорош? Да, конкурент GPT-4V и Claude Vision. Особенно хорош для китайского текста на изображениях, OCR, документов.
Главное
Qwen — семейство open-weight LLM от Alibaba Cloud, главный конкурент DeepSeek и Llama. К 2026-му Qwen3 с hybrid thinking — гибрид быстрого ответа и reasoning. Размеры 0.6B–72B + closed Qwen3-Max. Multilingual из коробки, отличный русский. Apache 2.0 для большинства размеров — free commercial use. В России популярен из-за открытых весов, доступа без VPN, дружественной юрисдикции (Китай vs США). Стандартная связка для русскоязычного локального AI: Qwen3-14B (Q4 GGUF) на RTX 4070+ через Ollama. ~39 млн визитов/мес, Россия в топ-3 по трафику. Главный плюс перед DeepSeek — встроенный hybrid mode (одна модель, два сценария).