Qwen

qwen — open-weight семейство моделей от Alibaba

Раздел
Языковые модели
Обновлено
18.05.26

Qwen (произносится «чвен») — семейство open-weight LLM от Alibaba Cloud. К 2026-му Qwen3 — гибридная модель: умеет переключаться между быстрым ответом и режимом reasoning. Главный конкурент DeepSeek и Llama в open-source. ~39 млн визитов/мес, Россия в топ странах по трафику. Размеры от 0.6B до 72B + reasoning-варианты. Сильна на multilingual: 100+ языков, отлично работает с русским.

Коротко

Коротко. Qwen — семейство open-weight моделей от Alibaba Cloud. К 2026-му — Qwen3 с hybrid thinking: гибрид быстрого ответа и reasoning-режима в одной модели. Размеры 0.6B–72B + Qwen3-Max (closed). Multilingual из коробки (100+ языков, отличный русский). ~39 млн визитов/мес на qwen.ai, Россия — топ-3 по трафику. Open-weights через Hugging Face. Главный конкурент DeepSeek в нише открытых моделей.

Что это такое

Дизайнер настраивает локальный AI-ассистент на RTX 4090. Перебирает варианты: Llama 3.1 8B (английский — отлично, русский — средне), DeepSeek-R1-distill (отличный, но reasoning-only). Пробует Qwen3-14B — русский на уровне ChatGPT, скорость хорошая, hybrid thinking режим (быстрые ответы + reasoning по запросу).

К 2026-му Qwen — один из главных open-weight брендов мира:

  • Qwen3 — флагманская серия (0.6B, 1.7B, 4B, 8B, 14B, 32B, 72B).
  • Qwen3-Max — closed-source, конкурент GPT-4, через Alibaba Cloud API.
  • Qwen-VL — мультимодальная (текст + изображения), конкурент GPT-4V.
  • Qwen-Coder — для программирования.
  • Qwen-Audio — обработка звука.

Главное технологическое отличие Qwen3 — hybrid thinking mode. Одна модель, два режима:

  • Non-thinking: быстрый ответ (как обычный чат).
  • Thinking: reasoning с chain-of-thought (как DeepSeek-R1).

Переключение через специальный токен в промпте. Пользователь сам решает, нужен ли «думающий» режим.

В России Qwen популярен из-за: открытых весов, отличной поддержки русского, доступа без VPN, дружественной для РФ юрисдикции (Китай vs США).

Как это работает

Архитектура Qwen3 близка к Llama-style transformers, но с инновациями:

  • Hybrid Attention. GQA (Grouped Query Attention) для эффективности + специальные слои для reasoning.
  • Sliding Window Attention. Для длинного контекста (до 128K токенов).
  • Reasoning Tokens. Специальные <think>...</think> блоки в выводе для chain-of-thought.
  • Multilingual pretraining. На корпусе с акцентом на 100+ языков (китайский, английский, русский, испанский, арабский — лучше всего).

В hybrid режиме модель сама решает, нужен ли reasoning, или можно ответить быстро. Можно также явно включить через системный промпт enable_thinking: True.

Пример на практике

Программист в Москве делает локального ассистента для своей IDE. Бюджет — 0 (всё локально на RTX 4090).

Выбор модели:

  • Llama 3.1 8B Instruct: на английском хорошо, на русском — средне.
  • DeepSeek-R1-distill 14B: отличный reasoning, но медленный для casual вопросов.
  • Qwen3-14B: hybrid thinking — быстрый ответ когда не нужно думать, reasoning по сложным задачам.

Запускает через Ollama:

ollama run qwen3:14b

Тест:

  • «Объясни этот баг» → быстрый ответ за 2 секунды (non-thinking режим).
  • «Найди логическую ошибку в этой архитектуре» → 30 секунд reasoning + развёрнутый анализ.

Через API Alibaba Cloud — Qwen3-Max доступен по $0.40/$1.20 за 1M токенов (дешевле GPT-4o, но дороже DeepSeek-V3).

В ComfyUI Qwen работает через Ollama-ноды или прямой загрузчик GGUF/safetensors. Многие LLM-workflow в ComfyUI используют Qwen-VL для понимания референс-картинок.

С чем часто путают

  • Qwen и Qwen3 — Qwen это семейство, Qwen3 — текущее поколение (2025–2026). Раньше были Qwen, Qwen2, Qwen2.5.
  • Qwen и DeepSeek — оба китайские open-weight. Qwen от Alibaba (Ханчжоу), DeepSeek от High-Flyer (тоже Ханчжоу). Конкуренты.
  • Qwen3 и Qwen3-Max — Qwen3 open (до 72B). Qwen3-Max closed, через API Alibaba Cloud, конкурент GPT-4.
  • Qwen и Qwen-VL — Qwen текст. Qwen-VL добавляет vision (текст + картинки).
  • Hybrid thinking и Reasoning Models — Qwen3 hybrid: одна модель, два режима. Reasoning Models (o1, R1) — отдельные модели только под reasoning.

Частые ошибки и заблуждения

  • «Qwen хуже Llama для английского». На английском они близки. Qwen лучше на русском, испанском, арабском, китайском. На английском — equivalent или чуть позади.
  • «Hybrid thinking всегда полезен». Не всегда. Включение «thinking» режима замедляет ответ и тратит больше токенов. Для простых вопросов не нужно.
  • «Open-weights = open-source». Qwen open-weight (можно скачать веса). Open-source строже (нужны код тренировки + датасет). Qwen ближе к open-weight.
  • «Qwen для коммерции запрещён». Qwen2.5 и Qwen3 имеют Apache 2.0 lic для большинства размеров (free commercial). 72B — отдельная Qwen License.
  • «Russian — основной язык». Нет, основные — китайский и английский. Русский — один из лучших non-Asian языков, но не приоритет.

Связанные термины

  • DeepSeek — главный китайский конкурент в open-weight нише.
  • Llama — главный западный open-weight.
  • Mixture of Experts — некоторые версии Qwen используют.
  • Reasoning Models — Qwen3 в thinking-режиме это reasoning.
  • Open-source AI — категория, к которой относится.
  • Ollama — главный способ запустить Qwen локально.
  • Hugging Face — где скачать веса.

Частые вопросы

Какая разница между Qwen3 и Qwen3-Max? Qwen3 (0.6B–72B) — open-weight, можно скачать. Qwen3-Max — closed, только через API, конкурент GPT-4 по качеству.

Можно ли использовать в России? Да, без VPN. Hugging Face доступен (через зеркала / через VPN при иногда). Через Alibaba Cloud API — нужны не-РФ карты, но веса бесплатно для локального запуска.

Какая лицензия? Большинство размеров (≤32B) — Apache 2.0, полная коммерческая свобода. Qwen3-72B — отдельная Qwen License (в принципе свободная, но с уведомлениями).

Поддержка русского качественная? Да, на уровне ChatGPT-3.5 / Claude Haiku. Лучше Llama 3.1 8B по русскому. Для production задач на русском — отличный выбор.

Сколько VRAM нужно? Qwen3-8B Q4: 6 ГБ. Qwen3-14B Q4: 10 ГБ. Qwen3-32B Q4: 22 ГБ. Qwen3-72B Q4: 45 ГБ.

Qwen-VL для image-understanding — хорош? Да, конкурент GPT-4V и Claude Vision. Особенно хорош для китайского текста на изображениях, OCR, документов.

Главное

Qwen — семейство open-weight LLM от Alibaba Cloud, главный конкурент DeepSeek и Llama. К 2026-му Qwen3 с hybrid thinking — гибрид быстрого ответа и reasoning. Размеры 0.6B–72B + closed Qwen3-Max. Multilingual из коробки, отличный русский. Apache 2.0 для большинства размеров — free commercial use. В России популярен из-за открытых весов, доступа без VPN, дружественной юрисдикции (Китай vs США). Стандартная связка для русскоязычного локального AI: Qwen3-14B (Q4 GGUF) на RTX 4070+ через Ollama. ~39 млн визитов/мес, Россия в топ-3 по трафику. Главный плюс перед DeepSeek — встроенный hybrid mode (одна модель, два сценария).