DeepSeek

deepseek — китайский open-weight конкурент GPT и Claude

Раздел: Языковые модели
Обновлено: 18.05.26

DeepSeek — китайская AI-компания и одноимённая семейство моделей, взорвавшая индустрию в январе 2025 релизом R1 — open-weight reasoning-модели уровня OpenAI o1, но открытой и в десятки раз дешевле. К 2026-му DeepSeek входит в тройку самых посещаемых AI-чатов мира (~298 млн визитов/месяц), лидер по российскому трафику. Главный пример того, что фронтир-AI может быть открытым и недорогим.

Коротко

Коротко. DeepSeek — китайская AI-компания и семейство open-weight моделей. Январь 2025 — релиз R1, reasoning-модели уровня OpenAI o1, обученной за ~$6M (vs $100M+ у конкурентов) и опубликованной с открытыми весами. Доступна через chat.deepseek.com, API ($0.27/$1.10 за 1M input/output — в 30× дешевле GPT-4o), и локально через Hugging Face. К 2026-му ~298 млн визитов/мес, лидер по российскому трафику.

Что это такое

20 января 2025-го. Малоизвестный китайский стартап DeepSeek (дочка хедж-фонда High-Flyer) публикует R1 — reasoning-модель, на бенчмарках обгоняющую OpenAI o1. Открыто, MIT-лицензия. Стоимость обучения, по их оценке, — около $6 млн против $100M+, которые тратят OpenAI и Anthropic.

За неделю акции NVIDIA упали на $600 млрд. Силиконовая долина в шоке: маленькая компания из Ханчжоу показала, что фронтир-AI больше не монополия Big Tech.

К 2026-му DeepSeek — один из главных AI-брендов мира:

DeepSeek-V3 — флагманская chat-модель (671B параметров, MoE).
DeepSeek-R1 — reasoning-модель, конкурент o1/o3.
DeepSeek-Coder — для программирования.
DeepSeek Math, VL, Audio — специализированные.

Доступ:

chat.deepseek.com — бесплатный chat-интерфейс.
DeepSeek API — $0.27/$1.10 за 1M токенов (в 30× дешевле GPT-4o).
Hugging Face — все веса open, можно скачать и запустить локально.
Через Together AI, Fireworks — managed-хостинг.

В России DeepSeek в 2026-м — топ AI-чат по охвату аудитории. Доступен без VPN, поддерживает русский, не блокирует регистрацию из РФ.

Как это работает

Главный технический прорыв DeepSeek-V3 — Mixture of Experts (MoE) плюс серия инноваций:

671B параметров общих, но при каждом запросе активируется только ~37B (15 из 256 экспертов). Это даёт качество огромной модели при стоимости средней.
Multi-Head Latent Attention (MLA) — оптимизация attention-механизма, снижает потребление памяти в 3 раза.
Reinforcement Learning для R1: модель училась рассуждать (chain-of-thought) через RL, не через дорогой supervised fine-tuning.
FP8-тренировка — DeepSeek первым из крупных лабораторий стабильно натренировал такую модель в FP8 (вдвое дешевле FP16).

Эти инновации позволили обучить фронтир-модель за 3-4 порядка дешевле западных конкурентов.

Пример на практике

Видеомонтажёр настраивает AI-ассистента для написания YouTube-описаний. Бюджет — $20/мес.

Через GPT-4o ($2.5/$10): на 200 описаний в месяц (300 input + 200 output токенов каждое) — $0.95/мес. Вписывается, но дорого для других задач.

Через DeepSeek-V3 ($0.27/$1.10): то же самое — $0.06/мес. В 16 раз дешевле. На сэкономленный бюджет — ещё 5 разных AI-задач: транскрипции, переводы, идеи для видео, edit-suggestions.

Локально через Ollama:

ollama run deepseek-r1:32b

На RTX 4090 — DeepSeek-R1 32B (distilled-версия) запускается локально. Reasoning-качество — 80% от full R1, при этом полностью бесплатно и offline. Идеально для конфиденциальных задач.

В ChatGPT-style диалогах DeepSeek чувствуется как ChatGPT-4o: умный, аккуратный, с reasoning при сложных задачах. Минус — иногда заметна китайская «прошивка» (отказы по политически-чувствительным темам про Китай).

В ComfyUI можно подключить DeepSeek через ComfyUI-LLM-API ноды или Ollama-ноды для локальных версий.

С чем часто путают

DeepSeek и DeepSeek-R1 — DeepSeek это компания и семейство. R1 — конкретная reasoning-модель.
DeepSeek-V3 и R1 — V3 это chat-модель (как GPT-4o). R1 это reasoning-модель (как o1).
DeepSeek и Qwen — оба китайские open-weight. DeepSeek от High-Flyer (Ханчжоу), Qwen от Alibaba.
Open-weight и Open-source — DeepSeek даёт веса (open-weight), но не код тренировки/датасет полностью. Open-source строже.
R1 и distilled-варианты — full R1 это 671B (нужен датацентр). distill-варианты (8B, 14B, 32B, 70B) — для локального запуска.

Частые ошибки и заблуждения

«DeepSeek = бесплатный аналог ChatGPT». На chat.deepseek.com — да, бесплатно. Через API — платно (но в 30× дешевле). Локально — бесплатно после установки.
«DeepSeek слабее GPT-4». На большинстве бенчмарков — равны или лучше. R1 на reasoning-задачах часто превосходит o1 (по их публикации).
«DeepSeek опасен — Китай». Open-weight модель работает локально без интернета, никаких данных в Китай не отправляется. Через китайский API — да, данные туда идут.
«R1 запускается на любом GPU». Full 671B — нужен кластер H100. Distilled-версии (32B Q4) — на RTX 4090. 8B — на RTX 3060.
«DeepSeek забанен в России». Не забанен. Доступен без VPN, поддерживает русский на отличном уровне.

Связанные термины

ChatGPT / Claude / Gemini — главные конкуренты.
Qwen — другой китайский open-weight конкурент.
Reasoning Models — класс моделей, к которому относится R1.
Mixture of Experts — архитектура DeepSeek-V3.
Open-source AI / Open-weight — категория, в которой DeepSeek лидер.
Quantization — для запуска distilled-версий локально.
Llama — главный западный open-weight конкурент.

Частые вопросы

Какая разница между V3 и R1? V3 — обычная chat-модель (как GPT-4o). R1 — reasoning-модель: «думает» перед ответом, чейн-оф-thought видим, лучше на математике, коде, логике. Для творческого письма — V3, для сложных задач — R1.

Сколько стоит API? DeepSeek-V3: $0.27/$1.10 за 1M input/output. R1: $0.55/$2.19. В 30+ раз дешевле GPT-4o.

Можно ли использовать в России? Да, без ограничений. chat.deepseek.com доступен, регистрация по email, поддержка русского отличная. API оплачивается картой (включая российские).

Безопасно ли для конфиденциальных данных? Через chat/API — данные идут в Китай. Для конфиденциальных задач — локальный запуск через Ollama / vLLM. Полностью offline.

Какие распределённые версии лучшие для локали? deepseek-r1-distill-qwen-32b (Q4) — лучший баланс на RTX 4090. deepseek-r1-distill-llama-70b — топ-качество, нужно 48 ГБ VRAM. 8B — на RTX 3060 12 ГБ.

Поддерживает tool calling? Да, V3 и R1 имеют function calling, совместимый с OpenAI API. Работает в LangChain, agents-фреймворках.

Главное

DeepSeek — китайский AI-лаборатория и семейство open-weight моделей. Январь 2025 — релиз R1 (reasoning-модель уровня o1) перевернул индустрию: фронтир-AI может быть открытым и в 30× дешевле. К 2026-му DeepSeek входит в тройку самых посещаемых AI-чатов мира (~298 млн визитов/мес), лидер по российскому трафику. Доступен бесплатно через chat.deepseek.com, через API ($0.27/$1.10 за 1M), локально через Hugging Face/Ollama. Главные модели: V3 (универсальная), R1 (reasoning), Coder. Стандартный stack для русскоязычных проектов 2026: DeepSeek-V3 для массовых задач + Claude Sonnet для writing + локальный R1-distill для приватных данных. В России доступен без VPN.

Большие разборы по теме

Все разборы →

Большой разбор 28 мин чтения

ChatGPT vs Claude vs Gemini: какой AI-ассистент выбрать в 2026

ChatGPT, Claude и Gemini — три главных AI-ассистента в 2026 году. Все три построены на одной архитектуре, но обучены по-разному и поэтому…

Большой разбор 25 мин чтения

Как писать промпты: гид по prompt engineering для ChatGPT, Claude и Gemini

Промпт — это инструкция модели. Хороший промпт даёт хороший ответ, плохой даёт мусор — даже у одной и той же модели. Это…