DeepSeek
deepseek — китайский open-weight конкурент GPT и Claude
DeepSeek — китайская AI-компания и одноимённая семейство моделей, взорвавшая индустрию в январе 2025 релизом R1 — open-weight reasoning-модели уровня OpenAI o1, но открытой и в десятки раз дешевле. К 2026-му DeepSeek входит в тройку самых посещаемых AI-чатов мира (~298 млн визитов/месяц), лидер по российскому трафику. Главный пример того, что фронтир-AI может быть открытым и недорогим.
Коротко
Коротко. DeepSeek — китайская AI-компания и семейство open-weight моделей. Январь 2025 — релиз R1, reasoning-модели уровня OpenAI o1, обученной за ~$6M (vs $100M+ у конкурентов) и опубликованной с открытыми весами. Доступна через chat.deepseek.com, API ($0.27/$1.10 за 1M input/output — в 30× дешевле GPT-4o), и локально через Hugging Face. К 2026-му ~298 млн визитов/мес, лидер по российскому трафику.
Что это такое
20 января 2025-го. Малоизвестный китайский стартап DeepSeek (дочка хедж-фонда High-Flyer) публикует R1 — reasoning-модель, на бенчмарках обгоняющую OpenAI o1. Открыто, MIT-лицензия. Стоимость обучения, по их оценке, — около $6 млн против $100M+, которые тратят OpenAI и Anthropic.
За неделю акции NVIDIA упали на $600 млрд. Силиконовая долина в шоке: маленькая компания из Ханчжоу показала, что фронтир-AI больше не монополия Big Tech.
К 2026-му DeepSeek — один из главных AI-брендов мира:
- DeepSeek-V3 — флагманская chat-модель (671B параметров, MoE).
- DeepSeek-R1 — reasoning-модель, конкурент o1/o3.
- DeepSeek-Coder — для программирования.
- DeepSeek Math, VL, Audio — специализированные.
Доступ:
- chat.deepseek.com — бесплатный chat-интерфейс.
- DeepSeek API — $0.27/$1.10 за 1M токенов (в 30× дешевле GPT-4o).
- Hugging Face — все веса open, можно скачать и запустить локально.
- Через Together AI, Fireworks — managed-хостинг.
В России DeepSeek в 2026-м — топ AI-чат по охвату аудитории. Доступен без VPN, поддерживает русский, не блокирует регистрацию из РФ.
Как это работает
Главный технический прорыв DeepSeek-V3 — Mixture of Experts (MoE) плюс серия инноваций:
- 671B параметров общих, но при каждом запросе активируется только ~37B (15 из 256 экспертов). Это даёт качество огромной модели при стоимости средней.
- Multi-Head Latent Attention (MLA) — оптимизация attention-механизма, снижает потребление памяти в 3 раза.
- Reinforcement Learning для R1: модель училась рассуждать (chain-of-thought) через RL, не через дорогой supervised fine-tuning.
- FP8-тренировка — DeepSeek первым из крупных лабораторий стабильно натренировал такую модель в FP8 (вдвое дешевле FP16).
Эти инновации позволили обучить фронтир-модель за 3-4 порядка дешевле западных конкурентов.
Пример на практике
Видеомонтажёр настраивает AI-ассистента для написания YouTube-описаний. Бюджет — $20/мес.
Через GPT-4o ($2.5/$10): на 200 описаний в месяц (300 input + 200 output токенов каждое) — $0.95/мес. Вписывается, но дорого для других задач.
Через DeepSeek-V3 ($0.27/$1.10): то же самое — $0.06/мес. В 16 раз дешевле. На сэкономленный бюджет — ещё 5 разных AI-задач: транскрипции, переводы, идеи для видео, edit-suggestions.
Локально через Ollama:
ollama run deepseek-r1:32b
На RTX 4090 — DeepSeek-R1 32B (distilled-версия) запускается локально. Reasoning-качество — 80% от full R1, при этом полностью бесплатно и offline. Идеально для конфиденциальных задач.
В ChatGPT-style диалогах DeepSeek чувствуется как ChatGPT-4o: умный, аккуратный, с reasoning при сложных задачах. Минус — иногда заметна китайская «прошивка» (отказы по политически-чувствительным темам про Китай).
В ComfyUI можно подключить DeepSeek через ComfyUI-LLM-API ноды или Ollama-ноды для локальных версий.
С чем часто путают
- DeepSeek и DeepSeek-R1 — DeepSeek это компания и семейство. R1 — конкретная reasoning-модель.
- DeepSeek-V3 и R1 — V3 это chat-модель (как GPT-4o). R1 это reasoning-модель (как o1).
- DeepSeek и Qwen — оба китайские open-weight. DeepSeek от High-Flyer (Ханчжоу), Qwen от Alibaba.
- Open-weight и Open-source — DeepSeek даёт веса (open-weight), но не код тренировки/датасет полностью. Open-source строже.
- R1 и distilled-варианты — full R1 это 671B (нужен датацентр). distill-варианты (8B, 14B, 32B, 70B) — для локального запуска.
Частые ошибки и заблуждения
- «DeepSeek = бесплатный аналог ChatGPT». На chat.deepseek.com — да, бесплатно. Через API — платно (но в 30× дешевле). Локально — бесплатно после установки.
- «DeepSeek слабее GPT-4». На большинстве бенчмарков — равны или лучше. R1 на reasoning-задачах часто превосходит o1 (по их публикации).
- «DeepSeek опасен — Китай». Open-weight модель работает локально без интернета, никаких данных в Китай не отправляется. Через китайский API — да, данные туда идут.
- «R1 запускается на любом GPU». Full 671B — нужен кластер H100. Distilled-версии (32B Q4) — на RTX 4090. 8B — на RTX 3060.
- «DeepSeek забанен в России». Не забанен. Доступен без VPN, поддерживает русский на отличном уровне.
Связанные термины
- ChatGPT / Claude / Gemini — главные конкуренты.
- Qwen — другой китайский open-weight конкурент.
- Reasoning Models — класс моделей, к которому относится R1.
- Mixture of Experts — архитектура DeepSeek-V3.
- Open-source AI / Open-weight — категория, в которой DeepSeek лидер.
- Quantization — для запуска distilled-версий локально.
- Llama — главный западный open-weight конкурент.
Частые вопросы
Какая разница между V3 и R1? V3 — обычная chat-модель (как GPT-4o). R1 — reasoning-модель: «думает» перед ответом, чейн-оф-thought видим, лучше на математике, коде, логике. Для творческого письма — V3, для сложных задач — R1.
Сколько стоит API? DeepSeek-V3: $0.27/$1.10 за 1M input/output. R1: $0.55/$2.19. В 30+ раз дешевле GPT-4o.
Можно ли использовать в России? Да, без ограничений. chat.deepseek.com доступен, регистрация по email, поддержка русского отличная. API оплачивается картой (включая российские).
Безопасно ли для конфиденциальных данных? Через chat/API — данные идут в Китай. Для конфиденциальных задач — локальный запуск через Ollama / vLLM. Полностью offline.
Какие распределённые версии лучшие для локали? deepseek-r1-distill-qwen-32b (Q4) — лучший баланс на RTX 4090. deepseek-r1-distill-llama-70b — топ-качество, нужно 48 ГБ VRAM. 8B — на RTX 3060 12 ГБ.
Поддерживает tool calling? Да, V3 и R1 имеют function calling, совместимый с OpenAI API. Работает в LangChain, agents-фреймворках.
Главное
DeepSeek — китайский AI-лаборатория и семейство open-weight моделей. Январь 2025 — релиз R1 (reasoning-модель уровня o1) перевернул индустрию: фронтир-AI может быть открытым и в 30× дешевле. К 2026-му DeepSeek входит в тройку самых посещаемых AI-чатов мира (~298 млн визитов/мес), лидер по российскому трафику. Доступен бесплатно через chat.deepseek.com, через API ($0.27/$1.10 за 1M), локально через Hugging Face/Ollama. Главные модели: V3 (универсальная), R1 (reasoning), Coder. Стандартный stack для русскоязычных проектов 2026: DeepSeek-V3 для массовых задач + Claude Sonnet для writing + локальный R1-distill для приватных данных. В России доступен без VPN.