Model License
model license — юридические условия использования AI-модели
Лицензия модели — юридическое соглашение, описывающее, как можно использовать веса AI-модели. Скачать модель и запустить локально часто можно бесплатно, но коммерческое использование, дообучение или перепродажа могут быть ограничены. Главные категории лицензий: свободные (Apache 2.0, MIT — почти без ограничений), custom коммерческие (Llama Community), research-only, non-commercial. Перед бизнес-проектом лицензию читать обязательно.
Коротко
Коротко. Каждая открытая AI-модель идёт с лицензией — юридическим документом, описывающим, что можно делать с её весами. Самые свободные (Apache 2.0, MIT) разрешают коммерческое использование, fine-tuning, перепродажу. Llama Community разрешает коммерцию, но с ограничениями. FLUX Dev — только non-commercial. Перед использованием в продукте лицензию нужно читать целиком.
Что это такое
Конец 2023-го. Стартап запускает чат-бот на Llama 2 как часть платной B2B-платформы. Через полгода случайно выясняют, что лицензия Llama 2 запрещает использовать вывод модели для обучения других моделей. А они как раз дообучали Mistral на ответах Llama. Пришлось переделать пайплайн и потратить квартал на переход.
Это типичная история — AI-лицензии стали серьёзной юридической областью. Раньше open-source значило «Apache 2.0 или MIT», и заморачиваться лицензией почти не нужно было. С появлением больших открытых моделей возник целый зоопарк нестандартных лицензий с разными ограничениями.
Лицензия модели регулирует:
- Коммерческое использование. Можно ли использовать модель в платном продукте.
- Дообучение (fine-tuning). Можно ли менять веса.
- Распространение производных. Можно ли публиковать fine-tune'ы, особенно коммерческие.
- Запрещённые применения. Нельзя для оружия, мошенничества, медицинских диагнозов и т.п.
- Атрибуция. Нужно ли указывать «built on Llama 3».
- Ограничения по масштабу. Некоторые лицензии действуют до определённого MAU.
- Использование вывода. Можно ли тренировать другие модели на ответах этой.
К 2026-му главные типы лицензий:
- Свободные (Apache 2.0, MIT). Почти без ограничений: бизнес, fine-tune, перепродажа, modification. Используют Mistral, Qwen, DeepSeek.
- Custom коммерческие. Разрешают коммерцию с условиями: атрибуция, лимиты по масштабу, запрет на тренировку других моделей. Llama Community License, Gemma Terms.
- Research only. Запрещают коммерческое использование, разрешают исследования. Mistral Research, некоторые ранние модели.
- Non-commercial. Запрещают коммерцию, разрешают личное использование. FLUX Dev.
- Closed. Без права скачать веса — только через API. GPT-4o, Claude, Gemini Pro.
Как это работает
Главные лицензии и их особенности:
Apache 2.0 / MIT. Стандарт open-source. Можно: коммерция, fine-tune, перепродажа, modification. Нельзя: использовать имена авторов как endorsement. Atрибуция — желательно. Используется в: Mistral 7B, Qwen 2.5, DeepSeek V3.
Llama Community License. Разрешает коммерческое использование. Запрещает: использовать вывод модели для обучения других моделей; «обманывать пользователей, что AI — человек»; использовать в продуктах с >700M MAU без отдельного согласия Meta. Атрибуция: «Built with Meta Llama 3» — обязательна.
Gemma Terms of Use. Google. Разрешает коммерческое использование. Ограничения: запрещённые применения (вред, дезинформация, нарушение прав). Уважительное использование требуется.
FLUX Dev. Black Forest Labs. Только non-commercial. Для коммерции — FLUX Pro через API ($) или enterprise-договор.
Stable Diffusion 3 Community License. Stability AI. Коммерческое использование разрешено до $1M годовой выручки или $1M прибыли. Сверх — требуется enterprise-лицензия.
OpenRAIL. Responsible AI License. Используют BLOOM, некоторые HuggingFace модели. Коммерция разрешена с этическими ограничениями (use-based restrictions).
Пример на практике
Стартап делает AI-помощника для видеомонтажа. Под капотом — LLM. Им нужно решить: какую модель использовать в бизнесе.
Анализ лицензий:
- GPT-4o / Claude API. Удобно, но дорого на масштабе, и данные клиентов уходят к провайдеру.
- Llama 3.1 70B. Community License: можно коммерчески, лимит 700M MAU (стартап точно ниже). НО: запрет на использование вывода Llama для обучения других моделей. Если они захотят дообучить другую LLM на ответах Llama — нарушение.
- Qwen 2.5 72B. Apache 2.0. Полная свобода: коммерция, fine-tune, перепродажа, нет ограничений на вывод.
- DeepSeek V3. MIT. Свобода почти как у Qwen, но требует серверного железа из-за 671B MoE.
Выбор: Qwen 2.5 72B как основной + DeepSeek для сложных reasoning-задач. Apache 2.0 / MIT — никаких юридических рисков, можно вырастать без переписывания контрактов.
В ComfyUI workflow собирается с теми же моделями через локальный inference. Никаких отчислений Meta, OpenAI или Stability — только электричество.
С чем часто путают
- Лицензия модели и open-source — open-source это категория; лицензия — конкретный документ. Llama 3 формально open-weight, лицензия — Community (с ограничениями).
- Лицензия модели и terms of service — лицензия применима к скачанным весам. ToS применим к API. Это разные документы.
- «Open weights» и «коммерчески свободно» — не одно и то же. Llama 3 open-weight, но с ограничениями для крупного бизнеса.
- Лицензия модели и лицензия датасета обучения — обычно разные. Модель может быть Apache 2.0, а данные, на которых её обучали — copyrighted (потенциальный риск).
- Personal use и Research use — personal обычно очень свободное (для себя). Research — для учебных и исследовательских целей. Coммерция без отдельного разрешения — запрещена.
Частые ошибки и заблуждения
- «Раз скачал — могу использовать». Только если лицензия позволяет ваше use-case. Скачать ≠ право на коммерческое использование.
- «FLUX можно для бизнеса». FLUX Dev — нельзя. FLUX Pro — да, через API. Это часто путают, потому что Dev и Pro — одна линейка.
- «Mistral Research = Open-weight». Веса открыты, но лицензия запрещает коммерцию. На Hugging Face такие модели имеют ясную пометку.
- «Лицензия = технические условия». Лицензия — юридический документ. Технические возможности (запустить, дообучить) от неё не зависят, но юридическое право — да.
- «Можно проигнорировать пункт про обучение других моделей». Это спорная зона права, и некоторые компании уже сталкивались с иском Meta из-за нарушения именно этого пункта.
Связанные термины
- Open-source AI / Open-weight — категории, к которым относятся лицензии.
- Apache 2.0 / MIT — самые свободные стандартные лицензии.
- Llama Community License — пример custom-лицензии для open-weight модели.
- Hugging Face — каталог, где указана лицензия каждой модели.
- Fine-tuning — операция, регулируемая лицензией.
- Commercial use — главное юридическое разделение.
Частые вопросы
Где смотреть лицензию модели? На странице модели на Hugging Face или в репозитории. Обычно файл LICENSE.md или раздел «License» в README. Для коммерческих моделей лицензия часто требует согласия перед скачиванием.
Можно ли использовать Llama в коммерческом продукте? Да, до 700M MAU. Сверх — нужно отдельное соглашение с Meta. Большинство стартапов спокойно укладывается в лимит.
Что такое «used for training» ограничение? Некоторые лицензии (Llama, Gemma) запрещают использовать вывод модели для обучения других моделей. Это касается distillation, где модель A учат имитировать модель B.
FLUX Dev можно для дохода с фриланса? Прямо в лицензии — нет, это коммерческое использование. Для фриланса используйте FLUX Pro через API или Stable Diffusion с Apache 2.0 / SDXL.
Лицензия модели передаётся при fine-tuning? Обычно да: производная модель наследует лицензию базы. Поэтому если базе нельзя коммерчески, вашему fine-tune тоже нельзя.
Главное
Лицензия модели — это не формальность, а реальные ограничения вашего бизнеса. Для коммерческих проектов выбирайте Apache 2.0 / MIT (Mistral, Qwen, DeepSeek) — почти полная свобода. Llama даёт коммерцию с условиями (атрибуция, лимит по MAU, запрет на вывод для обучения). FLUX Dev, Mistral Research, некоторые SD-варианты — non-commercial или research-only. Перед бизнес-проектом лицензии всех моделей в стеке нужно прочитать и сохранить — это та часть AI-инженерии, которая стоит времени и юриста.