Model License

model license — юридические условия использования AI-модели

Раздел
Основы AI
Обновлено
18.05.26

Лицензия модели — юридическое соглашение, описывающее, как можно использовать веса AI-модели. Скачать модель и запустить локально часто можно бесплатно, но коммерческое использование, дообучение или перепродажа могут быть ограничены. Главные категории лицензий: свободные (Apache 2.0, MIT — почти без ограничений), custom коммерческие (Llama Community), research-only, non-commercial. Перед бизнес-проектом лицензию читать обязательно.

Коротко

Коротко. Каждая открытая AI-модель идёт с лицензией — юридическим документом, описывающим, что можно делать с её весами. Самые свободные (Apache 2.0, MIT) разрешают коммерческое использование, fine-tuning, перепродажу. Llama Community разрешает коммерцию, но с ограничениями. FLUX Dev — только non-commercial. Перед использованием в продукте лицензию нужно читать целиком.

Что это такое

Конец 2023-го. Стартап запускает чат-бот на Llama 2 как часть платной B2B-платформы. Через полгода случайно выясняют, что лицензия Llama 2 запрещает использовать вывод модели для обучения других моделей. А они как раз дообучали Mistral на ответах Llama. Пришлось переделать пайплайн и потратить квартал на переход.

Это типичная история — AI-лицензии стали серьёзной юридической областью. Раньше open-source значило «Apache 2.0 или MIT», и заморачиваться лицензией почти не нужно было. С появлением больших открытых моделей возник целый зоопарк нестандартных лицензий с разными ограничениями.

Лицензия модели регулирует:

  1. Коммерческое использование. Можно ли использовать модель в платном продукте.
  2. Дообучение (fine-tuning). Можно ли менять веса.
  3. Распространение производных. Можно ли публиковать fine-tune'ы, особенно коммерческие.
  4. Запрещённые применения. Нельзя для оружия, мошенничества, медицинских диагнозов и т.п.
  5. Атрибуция. Нужно ли указывать «built on Llama 3».
  6. Ограничения по масштабу. Некоторые лицензии действуют до определённого MAU.
  7. Использование вывода. Можно ли тренировать другие модели на ответах этой.

К 2026-му главные типы лицензий:

  • Свободные (Apache 2.0, MIT). Почти без ограничений: бизнес, fine-tune, перепродажа, modification. Используют Mistral, Qwen, DeepSeek.
  • Custom коммерческие. Разрешают коммерцию с условиями: атрибуция, лимиты по масштабу, запрет на тренировку других моделей. Llama Community License, Gemma Terms.
  • Research only. Запрещают коммерческое использование, разрешают исследования. Mistral Research, некоторые ранние модели.
  • Non-commercial. Запрещают коммерцию, разрешают личное использование. FLUX Dev.
  • Closed. Без права скачать веса — только через API. GPT-4o, Claude, Gemini Pro.

Как это работает

Главные лицензии и их особенности:

Apache 2.0 / MIT. Стандарт open-source. Можно: коммерция, fine-tune, перепродажа, modification. Нельзя: использовать имена авторов как endorsement. Atрибуция — желательно. Используется в: Mistral 7B, Qwen 2.5, DeepSeek V3.

Llama Community License. Разрешает коммерческое использование. Запрещает: использовать вывод модели для обучения других моделей; «обманывать пользователей, что AI — человек»; использовать в продуктах с >700M MAU без отдельного согласия Meta. Атрибуция: «Built with Meta Llama 3» — обязательна.

Gemma Terms of Use. Google. Разрешает коммерческое использование. Ограничения: запрещённые применения (вред, дезинформация, нарушение прав). Уважительное использование требуется.

FLUX Dev. Black Forest Labs. Только non-commercial. Для коммерции — FLUX Pro через API ($) или enterprise-договор.

Stable Diffusion 3 Community License. Stability AI. Коммерческое использование разрешено до $1M годовой выручки или $1M прибыли. Сверх — требуется enterprise-лицензия.

OpenRAIL. Responsible AI License. Используют BLOOM, некоторые HuggingFace модели. Коммерция разрешена с этическими ограничениями (use-based restrictions).

Пример на практике

Стартап делает AI-помощника для видеомонтажа. Под капотом — LLM. Им нужно решить: какую модель использовать в бизнесе.

Анализ лицензий:

  • GPT-4o / Claude API. Удобно, но дорого на масштабе, и данные клиентов уходят к провайдеру.
  • Llama 3.1 70B. Community License: можно коммерчески, лимит 700M MAU (стартап точно ниже). НО: запрет на использование вывода Llama для обучения других моделей. Если они захотят дообучить другую LLM на ответах Llama — нарушение.
  • Qwen 2.5 72B. Apache 2.0. Полная свобода: коммерция, fine-tune, перепродажа, нет ограничений на вывод.
  • DeepSeek V3. MIT. Свобода почти как у Qwen, но требует серверного железа из-за 671B MoE.

Выбор: Qwen 2.5 72B как основной + DeepSeek для сложных reasoning-задач. Apache 2.0 / MIT — никаких юридических рисков, можно вырастать без переписывания контрактов.

В ComfyUI workflow собирается с теми же моделями через локальный inference. Никаких отчислений Meta, OpenAI или Stability — только электричество.

С чем часто путают

  • Лицензия модели и open-source — open-source это категория; лицензия — конкретный документ. Llama 3 формально open-weight, лицензия — Community (с ограничениями).
  • Лицензия модели и terms of service — лицензия применима к скачанным весам. ToS применим к API. Это разные документы.
  • «Open weights» и «коммерчески свободно» — не одно и то же. Llama 3 open-weight, но с ограничениями для крупного бизнеса.
  • Лицензия модели и лицензия датасета обучения — обычно разные. Модель может быть Apache 2.0, а данные, на которых её обучали — copyrighted (потенциальный риск).
  • Personal use и Research use — personal обычно очень свободное (для себя). Research — для учебных и исследовательских целей. Coммерция без отдельного разрешения — запрещена.

Частые ошибки и заблуждения

  • «Раз скачал — могу использовать». Только если лицензия позволяет ваше use-case. Скачать ≠ право на коммерческое использование.
  • «FLUX можно для бизнеса». FLUX Dev — нельзя. FLUX Pro — да, через API. Это часто путают, потому что Dev и Pro — одна линейка.
  • «Mistral Research = Open-weight». Веса открыты, но лицензия запрещает коммерцию. На Hugging Face такие модели имеют ясную пометку.
  • «Лицензия = технические условия». Лицензия — юридический документ. Технические возможности (запустить, дообучить) от неё не зависят, но юридическое право — да.
  • «Можно проигнорировать пункт про обучение других моделей». Это спорная зона права, и некоторые компании уже сталкивались с иском Meta из-за нарушения именно этого пункта.

Связанные термины

  • Open-source AI / Open-weight — категории, к которым относятся лицензии.
  • Apache 2.0 / MIT — самые свободные стандартные лицензии.
  • Llama Community License — пример custom-лицензии для open-weight модели.
  • Hugging Face — каталог, где указана лицензия каждой модели.
  • Fine-tuning — операция, регулируемая лицензией.
  • Commercial use — главное юридическое разделение.

Частые вопросы

Где смотреть лицензию модели? На странице модели на Hugging Face или в репозитории. Обычно файл LICENSE.md или раздел «License» в README. Для коммерческих моделей лицензия часто требует согласия перед скачиванием.

Можно ли использовать Llama в коммерческом продукте? Да, до 700M MAU. Сверх — нужно отдельное соглашение с Meta. Большинство стартапов спокойно укладывается в лимит.

Что такое «used for training» ограничение? Некоторые лицензии (Llama, Gemma) запрещают использовать вывод модели для обучения других моделей. Это касается distillation, где модель A учат имитировать модель B.

FLUX Dev можно для дохода с фриланса? Прямо в лицензии — нет, это коммерческое использование. Для фриланса используйте FLUX Pro через API или Stable Diffusion с Apache 2.0 / SDXL.

Лицензия модели передаётся при fine-tuning? Обычно да: производная модель наследует лицензию базы. Поэтому если базе нельзя коммерчески, вашему fine-tune тоже нельзя.

Главное

Лицензия модели — это не формальность, а реальные ограничения вашего бизнеса. Для коммерческих проектов выбирайте Apache 2.0 / MIT (Mistral, Qwen, DeepSeek) — почти полная свобода. Llama даёт коммерцию с условиями (атрибуция, лимит по MAU, запрет на вывод для обучения). FLUX Dev, Mistral Research, некоторые SD-варианты — non-commercial или research-only. Перед бизнес-проектом лицензии всех моделей в стеке нужно прочитать и сохранить — это та часть AI-инженерии, которая стоит времени и юриста.