Французский стартап в области искусственного интеллекта Mistral выпустил свои первые модели генеративного искусственного интеллекта, предназначенные для работы на современных устройствах, таких как ноутбуки и телефоны.
Новое семейство моделей, которое компания Mistral называет “Les Ministraux”, может использоваться или настраиваться для различных задач – от создания базового текста до совместной работы с более совершенными моделями для выполнения задач.
Доступны две модели Les Ministraux — Ministral 3B и Ministral 8B, каждая из которых имеет контекстное окно объемом 128 000 токенов, что означает, что они могут вместить примерно 50-страничную книгу.
“Наши самые инновационные клиенты и партнеры все чаще обращаются к локальным решениям, ориентированным на конфиденциальность, для критически важных приложений, таких как перевод на устройстве, умные помощники без Интернета, локальная аналитика и автономная робототехника”, – пишет Мистраль в своем блоге. “Les Ministraux были созданы для обеспечения эффективного использования вычислений и решения с низкой задержкой для таких сценариев”.
Ministral 8B доступен для скачивания с сегодняшнего дня, хотя и исключительно в исследовательских целях. Компания Mistral требует, чтобы разработчики и компании, заинтересованные в системах самостоятельного развертывания Ministral 8B или Ministral 3B, обращались к ней за коммерческой лицензией.
В противном случае разработчики могут использовать Ministral 3B и Ministral 8B через облачную платформу Mistral, Le Platforme, и другие облака, с которыми стартап будет сотрудничать в ближайшие недели. Ministral 8B стоит 10 центов за миллион токенов вывода/ввода (~750 000 слов), в то время как Ministral 3B стоит 4 цента за миллион токенов вывода/ввода.
В последнее время наблюдается тенденция к созданию небольших моделей, которые дешевле и быстрее в обучении, точной настройке и эксплуатации, чем их более крупные аналоги. Google продолжает пополнять семейство моделей Gemma small, в то время как Microsoft предлагает свою коллекцию моделей Phi. В последнем обновлении своего пакета Llama компания Meta представила несколько небольших моделей, оптимизированных для оборудования edge.
Компания Mistral утверждает, что Ministral 3B и Ministral 8B превосходят аналогичные модели Llama и Gemma, а также ее собственный Mistral 7B по нескольким критериям искусственного интеллекта, предназначенным для оценки выполнения инструкций и возможностей решения проблем.
Базирующаяся в Париже компания Mistral, которая недавно привлекла венчурный капитал в размере 640 миллионов долларов, продолжает постепенно расширять свой портфель продуктов для искусственного интеллекта. За последние несколько месяцев компания запустила бесплатный сервис для разработчиков по тестированию своих моделей, SDK, позволяющий клиентам точно настраивать эти модели, и новые модели, включая генеративную модель для кода под названием Codestral.
Миссия компании Mistral, основанной выпускниками Meta и Google DeepMind, заключается в создании флагманских моделей, которые будут конкурировать с самыми производительными моделями на сегодняшний день, такими как GPT-4o от OpenAI и Claude от Anthropic, и, в идеале, будут приносить доход в процессе работы. В то время как “зарабатывание денег” оказывается сложной задачей (как и для большинства стартапов с генеративным ИИ), Mistral, как сообщается, начала приносить доход этим летом.