DeepSeek: Все, что нужно знать об этом ИИ чатботе

DeepSeek — это китайская лаборатория ИИ, которая быстро завоевала международную известность благодаря своим мощным моделям искусственного интеллекта. Узнайте о её происхождении, технологиях и влиянии на мировой рынок ИИ.
Все что нужно знать о DeepSeek

DeepSeek стал вирусным явлением.
Китайская лаборатория ИИ DeepSeek привлекла внимание общественности на предыдущей неделе, когда её чатбот-приложение взлетело на вершины рейтингов Apple App Store и Google Play. Модели ИИ DeepSeek, обученные с использованием вычислительно эффективных методов, заставили аналитиков Уолл-стрит и технологов задуматься: сможет ли США сохранить своё лидерство в гонке ИИ и как долго будет устойчивым спрос на ИИ-чипы от NVIDIA?

Но откуда появился DeepSeek и как ему удалось так быстро добиться международной известности?


Трейдерские корни DeepSeek

DeepSeek финансируется компанией High-Flyer Capital Management — китайским количественным хедж-фондом, который использует ИИ для принятия торговых решений.

Энтузиаст ИИ Лян Вэньфэн основал High-Flyer в 2015 году. Согласно сообщениям, он начал экспериментировать с торговлей ещё будучи студентом Чжэцзянского университета. В 2019 году Вэньфэн запустил High-Flyer Capital Management как хедж-фонд, сосредоточенный на разработке и внедрении алгоритмов ИИ.

В 2023 году High-Flyer создала DeepSeek как лабораторию для исследования ИИ-инструментов, не связанных с финансовым бизнесом. Со временем лаборатория отделилась в самостоятельную компанию с тем же названием.

С самого начала DeepSeek строила собственные центры обработки данных для обучения моделей. Однако, как и другие китайские компании ИИ, она столкнулась с ограничениями на экспорт оборудования из США. Для обучения одной из своих последних моделей компании пришлось использовать чипы Nvidia H800 — менее мощную версию чипа H100, доступного американским компаниям.

Техническая команда DeepSeek, как сообщается, состоит в основном из молодых специалистов. Компания активно набирает докторов наук в области ИИ из ведущих китайских университетов. По данным The New York Times, DeepSeek также нанимает людей без опыта в компьютерных науках, чтобы помочь своей технологии лучше понимать широкий спектр предметов.


Мощные модели DeepSeek

DeepSeek представил свои первые модели — DeepSeek Coder, DeepSeek LLM и DeepSeek Chat — в ноябре 2023 года. Однако индустрия ИИ обратила внимание на стартап только прошлой весной, когда он выпустил семейство моделей следующего поколения DeepSeek-V2.

DeepSeek-V2 — это универсальная система для анализа текста и изображений, которая показала отличные результаты в различных тестах ИИ и была значительно дешевле в эксплуатации, чем аналогичные модели того времени. Это заставило местных конкурентов DeepSeek, включая ByteDance и Alibaba, снизить цены на использование некоторых своих моделей и сделать другие полностью бесплатными.

DeepSeek-V3, запущенный в декабре 2024 года, только усилил репутацию компании.

Согласно внутренним тестам DeepSeek, модель V3 превосходит как загружаемые открытые модели, такие как *Meta’s Llama, так и «закрытые» модели, доступные только через API, например, OpenAI’s GPT-4o.

Не менее впечатляет модель DeepSeek R1 — «рассуждающая» модель. Представленная в январе, R1, по утверждению DeepSeek, показывает результаты на ключевых бенчмарках на уровне OpenAI’s o1.

Будучи моделью рассуждений, R1 эффективно проверяет себя, что помогает ей избежать многих ошибок, которые обычно затрудняют работу других моделей. Рассуждающие модели работают немного дольше — обычно на несколько секунд или минут больше — но они более надёжны в таких областях, как физика, наука и математика.

Однако есть и минусы у R1, V3 и других моделей DeepSeek. Поскольку это китайские разработки ИИ, их ответы проверяются китайским интернет-регулятором на соответствие «основным социалистическим ценностям». Например, в чатбот-приложении DeepSeek модель R1 не будет отвечать на вопросы о площади Тяньаньмэнь или автономии Тайваня.


Разрушительный подход

Если у DeepSeek и есть бизнес-модель, то она остаётся неясной. Компания предлагает свои продукты и услуги по ценам значительно ниже рыночных, а некоторые — вообще бесплатно.

По словам самой DeepSeek, прорывы в эффективности позволили ей поддерживать экстремальную конкурентоспособность по стоимости. Однако некоторые эксперты оспаривают цифры, предоставленные компанией.

Как бы то ни было, разработчики активно используют модели DeepSeek, которые, хотя и не являются полностью открытыми, доступны под лицензиями, позволяющими коммерческое использование. По словам Клема Деланга, генерального директора Hugging Face (одной из платформ, где размещаются модели DeepSeek), разработчики на Hugging Face создали более 500 «производных» моделей R1, которые совокупно скачаны 2,5 миллионов раз.

Успех DeepSeek против более крупных и устоявшихся конкурентов был описан как «переворачивающий ИИ с ног на голову» и «чрезмерно раздутый». Успех компании частично стал причиной падения акций Nvidia на 18% в понедельник, а также вызвал публичный отклик от генерального директора OpenAI Сэма Альтмана.

Microsoft объявила, что DeepSeek доступен на её сервисе Azure AI Foundry — платформе, объединяющей ИИ-услуги для предприятий. Когда его спросили о влиянии DeepSeek на расходы *Meta на ИИ во время телефонной конференции по итогам первого квартала, генеральный директор Марк Цукерберг заявил, что инвестиции в инфраструктуру ИИ останутся «стратегическим преимуществом» для *Meta.

Что ждёт DeepSeek в будущем? Пока не ясно. Улучшенные модели — это данность. Но правительство США, кажется, начинает беспокоиться о том, что воспринимает как вредное иностранное влияние. Сейчас уже начались блокировки приложения в Штатах

Подпишитесь на нашу рассылку в телеграм «AI Тренды» посвящённую ИИ, чтобы получать актуальные новости.

Эта статья была впервые опубликована 3 февраля и будет постоянно обновляться новой информацией.

Total
1
Shares
Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Предыдущая новость

Агенты с искусственным интеллектом могли бы произвести на свет первого единорога — но какой ценой это обойдется обществу?

Следующая новость
Сотни компаний блокируют DeepSeek

Сотни компаний блокируют DeepSeek из-за рисков с данными из Китая

Читайте также