Что известно о прорывной нейросети QWEN 2.5-Max от Alibaba и почему она способна серьёзно изменить всё
После презентации новой китайской нейросети DeepSeek многие держатели акций американских разработчиков мрачно подсчитывали убытки и размышляли, не поставили ли они не на ту лошадку. Но не успел мир выдохнуть, как контрольный удар нанёс техногигант из Китая Alibaba, представивший ещё одну нейросеть, превосходящую и DeepSeek, и, как утверждается, все известные аналоги. Что собой представляет QWEN 2.5-Max, как можно с ней познакомиться и нужно ли для этого учить китайский — в разборе «Секрета».
После презентации новой китайской нейросети DeepSeek многие держатели акций американских разработчиков мрачно подсчитывали убытки и размышляли, не поставили ли они не на ту лошадку. Но не успел мир выдохнуть, как контрольный удар нанёс техногигант из Китая Alibaba, представивший ещё одну нейросеть, превосходящую и DeepSeek, и, как утверждается, все известные аналоги. Что собой представляет QWEN 2.5-Max, как можно с ней познакомиться и нужно ли для этого учить китайский — в разборе «Секрета».
Что такое Qwen 2.5-Max
Qwen 2.5-Max — новейшая модель искусственного интеллекта от крупнейшей китайской технологической компании Alibaba, совмещающая в себе функции чат-бота, генератора фото и видео.
По утверждениям разработчиков, тесты (бенчмарки) показывают, что Qwen 2.5-Max «почти по всем показателям» превосходит и представленную 10 января DeepSeek-V3, высоко оценённую экспертами, и передовые американские модели: - GPT-4o от OpenAI; - Claude 3.5 Sonnet от Anthropic; - Gemini 2.0 Flash от Google; - Llama-3.1−405B от Meta (запрещена и признана экстремистской в России).
Сеть оказалась лучше в точности ответов, скорости обработки данных и в адаптивности.
Также Alibaba уделила внимание стоимости и сложности обучения и применяла оптимизацию на каждом этапе. В результате для обучения Qwen 2.5-Max и работы с ней нужно значительно меньше вычислительных мощностей, чем у конкурентов.
Попробовать модель можно в Qwen Chat — веб-интерфейсе в формате чат-бота. Также API-интерфейс в виде приложения доступен на маркетплейсах. Сеть доступна для тестирования по свободной лицензии, но нужна регистрация и подписка.
Публичные независимые испытания Qwen 2.5-Max только начались — и немудрено, ведь нейросеть представили в первый день Китайского Нового года, когда практически вся Поднебесная не работает. Однако конкуренты более чем серьёзно отнеслись к успехам китайских коллег.
Характеристики
Qwen 2.5-Max построена на архитектуре Mixture-of-Experts (MoE). Для её обучения использовали более 20 трлн токенов информации (это реально много). А дополнительно внедрили самые современные методологии тонкой настройки (SFT) и обратной связи с человеком (RLHF).
Это позволяет модели: - запоминать много контекста и анализировать длинные тексты (как Gemini); - анализировать и писать программный код, в том числе создавать игры и приложения; - генерировать фото и видео; - решать сложные научные задачи; - распознавать и понимать содержание видео, фото, файлов; - считывать количество объектов на изображениях; - управлять компьютером аналогично нейросети ChatGPT от OpenAI; - понимать множество языков, в том числе китайский, английский и русский.
Ей можно поручать и различные задания, например забронировать билет на самолёт. Тесты показывают, что Qwen 2.5-Max понимает сложные инструкции на порядок лучше нейросетей предыдущих поколений.
Разработчики утверждают, что Qwen в состоянии однократно усвоить и проанализировать 1 млн единиц информации. И это серьёзный вызов, ведь большинство нейросетей едва способны удержать у себя в оперативной памяти 120 000 единиц информации. Команда Alibaba уверена, что её ИИ-модель может в обозримом будущем превзойти человеческий интеллект.
Стоимость подписки на Qwen 2.5-Max зависит от количества и сложности запросов. 1 млн токенов на вход (например, вопрос к ИИ) стоят $10, а 1 млн токенов на выход (ответ ИИ) — $30. В эти лимиты можно уместить множество обращений к чат-боту, доплачивая по мере необходимости.
Для сравнения: у DeepSeek аналогичные запросы обойдутся в $0,1−1 за 1 млн токенов.
Что это значит для рынка ИИ
Поспешный выпуск Qwen 2.5-Max в праздничные для Китая дни показывает, что успех DeepSeek оказал давление и на зарубежных, и на отечественных конкурентов. Но у нейросети от Alibaba есть все шансы превзойти своих китайских коллег.
Да, Alibaba не может похвастаться, что потратила на свою разработку сущие копейки — сумму не раскрывали, но намекнули, что Qwen 2.5-Max всё-таки будет подороже DeepSeek V3, которые якобы уложились в $5,6 млн. Но всё ещё дешевле того же ChatGPT, на разработку и обучение которого ушли миллиарды.
При этом у компании есть все ресурсы — и специалисты, и деньги, — чтобы сделать свою модель ещё мощнее и эффективнее. И денег становится ещё больше: на фоне внимания к китайским ИИ котировки Alibaba после презентации QWEN выросли с $95 до $101 за акцию. Китайский стартап ударил по известному производителю чипов для ИИ. Как Nvidia пострадала из-за DeepSeek
Вот только сам факт того, что небольшая, в общем-то, компания малыми затратами сумела создать модель, способную конкурировать с самыми передовыми ИИ, всё равно внушает конкурентам и инвесторам в эту отрасль смутные сомнения. И дело вовсе не в том, что Китай технологически обогнал Запад (хотя и это уже не за горами).
DeepSeek показали, что время первых, самых тяжёлых и дорогих шагов в разработке ИИ постепенно отходит в прошлое. Закономерный этап развития любой технологии — рано или поздно её научатся масштабировать, создавать быстрее и дешевле. И этот этап уже наступил.
А значит, будущее с большой вероятностью будет не за неповоротливыми техногигантами, где собственно разработка сильно тормозится разросшимся управленческим аппаратом, а за лёгкими на подъём стартапами, способными рисковать, экспериментировать и быстро ориентироваться в меняющимся технологическом ландшафте.