Россия повторит успех Deepseek в 2025 году
Итак, китайская компания Deepseek произвела революцию на рынке ИИ, выпустив языковую модель которая работает сравнимо с ChatGPT, но при этом ее обучение и функционирование стоит в десятки раз дешевле. Кроме того, китайцы открыли исходные коды модели, из которых уже ясно, что это не фейк, а действительно новая технология, которая позволяет использовать лишь небольшую часть нейросети для генерации каждого токена. Так вот, обучение Deepseek обошлось в $5.8M, что примерно в 15 раз меньше, чем выделено в России на развитие ИИ в 2025 году. Если сложить 2+2 (open-source и финансы), то становится понятно, что в 2025 году даже Минцифры РФ сможет догнать Америку, по крайней мере по оценке ИИ-бенчмарков. Ну и ИИ-модели Яндекса/Сбера тоже выйдут на уровень ChatGPT. Однако, есть подозрение, что технология Deepseek может привести к более глупым ошибкам модели (в т.ч. в ответах на важные вопросы), т.к. использование лишь части нейросети может случайно отрезать какие-то важные параметры.
Итак, китайская компания Deepseek произвела революцию на рынке ИИ, выпустив языковую модель которая работает сравнимо с ChatGPT, но при этом ее обучение и функционирование стоит в десятки раз дешевле. Кроме того, китайцы открыли исходные коды модели, из которых уже ясно, что это не фейк, а действительно новая технология, которая позволяет использовать лишь небольшую часть нейросети для генерации каждого токена. Так вот, обучение Deepseek обошлось в $5.8M, что примерно в 15 раз меньше, чем выделено в России на развитие ИИ в 2025 году. Если сложить 2+2 (open-source и финансы), то становится понятно, что в 2025 году даже Минцифры РФ сможет догнать Америку, по крайней мере по оценке ИИ-бенчмарков. Ну и ИИ-модели Яндекса/Сбера тоже выйдут на уровень ChatGPT. Однако, есть подозрение, что технология Deepseek может привести к более глупым ошибкам модели (в т.ч. в ответах на важные вопросы), т.к. использование лишь части нейросети может случайно отрезать какие-то важные параметры.