Американские ученые утверждают, что скопировали принцип работы DeepSeek за $30

Исследователи Калифорнийского университета в Беркли утверждают, что смогли воспроизвести ключевые функции ИИ-модели DeepSeek еще дешевле. The post Американские ученые утверждают, что скопировали принцип работы DeepSeek за $30 appeared first on Хайтек.

Янв 31, 2025 - 18:46

Американские ученые утверждают, что скопировали принцип работы DeepSeek за $30

Недавно DeepSeek произвел фурор на рынке ИИ, представив R1 — большую языковую модель, которая, как утверждают разработчики, способна воспроизводить функции лучших нейросетей, но на обучение которой ушло в 20 раз меньше средств, чем у американских компаний. Исследователи из Беркли за $30 создали версию модели TinyZero, которая воспроизводит основные характеристики DeepSeek R1.

TinyZero опубликовали в открытом доступе на GitHub для экспериментов. Хотя в маленькой модели нет 671-миллиарда параметров, как в DeepSeek, разработчики утверждают, что TinyZero воспроизводит основные функции, наблюдаемые в DeepSeek «R1-Zero».

Подход ученых основан на обучении с подкреплением, технике, в которой ИИ, начиная с почти случайных догадок, постепенно уточняет свои ответы, пересматривая и перебирая возможные решения.

В посте, описывающем проект, ученые показали работу на примере игры Countdown. Это британская телевизионная головоломка, в которой игроки объединяют заданные числа, чтобы достичь целевого значения. Эксперименты показали, что хотя изначально ИИ выдавал «фиктивные результаты», в конечном итоге он понял, как исправить свои ошибки.

We reproduced DeepSeek R1-Zero in the CountDown game, and it just works

Through RL, the 3B base LM develops self-verification and search abilities all on its own

You can experience the Ahah moment yourself for < $30
Code: https://t.co/B2IsN1PrXV

Here's what we learned Читать Далее

Американские ученые утверждают, что скопировали принцип работы DeepSeek за $30

Теги:

Похожие записи

Популярные Записи