Por qué estas empresas emergentes de chips de IA se alegran por el escándalo de DeepSeek

Forbes México. Por qué estas empresas emergentes de chips de IA se alegran por el escándalo de DeepSeek Para una gran cantidad de empresas de chips de inteligencia artificial que desean destronar a Nvidia, DeepSeek es la oportunidad que estaban esperando. Por qué estas empresas emergentes de chips de IA se alegran por el escándalo de DeepSeek Richard Nieva

Ene 31, 2025 - 14:52
 0
Por qué estas empresas emergentes de chips de IA se alegran por el escándalo de DeepSeek

Forbes México.
Por qué estas empresas emergentes de chips de IA se alegran por el escándalo de DeepSeek

empresas chips IA

Un día después de que la empresa china DeepSeek eliminara más de 800.000 millones de dólares de la capitalización de mercado de los gigantes estadounidenses de los chips de inteligencia artificial, se podría pensar que Andrew Feldman, director ejecutivo de la empresa de chips de última generación Cerebras, estaría encerrado en una húmeda sala de guerra planeando cómo salvar su empresa. En cambio, está celebrando.

“Estamos un poco contentos”, dijo a Forbes . “Son días maravillosos. No podemos responder a los teléfonos lo suficientemente rápido en este momento”.

Suena contradictorio para una startup de chips de IA, pero Feldman dice que su compañía, que se espera que salga a bolsa a finales de este año, ha experimentado un gran interés desde que DeepSeek ha cambiado radicalmente la convención general en Silicon Valley de que más chips y mayores presupuestos equivalen a mejor IA. Después de que DeepSeek lanzara dos modelos de código abierto en las últimas semanas que eran casi tan buenos como la mejor tecnología estadounidense (pero eran mucho menos costosos de entrenar y operar, lo que provocó un pánico generalizado sobre la supremacía de la IA de Estados Unidos), apuesta a que el uso de la IA explotará.

“Cada vez que mejoramos el rendimiento de los sistemas informáticos y los reducimos a un menor costo, el mercado se hizo más grande, no más pequeño”, afirmó Feldman. “Siempre”.

Es tan optimista porque Cerebras, que actualmente está valuada en 4 mil millones de dólares, fabrica chips diseñados específicamente para que sea más eficiente el uso de la IA. Este proceso se llama “inferencia”: básicamente, el acto de ejecutar un modelo de IA y permitirle “pensar” y razonar como un humano, en lugar del trabajo de introducir datos en el modelo para enseñarle cómo hacer ese razonamiento para empezar. La inferencia es lo que sucede cada vez que le pides a ChatGPT que escriba un correo electrónico o resuelva un problema de codificación.

Y cuando se trata de inferencia, el dominio de Nvidia es menos severo, lo que ha permitido que surjan varias empresas emergentes más pequeñas. Los pares de Cerebras en la industria de chips para empresas emergentes le dijeron a Forbes que están igualmente entusiasmados por el cambio que DeepSeek ha provocado. “DeepSeek cambió el guión de la IA para el código abierto y la inferencia”, dijo Rodrigo Liang, CEO de SambaNova de $ 5.1 mil millones. Sunny Madra, director de operaciones de Groq de $ 2.8 mil millones , le dijo a Forbes que ha visto un aumento en las suscripciones y el uso de sus chips después de agregar el modelo R1 de DeepSeek a su plataforma GroqCloud, donde alquila el acceso a su poder de cómputo. “Es realmente bueno para las personas que se centran en la inferencia”, dijo. “Es una reacción que se venía esperando desde hace mucho tiempo para que la inferencia se volviera mucho más importante que el entrenamiento”, dijo Robert Wachen, cofundador de Etched, una empresa en etapa inicial que recaudó una Serie A de $ 120 millones en junio.

“No sabemos si fueron 6 millones o 60 millones, pero no fueron 600 millones”.

Rodrigo Liang, director ejecutivo de SambaNova

Las afirmaciones de DeepSeek —que entrenó a V3, un modelo de lenguaje de 671 mil millones de parámetros lanzado a fines de diciembre, en dos meses por solo $5,58 millones, órdenes de magnitudes menores a los $100 millones que OpenAI gastó en su (aunque más grande) modelo GPT-4— están siendo muy cuestionadas. Muchos en la industria creen que DeepSeek utilizó más dinero y poder computacional de lo que la compañía dejó ver, y el CEO de Scale, Alexandr Wang, afirmó que la compañía poseía alrededor de 50.000 H100, chips de última generación de Nvidia prohibidos en China. Pero el impacto del precio inverso ha impresionado a los rivales estadounidenses de todos modos. “No sabemos si fueron $6 millones o $60 millones, pero no fueron $600 millones”, dijo Liang de SambaNova.

DeepSeek demostró no solo que se puede entrenar un modelo de forma más económica, sino que invertir más en inferencia produciría mejores resultados. La semana pasada, DeepSeek publicó el código abierto de R1, un modelo de razonamiento similar al modelo o1 de OpenAI, pero que es de uso gratuito (mientras que OpenAI cobra 200 dólares al mes). Y R1, como todos los modelos de razonamiento, utiliza más poder de inferencia a medida que “piensa” en los múltiples pasos de las consultas. La existencia de modelos con mayor intensidad de inferencia, combinados con más personas que utilizan la IA porque es más barata, es una buena noticia para Cerebras y sus similares.

La reacción es egoísta para este grupo de empresas que compiten por destronar a Nvidia, que ahora vale 2,93 billones de dólares, incluso después de una caída del mercado del 17% el lunes que eliminó casi 600.000 millones de dólares en valor. La caída fue “un juicio sobre el hecho de que la mayor parte del negocio de Nvidia estaba vinculado a que estas grandes empresas compraran muchos racks de GPU para el preentrenamiento”, no para hacer inferencias, dijo Liang.

Pero el CEO Jensen Huang es un competidor formidable. Ha estado promocionando la capacidad de inferencia de la compañía durante meses, y todas las empresas emergentes de chips le dijeron a Forbes que la caída de las acciones de Nvidia fue una reacción exagerada. Después de la caída de las acciones, la compañía respondió con una declaración en la que promocionaba sus propias capacidades de inferencia. “La inferencia requiere una cantidad significativa de GPU Nvidia y redes de alto rendimiento”, dijo la compañía en una declaración a Forbes .

Mientras tanto, los grandes laboratorios de vanguardia de la IA, como OpenAI, Anthropic o Google DeepMind, que han gastado miles de millones en las GPU de Nvidia, no han desperdiciado su dinero. DeepSeek mostró a la industria cómo optimizar más allá de lo que se había hecho antes, y eso solo significa una IA más grande y mejor para todos. “Si tienes un proceso de entrenamiento más eficiente, entonces tomas el mismo cálculo y entrenas un modelo más grande”, dijo Evan Conrad, cofundador de la tienda de GPU San Francisco Compute Company, a Forbes .

Además de las proezas técnicas que Silicon Valley seguramente emulará, el éxito de DeepSeek tuvo otras repercusiones para las empresas de chips más pequeñas que se encuentran a la sombra de Nvidia. “Para aquellos de nosotros que somos los menos favorecidos, esto debería entusiasmarnos”, dijo Feldman.

Este artículo fue publicado originalmente por Forbes US.

Te puede interesar: Conoce a DeepSeek, la empresa china de IA que Trump considera una ‘llamada de atención’ para Silicon Valley

Por qué estas empresas emergentes de chips de IA se alegran por el escándalo de DeepSeek
Richard Nieva