Tres estrategias para la AGI: Stargate, ALIA y Deepseek R1
En una semana hemos asistido a tres anuncios que nos pueden ayudar a entender las tres sociedades en competencia a la hora de abordar la inteligencia artificial.
En una semana hemos asistido a tres anuncios que nos pueden ayudar a entender las tres sociedades en competencia a la hora de abordar la inteligencia artificial.
Creo que merece la pena analizarlos juntos, ya que nos permiten tener una idea de lo que será 2025 en términos de tecnología, política y legislación.
Publi
Hoy os comparto el que considero el mejor máster de inteligencia artificial que se puede hacer ahora en español"
Y lo digo con todas las letras por tres razones:
el nivel de profesores. A muchos los sigo desde hace años, todos están implicados en crear, implementar y diseñar la adopción estratégica de IA.
el modelo de enseñanza: 100% online, mentorías, eventos extra exclusivos, webinars sobre lo más relevante que está pasando.
el nivel de los alumnos: El 92% de ellos son directivos o mandos intermedios; aplican lo aprendido en roles estratégicos.
Os dejo un código que me han creado con un descuentazo de 300 euros si vais de parte, de mi lista o mi perfil: error300
(sí, es "error300", para dejar claro la cantidad rebajada... queda poco tiempo para cerrar la siguiente promoción que empieza en Febrero).
Escena 1. Stargate en Estados Unidos
500.000 millones de dólares de inversión en los próximos cuatro años para la construcción de una nueva infraestructura de IA. El grupo fundador está compuesto por SoftBank, OpenAI, Oracle y MGX. Arm, Microsoft, NVIDIA, Oracle y OpenAI son los principales socios tecnológicos iniciales.
En la presentación, el presidente Trump alegó que la empresa crearía "más de 100.000 puestos de trabajo estadounidenses casi de inmediato". Sam Altman añadió: "Creo que será el proyecto más importante de esta era". Y que era la base para la conseción de la AGI, la inteligencia artificial de general de nivel humano.
El apoyo del nuevo gobierno no se traduce en financiación. Stargate parte, en principio, sólo con inversión privada. Eso sí, si había alguna duda de regulación entorpecedora, la nueva administración estadounidense acaba de eliminar la Orden Ejecutiva sobre “Safe, Secure, and Trustworthy Development and Use of Artificial Intelligence” de Biden (que de por sí no era para nada tan restrictiva como la AI Act Europea).
Escena 2. España presenta los modelos ALIA
Anuncio de Pedro Sánchez reforzando la estrategia ya hace tiempo anunciada. Se quieren modelos propios en español y las lenguas cooficiales y el objetivo es ofrecerlos a la sociedad y, sobre todo, aplicar la inteligencia artificial en las administraciones públicas.
El modelo más interesante de los presentados es el ALIA-40B. Ha sido desarrollado por el Barcelona Supercomputing Center (BSC) utilizando el MareNostrum 4 con un enfoque en lenguajes europeos.
Ha sido recibido, digamos, con escepticismo. He leído críticas afirmando que se basa en llama-2 (no es correcto, está entrenado desde 0, otra cosa es que usaran algún elemento de la IA de Meta como el tokenizador) o que su nivel en los benchmarks es comparable al de ese otro modelo en su versión 34B. O en todo caso, que es inferior a llama-3, lo que sitúa al modelo en el nivel alcanzado por la industria en la segunda mitad de 2023.
Gran parte del problema con iniciativas como ALIA y su comparación con el estado del arte de las grandes empresas USA está en la legislación europea. Aunque todavía no está por completo en vigor, la AI Act establece que los grandes modelos deben de ser transparentes sobre los contenidos utilizados para entrenar. Ni Meta, ni Anthropic, ni OpenAI cumplen esto.
Siendo así, si el gobierno quiere utilizar un gran modelo de lenguaje en la administración estando seguro de que cumplirá la AI Act entonces tiene que crearlo desde 0 y con datasets que no sean problemáticos. De hecho el proyecto de ley del Ministerio de Cultura permitiría el uso de contenidos con copyright para entrenar IA con una especie de canon por ese uso. Pero no está claro que vaya a salir adelante.
Creo que es un ejemplo válido que muestra la postura europea. Más proteccionista del status quo, más tendente a intentar evitar los escenarios extremos: en el plan y el discurso público, los negativos potenciales a los que la IA nos podría llevar; de facto, también los más positivos.
Escena 3. Deepseek en China
Primero fue Deepseek V3 hace unas semanas consiguiendo un nivel “GPT 4-o”. Pero no sólo es la calidad de las salidas, es que es abierto y mucho más barato de entrenar y ejecutar. Ahora toca hablar de Deepseek R1, también chino, también abierto y esta vez del nivel de o1 de OpenAI.
Lo debatíamos en monos estocásticos. La estrategia china no pasa tanto por estar en el filo de la innovación científica sino por entenderse capaces de alcanzar a las empresas estadounidenses en cada avance que hagan. El estado no sólo permite sino que acompaña, impulsa y dirige: todos los datos y contenidos que sean necesarios se utilizan.
Kai-Fu Lee, viejo conocido de esta lista, apunta además que el veto para comprar chips de última generación de compañías occidentales ha creado un incentivo enorme hacia la eficiencia en la industria de la IA china. Eso explicaría en parte que los modelos de Deepseek resulten mucho más económicos.
Tres caminos y la AGI
El momento actual evoca a ciertos pasajes de la historia (la revolución industrial, la energía atómica, la apuesta por los seminconductores, internet) en la que las apuestas y las decisiones resultan cruciales a la hora de dictaminar qué países se enriquecen, cuáles ganan guerras y quiénes quedan rezagados a remolque. Qué apuestas resultan un engaño, qué riesgos excesivos y qué prudencia conduce a la mediocridad.
What's Your Reaction?