El nuevo modo de ChatGPT que ve a través de la cámara es tan alucinante como preocupante para mi privacidad
Ya hemos probado la siguiente evolución de la IA. No es que sea más lista, ni que sea más abierta. Ahora es mucho más útil. Hablamos del nuevo modo 'Cámara en Directo' de OpenAI que recientemente ha llegado a los usuarios de Europa. Lo hemos estado probando durante varios días y es sin duda un enorme salto adelante. ChatGPT ahora tiene lo que se ha descrito popularmente como un modo 'Her'. ¿Por qué? Básicamente porque ahora ChatGPT puede contestarnos a lo que le vamos diciendo y sus respuestas son en base a lo que le estamos enseñando desde la cámara del móvil. Es decir, si enfocamos una fruta, ChatGPT nos dirá que es una manzana. Si enfocamos a nuestra mascota, nos dirá que es un bonito gato blanco y negro. Pero no termina ahí. ChatGPT tiene también ahora la capacidad de ver lo que se muestra en la pantalla de nuestro móvil. Y esta es la parte más preocupante. El modo 'Cámara en directo' reinventa ChatGPT Los usuarios con la suscripción de ChatGPT Plus ya tienen acceso a este nuevo modo. Para utilizarlo debemos pulsar sobre el micrófono para activar la conversación por voz. La novedad es que ahora aparecen también varios botones nuevos. El primero de ellos es el de la cámara. Si pulsamos se nos mostrará la cámara y podremos hablarle a ChatGPT y preguntarle sobre lo que estamos enfocando. Lo hemos probado en distintos escenarios y el reconocimiento de objetos de GPT-4o es muy bueno. ChatGPT no solo reconoce el objeto, le podemos preguntar sobre detalles de este. Al nivel de en qué estado está la pieza de fruta o cuál es la marca de la moto que estamos viendo. Esta opción da mucho juego, pues podemos por ejemplo pedirle a ChatGPT que nos diga cuántos dedos levantados tenemos o incluso jugar al Pictionary. Aquí es muy divertido pues la IA nos va dando opciones y es bastante avispada incluso aunque nuestras dotes de dibujo sean bastante malas. Otro uso de lo más interesante es la resolución de problemas matemáticos. Podemos enfocar una fórmula y ChatGPT nos contestará con la respuesta. Lo hemos probado con ecuaciones sencillas donde acierta totalmente pero también le hemos pasado fórmulas complejas y para la IA es igualmente sencillo. Por supuesto habrá centenares de usos distintos. Las posibilidades son enormes. El resultado es tan sorprendente como cuando apareció ChatGPT en su primer lugar. Sí es verdad que hay margen de mejora, principalmente porque el feedback no es 100% fluido. Tenemos que ir preguntándole cada vez a la IA qué es lo que está viendo para que analice la imagen a través de la cámara. Nos parece difícil que alguien vaya a enamorarse de ChatGPT solo por esta función, pero sí es un paso claramente superior el poder "sentir" que la IA "entiende" lo que tenemos enfrente. Pasamos de una interacción puramente basada en el texto a algo basado en imagen y sonido, mucho más llamativo visualmente. En Xataka Sundar Pichai (CEO de Google) cree que 'Her' es inevitable: "habrá personas que se enamoren de una IA y deberíamos prepararnos" Dar acceso a ChatGPT a nuestra pantalla es una idea peliaguda Además de acceso a la cámara, la nueva función de ChatGPT puede tener acceso a la pantalla del teléfono. Esto permite a la IA analizar lo que aparece en una captura de pantalla y también analizar lo que se muestra en una determinada aplicación o en toda la pantalla. Es decir, ChatGPT puede saber si estamos viendo el correo, si estamos en WhatsApp o qué vídeo estamos viendo. Es literalmente darle acceso a la pantalla de nuestro móvil y es tan directo que la primera vez que lo activamos la propia ChatGPT nos envía una advertencia que información sensible puede estar siendo vista. La función recuerda a Recall de Windows y toda la polémica con la privacidad de los usuarios. OpenAI simplemente está viendo todo lo que aparece en nuestro móvil, sin filtro. Hay varias opciones, desde darle acceso a la pantalla o solo a una aplicación. El nivel de precisión es correcto. No aprecia detalles muy concretos sobre la carátula de un vídeo o la letra más pequeña, pero sí reconoce cuál es el título exacto de una conversación o vídeo. O también sabe qué estamos escuchando si le enseñamos Spotify. OpenAI con esta función de 'Cámara en directo' a la práctica nos está pidiendo acceso a nuestro terminal. Es sin duda muy llamativo, pero no sé si compensa por el riesgo en nuestra privacidad que implica. El caso es que esto es simplemente un adelanto de lo que nos espera. Hace meses tuve la oportunidad de probar Project Astra y parece claro que lo que llegará próximamente será algo parecido pero con la mano de Google. Los nuevos Samsung Galax
Ya hemos probado la siguiente evolución de la IA. No es que sea más lista, ni que sea más abierta. Ahora es mucho más útil. Hablamos del nuevo modo 'Cámara en Directo' de OpenAI que recientemente ha llegado a los usuarios de Europa. Lo hemos estado probando durante varios días y es sin duda un enorme salto adelante.
ChatGPT ahora tiene lo que se ha descrito popularmente como un modo 'Her'. ¿Por qué? Básicamente porque ahora ChatGPT puede contestarnos a lo que le vamos diciendo y sus respuestas son en base a lo que le estamos enseñando desde la cámara del móvil. Es decir, si enfocamos una fruta, ChatGPT nos dirá que es una manzana. Si enfocamos a nuestra mascota, nos dirá que es un bonito gato blanco y negro.
Pero no termina ahí. ChatGPT tiene también ahora la capacidad de ver lo que se muestra en la pantalla de nuestro móvil. Y esta es la parte más preocupante.
El modo 'Cámara en directo' reinventa ChatGPT
Los usuarios con la suscripción de ChatGPT Plus ya tienen acceso a este nuevo modo. Para utilizarlo debemos pulsar sobre el micrófono para activar la conversación por voz. La novedad es que ahora aparecen también varios botones nuevos.
El primero de ellos es el de la cámara. Si pulsamos se nos mostrará la cámara y podremos hablarle a ChatGPT y preguntarle sobre lo que estamos enfocando. Lo hemos probado en distintos escenarios y el reconocimiento de objetos de GPT-4o es muy bueno.
ChatGPT no solo reconoce el objeto, le podemos preguntar sobre detalles de este. Al nivel de en qué estado está la pieza de fruta o cuál es la marca de la moto que estamos viendo.
Esta opción da mucho juego, pues podemos por ejemplo pedirle a ChatGPT que nos diga cuántos dedos levantados tenemos o incluso jugar al Pictionary. Aquí es muy divertido pues la IA nos va dando opciones y es bastante avispada incluso aunque nuestras dotes de dibujo sean bastante malas.
Otro uso de lo más interesante es la resolución de problemas matemáticos. Podemos enfocar una fórmula y ChatGPT nos contestará con la respuesta. Lo hemos probado con ecuaciones sencillas donde acierta totalmente pero también le hemos pasado fórmulas complejas y para la IA es igualmente sencillo.
Por supuesto habrá centenares de usos distintos. Las posibilidades son enormes. El resultado es tan sorprendente como cuando apareció ChatGPT en su primer lugar. Sí es verdad que hay margen de mejora, principalmente porque el feedback no es 100% fluido. Tenemos que ir preguntándole cada vez a la IA qué es lo que está viendo para que analice la imagen a través de la cámara.
Nos parece difícil que alguien vaya a enamorarse de ChatGPT solo por esta función, pero sí es un paso claramente superior el poder "sentir" que la IA "entiende" lo que tenemos enfrente. Pasamos de una interacción puramente basada en el texto a algo basado en imagen y sonido, mucho más llamativo visualmente.
Dar acceso a ChatGPT a nuestra pantalla es una idea peliaguda
Además de acceso a la cámara, la nueva función de ChatGPT puede tener acceso a la pantalla del teléfono. Esto permite a la IA analizar lo que aparece en una captura de pantalla y también analizar lo que se muestra en una determinada aplicación o en toda la pantalla.
Es decir, ChatGPT puede saber si estamos viendo el correo, si estamos en WhatsApp o qué vídeo estamos viendo. Es literalmente darle acceso a la pantalla de nuestro móvil y es tan directo que la primera vez que lo activamos la propia ChatGPT nos envía una advertencia que información sensible puede estar siendo vista.
La función recuerda a Recall de Windows y toda la polémica con la privacidad de los usuarios. OpenAI simplemente está viendo todo lo que aparece en nuestro móvil, sin filtro.
Hay varias opciones, desde darle acceso a la pantalla o solo a una aplicación. El nivel de precisión es correcto. No aprecia detalles muy concretos sobre la carátula de un vídeo o la letra más pequeña, pero sí reconoce cuál es el título exacto de una conversación o vídeo. O también sabe qué estamos escuchando si le enseñamos Spotify.
OpenAI con esta función de 'Cámara en directo' a la práctica nos está pidiendo acceso a nuestro terminal. Es sin duda muy llamativo, pero no sé si compensa por el riesgo en nuestra privacidad que implica.
El caso es que esto es simplemente un adelanto de lo que nos espera. Hace meses tuve la oportunidad de probar Project Astra y parece claro que lo que llegará próximamente será algo parecido pero con la mano de Google.
Los nuevos Samsung Galaxy S25 parece que serán los primeros que añadirán algo parecido. Este 2025, los fabricantes de tecnología quieren que la IA "entienda" lo que nos rodea. Y de paso quieren observar todavía más todo lo que se muestra en nuestro móvil.
En Xataka Android | Probamos DeepSeek en móvil y PC: ventajas, inconvenientes y una gran diferencia
-
La noticia
El nuevo modo de ChatGPT que ve a través de la cámara es tan alucinante como preocupante para mi privacidad
fue publicada originalmente en
Xataka Android
por
Enrique Pérez
.