Que mi móvil pueda ver por mi es tan aterrador como fascinante. He probado los ojos de Gemini Live

Gemini Live puede ver e interpretar el mundo en tiempo real a través de la cámara de un dispositivo y leer el contenido de su pantalla.

Gemini Live puede ver e interpretar el mundo en tiempo real a través de la cámara de un dispositivo y leer el contenido de su pantalla.

En diciembre de 2024, OpenAI lanzó una función en ChatGPT que permitía ver e interpretar el mundo en tiempo real. En respuesta, Google anunció en enero de 2025 una actualización para Gemini Live, su modo de voz avanzado, disponible para Google Pixel 9 y Samsung Galaxy S25 con suscripción Advanced. La función permite a Gemini Live ver y reconocer objetos a través de la cámara y leer contenido de la pantalla. Puede resolver ecuaciones, problemas psicotécnicos y responder preguntas, pero requiere supervisión para asegurar precisión. La función de visión de Gemini Live es impresionante pero puede ser molesta por su tendencia a hacer preguntas adicionales.

Crítica:El artículo cumple con la expectativa de mostrar las capacidades de Gemini Live, pero quizás infla un poco la percepción de su precisión y utilidad. La mención de errores y la necesidad de supervisión podría haber sido más destacada.
fuente www.xataka.com
08-04-2025 15:30

Tecnología
Resumir link
Últimos artículos Ciencia Compras Corazón Cultura Curiosidades Deportes Economía Entretenimiento Política Salud Tecnología Últimos artículos Resumir link
Gemini en Google Photos permite búsquedas conversacionales y entiende el contexto de las imágenes para mostrar resultados relevantes.

Google Photos estrena botón Gemini: así transforma la forma en que buscas tus fotos

Google Photos ha integrado Gemini, su modelo de inteligencia artificial, en la app. El botón de búsqueda ha sido reemplazado por 'Preguntar', que permite hacer consultas más naturales y complejas. Gemini entiende imágenes y contexto, permitiendo búsquedas de rostros, lugares, fechas, momentos y objetos específicos. Puede generar listas con descripciones y ayudar a crear contenido para redes sociales. La función ya está disponible para la mayoría de los usuarios en Android y iOS.
...promete una revolución en la búsqueda de fotos, pero ¿realmente es tan innovador? La integración de Gemini es interesante, pero ¿qué pasa con la privacidad de los datos? En fin, una herramienta útil, aunque no perfecta.
wwwhatsnew.com Tecnología
GPT-4.1 no supera a Gemini 2.5 Pro en rendimiento

OpenAI hace "historia" con GPT-4.1, pero para mal: primera vez que lanza un modelo y no consigue brillar en rendimiento

OpenAI ha presentado GPT-4.1, GPT-4.1 Mini y GPT-4.1 Nano, con una ventana de contexto de hasta un millón de tokens, pero no superan a Gemini 2.5 Pro de Google en rendimiento. Es la primera vez que OpenAI lanza un modelo y no lidera los rankings. GPT-4.1 Mini tiene un precio de 0,70 dólares por millón de tokens, mientras que Gemini 2.0 Flash cuesta menos de 0,20 dólares. La retirada de GPT-4.5 el 30 de abril añade incertidumbre.
...es una crítica mordaz a OpenAI por no estar a la altura de Google en rendimiento de modelos de lenguaje. La noticia es interesante, pero el titular es un poco clickbait. La inclusión de gráficos y comparativas es útil, pero faltan más detalles técnicos.
www.genbeta.com Informática
Rick Wolter pasó de ser un recluso a un desarrollador de software y ahora ayuda a cientos de personas con su organización Underdog Devs.

Aprendió a programar clandestinamente desde la cárcel con PCs viejos. Se convirtió en desarrollador y ahora ayuda a los demás

Rick Wolter pasó 18 años en prisión por homicidio. Descubrió un artículo en The Economist sobre la demanda de ingenieros de software y se obsesionó con la programación. Sin programas formativos en la prisión, Wolter y su amigo Mohammad instalaron Python en PCs viejos. Con material didáctico enviado por su hermano y tutoriales de MIT OpenCourseWare, Rick aprendió programación y luego enseñó a otros reclusos. Después de salir de la cárcel, se enfrentó a un mundo tecnológico evolucionado, estudió en un colegio comunitario y consiguió su primer trabajo como desarrollador en tres años. Actualmente lidera Underdog Devs, una organización sin ánimo de lucro que ayuda a personas con antecedentes penales a convertirse en desarrolladores.
La historia de Rick Wolter es verdaderamente inspiradora, pero el título podría ser más específico sobre cómo logró su transformación. La ironía y el humor en el artículo hacen que sea una lectura agradable.
www.genbeta.com Tecnología
Los estafadores utilizan técnicas como el principio de coherencia, crear una falsa urgencia, construir una relación de confianza, la trampa de la deuda social y apelar a la autoridad para manipular a sus víctimas.

La psicología detrás de los timos: así se aprovechan los estafadores de nuestra debilidad

Los estafadores utilizan técnicas psicológicas para manipular a sus víctimas. Comienzan con peticiones triviales para ganar confianza, crean una falsa urgencia para presionar a la víctima, construyen una relación de confianza a largo plazo, utilizan la deuda social para obtener favores, y apelan a la autoridad para obtener obediencia. El experto Joe Grand afirma que la gente en situaciones desesperadas no piensa críticamente y ignora las señales de alerta. Para protegerse, se recomienda verificar la identidad, desconfiar de la urgencia, reconocer las emociones y acordar una 'palabra segura'.
...proporciona una visión interesante sobre las técnicas psicológicas utilizadas por los estafadores, pero podría profundizar más en las estadísticas y los casos concretos de estafas. La crítica mordaz sería: '...es como un buen consejo de un amigo, pero sin la acción. ¿Cuántos lectores realmente cambiarán su comportamiento después de leer esto?'
www.genbeta.com Informática
No hay consenso sobre si es necesario aprender a programar en 2025

Aprender a programar o no: los grandes líderes 'tech' no se ponen de acuerdo sobre si hace falta en 2025

Líderes tecnológicos como Mark Zuckerberg, Sam Altman, Jensen Huang, Bill Gates y Thomas Dohmke tienen opiniones divididas sobre si es necesario aprender a programar en 2025 debido al avance de la IA. Zuckerberg y Huang creen que la IA reemplazará a los programadores humanos, mientras que Gates y Dohmke sostienen que aprender a programar sigue siendo relevante. Altman sugiere enfocarse en 'dominar las herramientas de IA'.
...plantea un tema interesante, pero algunos párrafos son demasiado largos y confusos. La variedad de opiniones de los líderes tecnológicos mantiene al lector interesado, pero se esperaba una conclusión más clara.
www.genbeta.com Tecnología
ChatGPT puede identificar ubicaciones geográficas a partir de imágenes con un alto grado de precisión

Esa foto que creías inocente ya no es inocente. o3 de OpenAI puede saber demasiado a partir de ella

OpenAI ha lanzado o3 y o4-mini, modelos que permiten a ChatGPT analizar imágenes con precisión. ChatGPT puede ahora deducir ubicaciones geográficas a partir de fotos, incluso borrosas o con ruido, utilizando pistas sutiles. Puede identificar calles, monumentos y restaurantes. Basta una foto de una biblioteca o la carta de un restaurante para que adivine la ubicación. Esto supone un problema para la privacidad, ya que cualquiera con ChatGPT Plus puede hacer esta búsqueda inversa de ubicación.
...revela la capacidad de ChatGPT para analizar imágenes y deducir ubicaciones geográficas, lo que supone un problema para la privacidad. La noticia es interesante, pero podría profundizar más en las implicaciones de esta tecnología.
www.genbeta.com Tecnología
Es un smartwatch completo por menos de 150 euros con funciones de monitorización de actividad física y salud, diseño personalizable y buena autonomía.

Es el nuevo reloj inteligente Xiaomi y ya está en oferta: te cuento por qué su compra es un acierto

El Xiaomi Watch S4, nuevo reloj inteligente de Xiaomi, está en oferta por menos de 150 euros. Su precio recomendado es 159,99 euros, pero se puede encontrar por 140 euros en AliExpress. Ofrece un diseño personalizable, pantalla OLED de 1,43 pulgadas con resolución 466 x 466 píxeles y 2.200 nits de brillo, monitorización de actividad física y salud con más de 150 modos deportivos, GPS, y autonomía de hasta 15 días con uso normal. La batería de 486 mAh tarda 40 minutos en cargarse al 100%.
...cumple con las expectativas al proporcionar detalles específicos sobre el Xiaomi Watch S4, pero el título podría ser más descriptivo sobre las características y beneficios del producto.
andro4all.com Tecnología
El soporte hub de Satechi para Mac mini M4 cuesta 119,99 euros y permite ampliar el almacenamiento con un SSD externo.

Hace más de un mes me compré el Mac mini M4 de 256 GB con la intención añadirle más almacenamiento. Y lo haré con este hub

El autor compró un Mac mini M4 de 256 GB hace un mes y medio. Planea añadir más almacenamiento con un soporte hub de Satechi, que cuesta 119,99 euros en Amazon. Este dispositivo permite acoplar un SSD externo, tiene puertos USB-A y un lector de tarjetas SD. También facilita el encendido del Mac y mantiene una buena ventilación.
...es informativo pero adolece de profundidad en cuanto a detalles técnicos del soporte hub. La crítica mordaz: 'Finalmente, alguien que nos dice que un hub puede solucionar todos nuestros problemas de almacenamiento... o no.'
www.applesfera.com Informática
funciones ocultas de Windows 11 para mejorar la productividad y experiencia del usuario

Son pequeñas, pero extremadamente útiles: estas funciones de Windows 11 son imprescindibles en mi día a día

Windows 11 incluye varias funciones útiles pero poco conocidas. El sonido espacial permite emular sonido envolvente en auriculares. El asistente de concentración ayuda a evitar distracciones con un modo 'No molestar'. Un asistente de Pomodoro integrado permite configurar sesiones de trabajo y descanso. La luz nocturna reduce la exposición a la luz azul. El portapapeles mejorado guarda un historial de elementos copiados. El selector de emojis permite insertar emojis y símbolos directamente. Los escritorios virtuales ayudan a organizar aplicaciones. La app 'Enlace Móvil' permite controlar el móvil desde Windows. El editor de vídeo integrado, Microsoft Clipchamp, permite editar vídeos básicos. Medir los FPS en juegos es posible con Windows + G.
...es útil para descubrir funciones ocultas de Windows 11, pero podría ser más exhaustivo en la explicación de cada función. La presentación es clara y fácil de seguir.
www.genbeta.com Informática
Movistar Cloud ofrece almacenamiento ilimitado sin coste adicional para clientes de Movistar.

Al quedarme sin espacio en Google Drive, me pasé a Movistar Cloud: el almacenamiento ilimitado me ha hecho quedarme

El autor recibió un aviso de que su almacenamiento de Google Drive estaba casi lleno. Tenía 15 GB gratuitos, pero acumuló muchos documentos y fotos. Recordó que, como cliente de Movistar, tenía acceso a Movistar Cloud con almacenamiento ilimitado sin coste adicional. Descargó la app y configuró la copia de seguridad automática de fotos y vídeos. La velocidad de subida y descarga es correcta. La app permite escanear documentos y conectar la cuenta de Dropbox. El autor migró sus archivos personales a Movistar Cloud, manteniendo su cuenta de Google Drive para documentos que requieren colaboración.
...es interesante, pero el título promete una comparativa más exhaustiva entre Movistar Cloud y Google Drive. La migración a Movistar Cloud parece sencilla, pero la app tiene limitaciones. La ventaja del almacenamiento ilimitado es atractiva, pero quizás no sea suficiente para cambiar de servicio.
www.genbeta.com Tecnología
La IA de OpenAI puede identificar ubicaciones en fotos sin metadatos

Algunos usuarios están usando o3 y o4-mini de OpenAI para averiguar la ubicación de fotos: es una pesadilla para la privacidad

Los modelos de IA o3 y o4-mini de OpenAI pueden analizar imágenes y deducir su ubicación. Usuarios en redes sociales están utilizando estos modelos para identificar lugares exactos donde fueron tomadas fotos, incluso sin metadatos. En una prueba, el sistema identificó una calle concreta de Madrid en 15 minutos.
...es un toque de atención sobre la privacidad en la era de la IA, pero quizás sea un poco alarmista. La capacidad de la IA para analizar imágenes es impresionante, pero no es una noticia nueva. La verdadera preocupación es cómo se utilizará esta tecnología en el futuro.
www.xataka.com Tecnología
Los agentes de IA pueden interactuar con sitios web y aplicaciones sin necesidad de APIs, permitiendo realizar tareas como navegar por sitios web, rellenar formularios y recopilar información.

Así funciona la nueva habilidad de Copilot Studio: agentes de IA que interactúan con webs y apps como tú

Microsoft Copilot Studio lanza una nueva función que permite a los agentes de IA interactuar con sitios web y aplicaciones como si fueran usuarios humanos, sin necesidad de APIs. Esta herramienta, llamada 'uso de computadora', permite a los agentes navegar por navegadores, reconocer elementos en pantalla, tomar decisiones en tiempo real y adaptarse a cambios en la interfaz. Los agentes pueden realizar tareas como rellenar formularios, recopilar información y ejecutar acciones en servidores de Microsoft. No se requiere conocimiento de programación, ya que el proceso se basa en instrucciones en lenguaje natural. La función está disponible en una versión preliminar de acceso anticipado.
...promete una revolución en la interacción entre humanos y máquinas, pero no deja de ser un avance en la automatización de tareas. La idea de que un agente de IA pueda interactuar con sitios web y aplicaciones como un humano suena a película de ciencia ficción, pero en realidad es solo un paso más en la larga marcha hacia la inteligencia artificial. ¿Qué pasará cuando estos agentes se vuelvan más inteligentes que nosotros?
wwwhatsnew.com Informática
Siguiente>
Share on Whatsapp Share on X Share on LinkedIn Share by Mail Copiar enlace