Skip to main content
  1. Casa
  2. Android

La rumoreada generación de videos de Gemini podría estar aquí pronto

Veo 2
DTES

Desde hace varios meses, Google Gemini ha anunciado las capacidades de video generativo, pero la última versión beta sugiere que esas funciones están más cerca que nunca. En la versión beta 16.11 de la aplicación de Google, Abner Li de Android Authority encontró varias cadenas que revelan algunos detalles sobre las próximas funciones de generación de video.

La primera es una cadena que dice «Obtén videos de alta calidad con Veo 2, el último modelo de generación de video de Gemini». Veo promete crear un video de ocho segundos en aproximadamente dos minutos basado en su idea. Todo lo que los s tienen que hacer es describir su visión en unas pocas frases. Sin embargo, no te emociones demasiado; Parece que habrá límites de uso, por lo que no vas a crear largometrajes todavía.

Li encontró el siguiente código:

Recommended Videos

<string name=»assistant_robin_toucan_status_banner_quota_error_message_text»>»Has alcanzado tu límite de generación de vídeo hasta mañana»</string>

<string name=»assistant_robin_stop_toucan_dialog_description»>Esta generación de vídeo seguirá contando para tu límite mensual</string>

Si bien el límite no está claro, es obvio que Gemini detendrá a los s después de cierto punto. Es posible que pueda comprar créditos para video generativo adicional, pero nuevamente, esto es solo especulación. En cuanto a la referencia «Tucán», ese es el nombre en clave que Google ha utilizado para probar Veo 2 dentro de Gemini.

En este momento, los s de Gemini pueden aprovechar Imagen 3 para todo, desde la generación de video, imagen y audio, pero sus capacidades son limitadas. Veo 2 es capaz de generar una gama más amplia de estilos visuales mientras simula la física del mundo real, según DeepMind de Google. También es una opción mucho mejor «en términos de detalle, realismo y reducción de artefactos».

La presencia de estas cadenas de código es una buena pista de que Veo 2 está cada vez más cerca de su lanzamiento, pero hasta que sea oficial, cualquier cosa podría cambiar. Google utiliza estas versiones beta de las aplicaciones para probar las próximas funciones y evaluar su validez. Es posible que las funciones se lancen pronto, pero también es posible que surja un problema que retrase el lanzamiento. 

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Un rival de ChatGPT pronto podría controlar tu escritorio con la voz
Persona hablando desde su computadora

La startup de inteligencia artificial Anthropic comparte el protagonismo entre los principales nombres de Silicon Valley por dos razones principales. En primer lugar, la empresa fue fundada por antiguos alumnos de OpenAI que se marcharon tras desarrollar diferencias ideológicas con Sam Altman. En segundo lugar, Anthropic afirma adoptar un enfoque más responsable con su chatbot de IA -y sus grandes modelos de lenguaje homónimos- Claude, intentando eliminar las respuestas dañinas o poco éticas.
Mike Krieger, director de productos de Anthropic, y cofundador de Instagram, habló con el Financial Times sobre los planes de la compañía para mejorar el "trabajo del conocimiento", ayudándolos a recuperar algo del tiempo dedicado a "Excel o Google Docs".
Una forma de lograrlo sería a través de sistemas agenticos donde la IA de Anthropic podrá controlar todo su escritorio desde un conjunto de comandos de lenguaje natural. En teoría, el concepto es similar al modo Operador de ChatGPT que navega por la web por ti en función de tus comandos.
Al mismo tiempo, Microsoft está apostando por los comandos de voz para controlar sus portátiles con Windows con la ayuda de su interfaz de chat Copilot+.
Chat de voz para controlar tu PC
Krieger prevé que una forma de implementar Claude para controlar su escritorio será con voz, ya que sería "una interfaz de más natural". El año pasado, Anthropic hizo una demostración de su agente de IA que puede controlar computadoras usando comandos escritos.

Con el tiempo, se puede esperar que el control por voz sea una extensión de esta funcionalidad existente. A pesar de que no hay un cronograma claro sobre cuándo, o confirmación si, controlar su PC con la función de voz se convierte en una realidad, Anthropic ya tiene un modo de voz en proceso.
El ejecutivo dijo que la compañía ya está creando un prototipo de control por voz para Claude. Anthropic está apostando por las asociaciones empresariales, en lugar de hacer que sus productos estén disponibles inmediatamente para los consumidores, para obtener una ventaja sobre rivales como OpenAI, Meta y Google.
"Espero que Claude llegue a tantas personas como sea posible, pero el camino crítico no es a través de la adopción masiva por parte de los consumidores en este momento", dijo Krieger.
Sin embargo, si la funcionalidad de voz estuviera disponible para los s de Claude, uno de los lugares más naturales sería la aplicación móvil lanzada en agosto del año pasado. Por ahora, el modo de voz de Claude ya existe en forma de Alexa+ revisado de Amazon, que funciona con los grandes modelos de lenguaje de Claude.
Esto fue probablemente el resultado de la inversión de $ 4 mil millones de Amazon en la startup. La compañía también puede estar buscando otros socios para lanzar sus productos basados en voz, pero aún no ha revelado ninguna otra alianza que no sea con Amazon.
Mientras tanto, sus rivales OpenAI y Google ya tienen una funcionalidad de voz competente a través de sus respectivos modos de voz en ChatGPT y Gemini.

Leer más
Ahora son gratis: dos de las mejores funciones de IA de Gemini
Google Gemini

La IA Gemini de Google se ha abierto camino de manera constante hacia lo mejor de su suite de software, desde integraciones nativas de Android hasta interoperabilidad con aplicaciones de Workspace como Gmail y Docs. Sin embargo, algunas de las funciones más avanzadas de Gemini han permanecido bloqueadas detrás de un muro de pago de suscripción.
Eso cambia hoy. Google ha anunciado que Gemini Deep Research ahora estará disponible para que todos los s lo prueben, junto con la capacidad de crear bots de gemas personalizados. Ya no necesita una suscripción a Gemini Advanced (o Google One AI ) para usar las herramientas antes mencionadas.
Lo mejor de Géminis como agente de IA
Deep Research es una herramienta agentica que se hace cargo de la tarea de investigación web, ahorrando a los s la molestia de visitar una página web tras otra, en busca de información relevante. Con Deep Research, simplemente puede poner una consulta en lenguaje natural como entrada y también especificar la fuente, si es necesario.

Nadeem Sarwar / DT

Leer más
OFICIAL: Esta es la Nintendo Switch 2 que podría llegar el 2 de abril
Nintendo Switch 2

Ya es oficial, finalmente Nintendo lanzó el primer teaser tráiler que muestra cómo será la Nintendo Switch 2, después de muchas filtraciones y especificaciones soltadas al aire.

Si bien, se informa oficialmente que estará disponible durante 2025, no hubo ninguna confirmación certera de la fecha, aunque podría ser el próximo 2 de abril, cuando se celebre un Nintendo Direct que estará dedicada a la nueva consola.

Leer más