Skip to main content
  1. Casa
  2. Tendencias

La IA empezó a tomar clases y pronto hablará idioma perro y gato

Gato y perro
DTES

Uno de los grandes misterios de la humanidad tiene que ver con los gato que maúlla en tus piernas, o incluso el hámster que da vuelta en la rueda, es algo que solo la ficción con el Doctor Dolittle ha podido hacer.

Ha habido varios intentos de desarrollar sistemas que permitan a las mascotas comunicarse (un ejemplo notable es cuando los perros presionan botones de sonido programables, cada uno de los cuales representa una palabra o frase, para «hablar» y expresar necesidades, emociones u observaciones), pero ninguno es tan emocionante como el propuesto por el gigante tecnológico chino Baidu en una patente presentada ante la istración Nacional de Propiedad Intelectual de China.

Recommended Videos

La patente describe un sistema que recopila datos de animales como sonidos vocales, comportamiento y señales fisiológicas, informó Sky News esta semana. La información recopilada se procesaría y luego se fusionaría para el análisis de IA, creando una tecnología capaz de interpretar cualquier sonido que haga el animal.

Pero no esperes que empieces a tener conversaciones con Bobby sobre el clima, o que tu gato empiece a hacer comentarios críticos sobre tus elecciones de Netflix. Para empezar, no se menciona la creación de una IA que pueda responder a los animales, y la información principal que probablemente obtendrá es algo sobre el estado emocional de su mascota.

En la patente, Baidu dice que el sistema mejoraría «la precisión y la eficiencia de la comunicación entre especies», aunque un portavoz de la compañía advirtió que su tecnología está «todavía en la etapa de investigación».

Ya ha habido algunas investigaciones de alto perfil para tratar de encontrar formas de traducir con precisión los ruidos de los animales, particularmente los de los perros. Un estudio en curso realizado por el Laboratorio de Cognición Comparativa de la Universidad de California en San Diego, por ejemplo, ha estado analizando cómo se pueden usar las cajas de resonancia mencionadas anteriormente para ayudar a los perros a expresarse. Algunos perros incluso han demostrado que pueden combinar varias palabras para formar solicitudes simples como «juego al aire libre» o «comida ahora». Pero los críticos argumentan que puede haber demasiadas suposiciones sobre la capacidad de los perros para entender completamente las palabras, lo que sugiere que podrían estar presionando los botones porque han aprendido a hacerlo en respuesta a ciertas señales, como el sonido del botón.

Con la tecnología de IA avanzando tan rápidamente, esperemos que Baidu esté en lo cierto.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Waze ahora se maneja con la voz y Google Maps mejora con la IA
waze se maneja con voz google maps mejora ia

Con la intención de mejorar aún más la seguridad en las calles, Waze acaba de implementar una función muy importante: la activación de reportes de tráfico por voz, para dejar las manos en el volante todo el tiempo.
Con la nueva función, puede tocar el botón de informes de la aplicación y luego decir lo que ve, como: "Parece que hay un atasco de tráfico más adelante".
La aplicación de conducción propiedad de Google utilizará el modelo de IA de Gemini para "entender" lo que has dicho y crear un informe. Si haces un informe vago, como "Hay algo en el camino", Waze podría hacer preguntas de seguimiento, como "¿Puedes describir lo que ves?". En función de tu respuesta, la aplicación utilizará esa información para clasificar tu informe.
Por ahora, solo está disponible en inglés, pero Waze planea expandirlo a más s e idiomas en los "próximos meses".
Junto con esta actualización, Waze también comenzará a mostrar las zonas escolares en el mapa a nivel mundial a finales de este año, alertándote para que conduzcas de manera más segura en estas áreas.

Mejoras en Google Maps con IA

Leer más
Vi a un collar de IA hacer hablar a un perro…
collar ia hacia hablar perro shazam

Una experiencia realmente diferente y asombrosa por momentos es la que vivió el periodista de DT en inglés, Andy Boxall , con un perro, una correa para el can y una IA que lo hacía hablar.

Todos hablamos con nuestras mascotas, pero ¿qué pasaría si nuestras mascotas pudieran respondernos? Esa es la premisa de Shazam Band de Personifi AI, un dispositivo portátil que pone en palabras el estado de ánimo, los movimientos y las emociones de tu mascota. Mediante el uso de la IA, en realidad hace posible una conversación bilateral.

Leer más
Adobe quiere reinar en la IA de video y agrega capacidades a Firefly
adobe firefly nuevas capacidades ia video

El mundo de la IA generativa y sobre todo lo que tiene que ver con la creación de video a partir de instrucciones, está agarrando nuevos vuelos, ya que este lunes 14 de octubre Adobe presentó actualizaciones y nuevas capacidades de su modelo Firefly, que ya está integrado con Premiere Pro para.

El modelo de video Firefly, como se llama la tecnología, competirá con Sora de OpenAI, que se presentó a principios de este año, mientras que el propietario de TikTok, ByteDance, y Meta Platforms también han anunciado sus herramientas de video en los últimos meses.
Las nuevas características
La primera herramienta, Generative Extend, se lanza en versión beta para Premiere Pro. Se puede utilizar para ampliar el final o el principio de un metraje que es un poco demasiado corto, o hacer ajustes a mitad de la toma, como para corregir cambios en las líneas de los ojos o movimientos inesperados.
Los clips solo se pueden extender dos segundos, por lo que la extensión generativa solo es realmente adecuada para pequeños ajustes, pero eso podría reemplazar la necesidad de volver a tomar el metraje para corregir pequeños problemas. Los clips extendidos se pueden generar a 720p o 1080p a 24 FPS. También se puede usar en audio para ayudar a suavizar las ediciones, aunque con limitaciones. Extenderá los efectos de sonido y el "tono de la habitación" ambiental hasta diez segundos, por ejemplo, pero no los diálogos hablados o la música.

Leer más