Skip to main content
  1. Casa
  2. Computación

OpenAI o3 y o4-mini: lo que debes saber de los nuevos modelos de ChatGPT

OpenAI
DTES

Este miércoles 16 de abril, la gente de OpenAI presentó oficialmente sus dos nuevos modelos de razonamiento: o3 y o4-mini, que prometen mayor capacidad de racionamiento y además una interacción con imágenes que subirá un escalón la comprensión visual.

«Por primera vez, nuestros modelos de razonamiento pueden usar y combinar de forma agentiva todas las herramientas dentro de ChatGPT, esto incluye buscar en la web, analizar archivos cargados y otros datos con Python, razonar profundamente sobre las entradas visuales e incluso generar imágenes. Fundamentalmente, estos modelos están entrenados para razonar sobre cuándo y cómo usar herramientas para producir respuestas detalladas y reflexivas en los formatos de salida correctos, generalmente en menos de un minuto, para resolver problemas más complejos. El poder combinado del razonamiento de última generación con completo a herramientas se traduce en un rendimiento significativamente más sólido en los puntos de referencia académicos y las tareas del mundo real, estableciendo un nuevo estándar tanto en inteligencia como en utilidad», sostiene la gente de OpenAI.

Recommended Videos

OpenAI o3

Este nuevo modelo ha sido definido como más eficiente en codificación, las matemáticas, la ciencia, la percepción visual.

  • Es ideal para consultas complejas que requieren un análisis multifacético y cuyas respuestas pueden no ser obvias de inmediato.
  • Se desempeña especialmente en tareas visuales como el análisis de imágenes, tablas y gráficos.
  • En las evaluaciones realizadas por expertos externos, o3 comete un 20 por ciento menos de errores importantes que openAI o1 en tareas difíciles del mundo real, especialmente sobresaliendo en áreas como programación, negocios/consultoría e ideación creativa.
  • Los primeros evaluadores destacaron su rigor analítico como socio de pensamiento y enfatizaron su capacidad para generar y evaluar críticamente hipótesis novedosas, particularmente dentro de contextos de biología, matemáticas e ingeniería.

OpenAI o4-mini

Este modelo es definido como más pequeño y optimizado para un razonamiento rápido y rentable: logra un rendimiento notable para su tamaño y costo.

  • Es el modelo de referencia con mejor rendimiento en AIME 2024 y 2025.
  • En las evaluaciones de expertos, también supera a su predecesor, o3-mini, en tareas no STEM, así como en dominios como la ciencia de datos. Gracias a su eficiencia, o4-mini ite límites de uso significativamente más altos que o3, lo que lo convierte en una opción sólida de alto volumen y alto rendimiento para preguntas que se benefician del razonamiento.

Qué hace que estos modelos sean especiales para analizar imágenes

Estos modelos pueden integrar imágenes directamente en su cadena de pensamiento. No solo ven una imagen, sino que piensan con ella. Esto desbloquea una nueva clase de resolución de problemas que combina el razonamiento visual y textual, lo que se refleja en su rendimiento de última generación en puntos de referencia multimodales.

Las personas pueden cargar una foto de una pizarra, un diagrama de un libro de texto o un boceto dibujado a mano, y el modelo puede interpretarlo, incluso si la imagen está borrosa, invertida o de baja calidad. Con el uso de herramientas, los modelos pueden manipular imágenes sobre la marcha, rotándolas, amplándolas o transformándolas como parte de su proceso de razonamiento.

Estos modelos ofrecen la mejor precisión de su clase en las tareas de percepción visual, lo que le permite resolver preguntas que antes estaban fuera de su alcance.

Topics
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
OpenAI detiene la generación gratuita de imágenes GPT-4o tras la tendencia viral de Studio Ghibli

Después de solo un día, OpenAI ha puesto fin a la versión gratuita de su generador de imágenes en la aplicación, impulsado por el modelo de razonamiento GPT-4o. La actualización tiene como objetivo mejorar el realismo de las imágenes y el texto en el contexto generado por la IA; sin embargo, los s ya han creado una tendencia descontrolada que ha hecho que la empresa de IA se replantee su estrategia de lanzamiento.
Poco después de que la actualización estuviera disponible en ChatGPT, los s comenzaron a compartir imágenes que habían creado en las plataformas de redes sociales al estilo de Studio Ghibli, el popular estudio de animación japonés. Las creaciones iban desde fotos familiares personales basadas en Studio Ghibli hasta escenas icónicas de los Juegos Olímpicos de París 2024, escenas de películas como "El Padrino" y "Star Wars", y memes de Internet como un novio distraído y una chica desastre.

IA abierta

Leer más
OpenAI quiere barrer con los derechos de autor con la Casa Blanca de «cómplice»
OpenAI Sora

OpenAI es inconsistente en muchas cosas: ¿es una organización sin fines de lucro o con fines de lucro? ¿Sam Altman es apto para ser CEO o no? Pero una cosa en la que la compañía siempre ha sido consistente es en su creencia de que requiere a material protegido por derechos de autor para el entrenamiento de IA. Ahora, a pesar de las muchas voces que no están de acuerdo, OpenAI quiere que el gobierno de EE.UU. apruebe ese sin restricciones dictaminándolo como "uso justo".
La compañía argumenta que Estados Unidos se quedará atrás de China en la carrera de la IA si las empresas no tienen la libertad de entrenar sus modelos con material protegido por derechos de autor, alegando que las "leyes estatales demasiado onerosas" ralentizarán el proceso y afectarán los resultados.
Si eres un creador, esto también podría afectarte. Los artistas, escritores, programadores, fotógrafos y cineastas con portafolios en línea, por ejemplo, son dueños de su trabajo, pero si este plan se lleva a cabo, no tendrás motivos para quejarte cuando tu contenido se utilice para entrenar a la IA. Incluso las actividades creativas más físicas, como el diseño de moda, la fabricación de joyas o la escultura, no son seguras si publicas fotos de tu trabajo en línea.
Parece una broma cruel que OpenAI quiera que el entrenamiento de la IA cuente como uso "justo" de obras protegidas por derechos de autor cuando los productos que desarrolla se utilizarán para generar nuevas versiones destrozadas de creaciones personales. Un ejemplo particularmente directo de esto ocurrió el mes pasado cuando se le pidió al elenco francés de Apex Legends que participara en el entrenamiento de un modelo de IA que eventualmente se usaría para generar líneas de voz para el juego.
Hay muchos usos comerciales para varios tipos de contenido creativo, pero cuanto mejores sean los modelos de IA para imitarlo, más difícil será ganar dinero como creador. Las empresas tienen un gran historial de elegir la opción menos costosa en cualquier situación, y hay pocas razones para creer que esto cambiará pronto.
Es difícil imaginar cuál será la solución para los creadores en esta situación. Las personas que realmente se preocupan por proteger su trabajo pueden comenzar a proteger con contraseña sus portafolios en línea, sacrificando solo algunos ejemplos antiguos a los conjuntos de capacitación y solo compartiendo el resto a pedido humano.
Definitivamente, también habría demanda de una solución adecuada: algún tipo de nuevo portafolio o plataforma de intercambio creativo a la que solo los humanos puedan acceder. Tendría que tener un proceso de autenticación bastante estricto, pero definitivamente hay personas que se preocupan lo suficiente por esto como para sacrificar algo de comodidad.
La Casa Blanca aún no ha respondido al plan de OpenAI, por lo que tendremos que esperar y ver cómo se desarrolla esto.

Leer más
OpenAI lanza el modelo de IA GPT-4.5 con conocimientos y emociones más profundos
OpenAI - 4.5

OpenAI acaba de presentar su último modelo de IA, denominado GPT-4.5, que según la compañía es su mayor y mejor modelo hasta la fecha. No se trata de un modelo de razonamiento, una facultad que se limita a los modelos de la serie O. A pesar de ello, se dice que GPT-4.5 es un conversador más natural, con un mayor cociente emocional y una mayor capacidad de resolución de problemas.
En cuanto a las competencias básicas, tiene a la información más reciente de la web, permite la carga de archivos y multimedia, y es compatible con la plataforma Canvas para tareas relacionadas con la codificación. Sin embargo, actualmente carece de soporte para el modo de voz, la comprensión de video y el uso compartido de pantalla.
Por ahora, este modelo se limita a la fase de vista previa de la investigación, lo que significa que ni siquiera está ampliamente disponible para los suscriptores de ChatGPT Plus. Parece que los desafíos de infraestructura están frenando la disponibilidad más amplia de GPT-4.5 en el mercado.

IA abierta

Leer más