
NTN 425 - 🤖🎬 Claude 4.5 & Sora 2: la batalla de las IAs

Description of NTN 425 - 🤖🎬 Claude 4.5 & Sora 2: la batalla de las IAs
Hoy en NO TIENE NOMBRE nos vamos de viaje con dos pesos pesados: Claude Sonnet 4.5, el modelo más autónomo y coder de Anthropic, y Sora 2, la nueva bestia audiovisual de OpenAI.
• 🤖 Claude promete 30h de autonomía y ser “el mejor para programar”
• 🎬 Sora 2 quiere revolucionar el video con audio y control total
Fuentes:
• https://www.axios.com/2025/09/29/anthropic-claude-sonnet-coding-agent
• https://www.techradar.com/ai-platforms-assistants/claude/anthropics-claude-sonnet-4-5
• https://www.barrons.com/articles/openai-sora-2-video-generation-ai-model-111c73d9
https://www.theverge.com/ai-artificial-intelligence/788786/openais-new-ai-sora-ios-social-video-app-will-let-you-deepfake-your-friends
¿Quieres anunciarte en este podcast? Hazlo con advoices.com/podcast/ivoox/277993
This content is generated from the locution of the audio so it may contain errors.
Buenas, buenas, bienvenidos a otro episodio de no tiene nombre edición aeropuerto, estoy grabando en el aeropuerto porque por cierto el nombre es Bruno, no tenemos nombre, aquí hablamos de inteligencia artificial, tecnología, etcétera pero hoy ha habido dos bombazos que van a hacer ruido y mañana hay un tercero que se va a presentar en Toronto si te gusta el mundo de los agentes y la programación podrías dedicarte a ese pero vamos a ver no puedo hablar de eso ahora y como mañana voy a tener un par de días, ya voy un día atrasado he cancelado dos vuelos, he tenido que pasar una noche más en Buenos Aires y ahora estoy recién volviendo pues a ver cuando hablo de eso, mientras tanto vamos con dos noticiones porque dos players grandes como son Antropic y OpenAI han anunciado cosas brutales, por una parte Antropic habló sobre CloudSonnet 4.5 que es el nuevo SHERP a que le demos del código y a ver, yo llevo más de 20 años metido en todo esto de tecnología, he visto Gengun morir lenguaje jalo en el olido, progresas de AI, pero, pero, esto es diferente ¿Por qué? Antropic está diciendo sin pelos en la lengua que CloudSonnet 4.5 es el mejor modelo de código del mundo y a ver, en una prueba que tenemos nosotros, la verdad que está bastante, pero bastante bien no es el mejor de Antropic, el mejor del mundo, yo no sé si llegaría a tanto pero si puedo decir que funciona muy muy bien y además es el modelo más fuerte para construir agentes complejos y los mejores para el cloud, ordenadores, etc.
Básicamente, Antropic quiso decir, si antes era OpenAI el que ponía el listón para mover las cosas ahora soy yo y este es el listón que está bastante, bastante nat.
¿Saben qué es lo loco de todo esto? Que este bicho puede trabajar de forma autónoma durante 30 horas seguidas.
Ah, sí, como has escuchado, 30 horas. Eso es más que yo, a ver, yo no puedo correr tanto tiempo seguido pero bueno, es una brutalidad. Lo que voy a decir es que es una aplicación compleja con backend, frontend, test de demostración, etc.
Y empiezas, te vas a dormir, te vas de vacaciones y cuando vuelves ya está todo listo.
Es all por hoy el estado del arte en lo que es SWE Bench Verifier, que mide habilidades reales de codificación de software.
Para los que no estén metidos en este mundillo, SWE Bench es como el examen final de la facultad de ingeniería pero para modelos de AI y Cloud lo rompió todo.
Pero acá viene otra cosa que también me gustó mucho, mucho.
En NodeSquad, un benchmark que prohíba los modelos de AI y habilidades reales de computadora, SONNET 4.5 ahora lidera con un 61.4. Hace solamente 4 meses SONNET 4 tenía 42.2.
Esto es un salto, esto es un salto de un 45% de la mejora que tienen en 4 meses.
En el mundo de la AI esto es como pasar de gatear a correr maratones y ahí está.
Y ojo, porque un solo código. Los expertos en Finanzas, Derecho, Medicina y STEM encontraron que SONNET 4.5 muestra conocimiento específico del dominio de razonamiento dramáticamente mejor comparado con modelos anteriores intuidos OPUS, que era uno de los modelos más potentes y caros que tenían la gente de Antropic.
O sea que este modelo no solamente para grabar cine, también puede ayudarte con una análisis financiera, revisar contratos legales o explicarte conceptos médicos complejos.
No lo usáis para medicina. Así que bueno.
Tenemos algo también llamado, para los que somos programadores, Cloud Agent SDK, que es la misma infraestructura que alimenta el Cloud Code, pero ahora disponible para todos los desarrolladores.
De esto vamos a tener un poquito de la verdad también mañana.
Y hay más. Agregaron Checkpoints en Cloud Code, que es una de las funcionalidades más perdidas.
Que te ayudan a guardar tu progreso, volver instantáneamente a un estado anterior y básicamente lo que tenemos son commits, algo que podemos hacer un revertir, descartar para poder tenerlo. Así que, me gusta que Antropic no se durmió en la parte de seguridad y el alineamiento.
También nos dieron de comer a los programadores y parece que Cloud SONET, que es el último, es brutalmente bueno. Modo agéntico, uso de computadoras del modelo, también ha hecho un progreso incalculable en el esfuerzo contra ataques de inyección de prompts.
Bueno, tiene un montón, un montón de cosas. Y para cerrar, vamos a hablar del precio.
¿Por qué? Porque mantiene el mismo precio que el SONET 4.
3 dólares, aquí 6 dólares pone, yo no toco entrada y salida.
Está bien, no es el más barato, está bien. Y por la calidad que te da, la verdad que está bastante, pero bastante bien.
Los verdaderos están diciendo cosas locas. Cursor, que es una herramienta súper popular.
Copilot, también reporta mejor significativo de razonamiento.
Yo he estado probándolo con Copilot y realmente, realmente me voló la cabeza.
Así que bueno, vamos a la siguiente.
Vamos a la siguiente, porque ahora vamos a ir a comer un poco a la competencia, que es a la gente de los amigos de OpenAI.
OpenAI, con que juega bastante fasta con sus modelos y demás, pues cuando salgó su modelo de generación de video, ¡boom, boom! Pero, pero ya, pues quedó Sora, quedó bastante desfasado.
Quedó bastante atrás cuando vinieron los modelos de Gemini y otros.




















Comments of NTN 425 - 🤖🎬 Claude 4.5 & Sora 2: la batalla de las IAs