Últimas novedades en OpenAI: modelos o1-preview y o1-mini.
Description of Últimas novedades en OpenAI: modelos o1-preview y o1-mini.
OpenAI presentó el pasado mes de septiembre los modelos o1-preview y o1-mini, que ya están disponibles en chat-GPT. En el episodio de hoy analizaremos en detalle estos dos nuevos modelos y veremos qué les diferencia de sus predecesores.
This content is generated from the locution of the audio so it may contain errors.
Ah bienvenidos a un nuevo capítulo de apasionados por la tecnología el podcast de paradigma digital sobre tecnología estrategia metodología y productos digitales arrancamos obtené ai presentó el pasado mes de septiembre sus nuevos modelos uno previo y o uno mini que ya están disponibles en http soy maribel tirados estos apasionados por la tecnología y hoy me acompañan josé maría hernández generated ella y estrategias en paradigma digital con él vamos a analizar en detalle estos dos nuevos modelos muy buenos días josé maría cómo estás buenos días qué tal muy bien hace uno bueno sí unas semanas ya publicaste en nuestro canal de instagram precisamente bueno esta noticia y desde apasionados por la tecnología queremos contar contigo también pues para que nos hablases un poquito más en detalle de de estos dos modelos que he comentado y que han salido hace apenas tres semanas por empezar josemaría que las diferencia que diferencia estos modelos de de sus predecesores bueno sí la verdad es que que realizamos un shorty se queda se queda un poco movimiento en contenido para explicar todo lo todas las bondades de estos nuevos modelos en primer lugar es que parece que ella tiene dudas si si si considerarlo su su a los modelos que conocemos su predecesor vemos que en sí que es cierto que realizar benchmarking como explicaremos a continuación comparándolo con cuarenta y cuatro pero pero después dentro de su document tación le da un apartado diferente entonces en a nivel práctico de lo que podemos tener mas de manera inmediata es que lo que observamos que los modelos anteriores desde tres que fue el primero que implementaron el famoso etc hasta el último publicado el pasado mes de mayo y es que estos modelos daban una respuesta inmediata a cualquier broqueles que seré el que el usuario le les pusiera y los nuevos modelos ahora ello el propio pene hay entre comillas la palabra pensar se toman un tiempo para pensar para razonar es donde ellos categorizan a estos modelos estos modelos en bajo la categoría de reasoning y después de un mínimo de unos ocho segundos y según nuestro benchmarking inicio al que hemos hecho puede llegar hasta casi el minuto responde entonces hay una serie de proceso en el que el modelo razonan te ofrece una respuesta final y eso básicamente es la primera gran diferencia que nos llamaba la atención y después al al tener este sistema de razonamiento detrás las técnicas de promoting que la comunidad desarrollado para hacer frente a la respuesta rápida quedaban los modelos anteriores como por ejemplo el chino stock la cadena de pensamiento fue el tiro shot el árbol de pensamiento queen instaba está esto sostenido de promoting instaban al modelo retrasar la respuesta y dar una solución final el problema es que el modelo nos retrasaba la aparición de la respuesta de manera temporal sin chino que hacia un razonamiento en el prom de salida en el en el autobús entonces no era en sí una respuesta razonada completa sino que el razonamiento también formaba parte de de esta este autobús de esta salida del modelo o sea que digamos que uno de los principales cambios de estos dos modelos con comparados con los con todo lo que había lo que había anteriormente pues es lo que tarda un poquito más no aparecer la respuesta porque hay una parte de razonamiento importante que igualan después no no la vía de la misma manera y josé maría estos modelos en qué disciplina destacan y a qué nivel bueno pues según según el propio pene y logró logro nivel de estudiante de doctorado en disciplinas como física química biología también dicen que es excelente en matemática y programación entonces lo que han hecho ellos es un benchmarking comparando o uno preview que digamos que es el modelo más potentes de los dos y cuatro era el modelo más potente hasta la fecha y le han dado para evaluar las matemáticas lo bueno que es resolviendo problemas matemáticos por problemas de las olimpiadas internacionales de matemática