Serizawa lo de las 50 preguntas a la semana ya estaba cuando salió. Ese modelo antes se llamaba o1-preview y sí que tenía mayores capacidades que ahora.
No es que te la hayan liado como tal, es que por lo visto el modelo que finalmente han sacado para casi todos los usuarios (el o1 y o1 mini) son versiones capadísimas de los que tenían antes como preview para los usuarios premium (o1-prewiev y o1-mini prewiev, los cuales yo probé en su momento). Los buenos los han dejado para el tier más caro que tienen que son 200$ al mes.
La supuesta ventaja de o1 es que es capaz de razonar sobre un problema concreto y no simplemente decirte algo que le suena que es correcto. Si le das un problema complejo bien contextualizado y con unos datos concretos probablemente te lo resolverá mejor que el o4.
Serizawa Tu como lo usas? Tu le pasas información antes de preguntarle?
Si no es muy extensa, le paso documentación, si no una foto. Y aparte le explico exactamente lo que quiero y el contexto de la pregunta como si fuese un niño chico. Muchas veces falla porque a diferencia de o4 esta no se inventa los datos que faltan, sino que trata de deducirlos a partir de lo que le has dado, que es lo que haría un humano y tiene sus limitaciones.
De todas maneras el bajo rendimiento de o1 ahora es un problema general, no una impresión tuya. Hay mucha gente por ahi cabreada por eso mismo y supongo que lo acabarán retocando en un futuro próximo.