La semana pasada, Openai lanzó GPT-4.5, que la compañía afirma que es el “modelo más grande y más conocedor hasta ahora”. Fue lanzado como una vista previa de investigación disponible solo para los usuarios suscritos a ChatGPT Professional, un plan de $ 200 por mes. Sin embargo, hoy, más usuarios de Operai pueden acceder a él por mucho menos dinero.
Acceso GPT-4.5 ampliado
El miércoles por la mañana, Openai anunció a través de una publicación X que comenzó a implementar GPT-4.5 a ChatGPT más usuarios. Cuando se anunció por primera vez, Operai compartió que el despliegue completo podría tomar una o tres horas. Sin embargo, solo una hora después, se completó el despliegue completo de GPT-4.5, que fue más rápido de lo esperado, según el X Submit.
Los límites del modelo para los usuarios de ChatGPT Plus no están claros. Operai dijo que planea dar a todos un “límite de tarifa appreciable”, pero las tarifas cambiarán a medida que la compañía aprenda más sobre la demanda del modelo. Los suscriptores de ChatGPT Professional continúan teniendo acceso a GPT-4.5, pero si desea probarlo por menos, puede con el plan ChatGPT Plus, que cuesta $ 20 por mes.
¿Qué es GPT-4.5?
En el lanzamiento, Openai dijo que los usuarios deberían experimentar una mejora normal al usar GPT-4.5, lo que significa menos alucinaciones, una alineación más fuerte con su intención inmediata y una mejor inteligencia emocional. En normal, las interacciones con el modelo deberían sentirse más intuitivas y naturales que los modelos anteriores, principalmente debido a su conocimiento más profundo y su mejor comprensión contextual.
Además: los modelos de razonamiento de OpenAI acaban de recibir dos actualizaciones útiles
Los dos métodos que impulsan las mejoras del modelo fueron el aprendizaje no supervisado, lo que aumenta el conocimiento y la intuición de las palabras, y el razonamiento. A pesar de que este modelo no ofrece razonamiento de la cadena de pensamiento, que lo hace el modelo de razonamiento O1 de OpenAI, aún proporcionará un mayor nivel de razonamiento con menos retraso y otras mejoras, como la conciencia de la señal social.
Por ejemplo, en la demostración, se le pidió a ChatGPT que emitiera un texto que transmitía un mensaje de odio mientras ejecuta GPT-4.5 y O1. La versión O1 tardó un poco más y solo emitió una respuesta, lo que tomó la nota de odio muy en serio y sonó un poco dura. El modelo GPT-4.5 ofreció dos respuestas diferentes, una más ligera y otra más seria. Ninguno de los dos mencionó explícitamente el odio; Más bien, expresaron su decepción por cómo el “usuario” eligió comportarse.
Del mismo modo, cuando se pidió a ambos modelos que proporcionaran información sobre un tema técnico, la respuesta de GPT-4.5 fluyó más naturalmente en comparación con la salida más estructurada de O1. En última instancia, GPT-4.5 está destinado a tareas cotidianas en varios temas, incluida la escritura y la resolución de problemas prácticos.
También: Cómo usar Sora de OpenAi para crear impresionantes movies generados por AI
Para lograr estas mejoras, el modelo fue entrenado utilizando nuevas técnicas de supervisión y las tradicionales, como el ajuste fino supervisado (SFT) y el aprendizaje de refuerzo de la retroalimentación humana (RLHF).
Durante la transmisión en vivo, OpenAi hizo un viaje por el carril de la memoria, pidiendo a todos sus modelos anteriores, comenzando con GPT-1, que respondiera la pregunta: “¿Por qué el agua es salada?” Como se esperaba, cada modelo posterior dio una mejor respuesta que la anterior. El issue distintivo para GPT-4.5 fue lo que Openai llamó su “gran personalidad”, que hizo que la respuesta fuera más ligera, más conversacional y más atractiva de leer utilizando técnicas de aliteración.
El modelo se integra con algunas de las características más avanzadas de ChatGPT, incluidas la búsqueda, el lienzo y la carga de archivos e imágenes. Sin embargo, no estará disponible en características multimodales como el modo de voz, el video y el intercambio de pantalla. En el futuro, Openai ha dicho que planea hacer que la transición entre los modelos sea una experiencia más perfecta que no depende del selector del modelo.
Puntos de referencia
Por supuesto, no sería un lanzamiento de modelo sin una inmersión en puntos de referencia. En algunos de los principales puntos de referencia utilizados para evaluar estos modelos, incluidas las matemáticas de competencia (AIME 2024), las preguntas de ciencias a nivel de doctorado (GPQA Diamond) y el SWE-Bench verificado (codificación), GPT-4.5 superó a GPT-4O, su modelo precedente de uso normal de uso normal.
Además: ¿Quiere que su safari sea predeterminado a chatgpt para buscar? Aquí está cómo hacerlo
En specific, en comparación con OpenAI O3-Mini, el modelo de razonamiento recientemente lanzado de OpenAI, que se enseñó a pensar antes de hablar, GPT-4.5 se acercó mucho más que GPT-4O, incluso superando a O3-Mini en los cañones Swe-Lancer Diamond (codificación) y MMMLU (multilingües).
Una gran preocupación al usar modelos de IA generativos es su predisposición a alucinar o incluir información incorrecta dentro de las respuestas. Dos evaluaciones de alucinación diferentes, la precisión de SimpleQA y la alucinación Simpleqa, mostraron que GPT-4.5 period más precisa y alucinada menos que GPT-4O, O1 y O3-Mini.
Los resultados de las evaluaciones comparativas con probadores humanos mostraron que GPT-4.5 es el modelo preferible sobre GPT-4O. Los probadores humanos lo preferían para consultas cotidianas, profesionales y creativas.
Seguridad
Como siempre, Openai aseguró al público que los modelos se consideraron lo suficientemente seguros como para ser liberados, probando el estrés del modelo y detallando estos resultados en la acompañante tarjeta del sistema. La compañía también agregó que con cada nuevo lanzamiento y aumento en las capacidades del modelo, hay oportunidades para hacer que los modelos sean más seguros. Por esa razón, con el lanzamiento de GPT-4.5, la compañía combinó nuevas técnicas de supervisión con RLHF.