Home Tecnología OpenAi comienza a implementar su agente de IA operador en varias regiones

OpenAi comienza a implementar su agente de IA operador en varias regiones

16
0

Operai comenzó a implementar su operador de agentes de inteligencia synthetic (IA) en varios países el viernes. La herramienta de agente estaba disponible hasta ahora en la vista previa de los usuarios de ChatGPT Professional que residen en los EE. UU., Después de que la compañía la presentó en enero. Equipado con un navegador dedicado, el operador es un agente de IA de uso common que puede realizar de forma autónoma tareas en línea en función de las indicaciones dadas por el usuario. Si bien el agente de IA ahora está disponible en varias regiones importantes, la firma de IA dijo que no estará disponible en los países europeos.

El agente de IA del operador de OpenAI finalmente se despliega

En correo En X (anteriormente conocido como Twitter), el mango oficial de OpenAI anunció el lanzamiento del agente de IA. La compañía dijo que el operador ahora estará disponible para los usuarios de ChatGPT Professional en “Australia, Brasil, Canadá, India, Japón, Singapur, Corea del Sur, el Reino Unido y la mayoría de los lugares ChatGPT está disponible”. En explicit, la herramienta ya está disponible para aquellos que residen en los EE. UU.

Sin embargo, la compañía también agregó que los países europeos tendrán que esperar un poco más antes de obtener acceso al agente de IA. “Todavía trabajando para hacer que el operador esté disponible en la UE, Suiza, Noruega, Liechtenstein e Islandia”, agregó el Submit.

En el momento del lanzamiento, Operai explicó que el operador está alimentado por el agente que usa computadora (CUA), que es un modelo especial de IA que obtiene capacidades de visión por computadora de GPT-4O, y destrezas de razonamiento avanzado de un modelo OpenAI sin nombre (que podría ser el modelo O3). El agente de IA fue post-entrenado utilizando el aprendizaje de refuerzo.

El CUA tiene capacidades de agente y puede interactuar con interfaces gráficas de usuario (GUI), como botones, menús y campos de texto que se muestran en la pantalla. También tiene un navegador dedicado que le permite ejecutar acciones en un espacio separado, liberando al usuario humano para llevar a cabo otras tareas.

El operador acepta texto y imágenes como entrada. Al completar las tareas, analiza los datos de píxeles sin procesar de la pantalla y realiza acciones utilizando un teclado y mouse virtuales, también proporcionados en el entorno Sandbox. Se afirma que el agente de IA realiza tareas de varios pasos, navega a través de errores y se adapta a escenarios inesperados.

fuente