OpenAI ha lanzado un nuevo agente de inteligencia synthetic (IA) diseñado para realizar diversas tareas en línea en nombre de los usuarios. El producto se conoce como Operator y “usando su propio navegador, puede mirar una página net e interactuar con ella escribiendo, haciendo clic y desplazándose”, según la startup.
Operator es uno de los primeros asistentes de IA de la firma enfocado en la ejecución independiente de múltiples tareas. Está diseñado para automatizar actividades repetitivas en cualquier navegador. Es capaz de completar formularios, realizar pedidos de comestibles, gestionar reservaciones de servicios o programar reuniones virtuales con una sola indicación.
El recurso está disponible en una “versión preliminar de investigación, lo que implica limitaciones en su funcionalidad y capacidad de procesamiento. La organización dirigida por Sam Altman promete que su producto evolucionará “en función de los comentarios” recibidos.
“Operator transforma a la IA de una herramienta pasiva a un recurso activo en el ecosistema digital. Su capacidad de utilizar las mismas interfaces con las que los humanos interactúan a diario amplía la utilidad de la IA, lo que ayuda a las personas a ahorrar tiempo en las tareas cotidianas”, de acuerdo con OpenAI.
El asistente busca posicionarse como un aliado del sector público y privado. La compañía está colaborando con corporaciones como DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack y Uber para satisfacer las necesidades de los clientes finales, “respetando las normas establecidas”. Agrega que está explorando “a fondo” casos de uso” con autoridades de la ciudad de Stockton, California, para agilizar los procesos administrativos.
¿Cómo funciona la nueva IA de OpenAI?
El funcionamiento de Operator está basado en el modelo de IA Pc-Utilizing Agent (CUA) que combina las capacidades de visión y razonamiento de GPT-4o mediante una técnica de aprendizaje por refuerzo. Esto significa que CUA está capacitado para interactuar con los botones, menús y campos de texto que las personas ven en una pantalla, sin necesidad de integrar API’s personalizadas.
Los desarrolladores señalan que el asistente usa “sus capacidades de razonamiento para autocorregirse”. Cuando no puede cumplir con una tarea, devuelve el management al usuario para garantizar una experiencia fluida y colaborativa. El sistema está diseñado para proteger información confidencial y evita compartir credenciales o datos sensibles con los sitios net. OpenAI subraya que Operator “rechaza solicitudes dañinas y bloquear contenido no permitido”.
X content material
This content material may also be considered on the positioning it originates from.
Disponibilidad y uso
Los interesados en usar Operator solo deben ingresar al portal ‘operator.chatgpt.com’ y describir la tarea que desean realizar. En cualquier momento, pueden tomar el management del navegador remoto. Recibirán alertas proactivas cuando se requieran acciones específicas que involucran información smart, como calves de acceso y datos para procesar pagos. El programa permite configurar instrucciones específicas para sitios net concretos.
La nueva IA solo está disponible para los suscriptores del plan ChatGPT Pro en Estados Unidos. OpenAI planea ampliar su alcance a usuarios en otros países y ofrecerlo en sus membresías Plus, Workforce y Enterprise en el futuro.