刚刚,OpenAI放出Operator,能模拟人类上网,智能体之战打响
1月24日消息,今日凌晨,OpenAI 发布了首款智能体产品“Operator”。这一功能是一款能够模拟人类操作网页浏览器的AI助手,支持自动完成旅行住宿预订、餐厅预约和在线购物等复杂任务。
Operator 目前以研究预览(Research Preview)版本发布,能够通过互联网自动为用户执行多种任务。
OpenAI 表示,计划很快将其集成到ChatGPT中。目前,该功能仅面向美国的 Pro 用户开放。
Operator 的底层技术采用了一种全新的模型——Computer-Using-Agent(CUA)。
CUA 结合了 GPT-4o 的视觉能力和强化学习的高级推理能力,使其能够与 GUI 界面交互。
Operator 可以识别网页界面内容,并通过鼠标、键盘完成所有允许的操作,从而实现自动化操作,无需定制化的 API 集成。
当遇到问题或出错时,Operator 能利用自身的推理能力进行自我纠错。如果无法解决问题,它会将控制权交回用户。
OpenAI 总裁 Greg Brockman 在 X 平台发文称:“Operator 是一种可以通过内置浏览器为用户执行任务的智能体。2025年将成为智能体之年。”(袁宁)
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。