OpenAI智能体可自主帮人订餐购物迈向通用人工智能的重要一步

fjmyhfvclm2025-01-25 14

AI智能体正在加速尝试代替人类完成一些任务。1月23日，OpenAI发布了首个AI智能Operator。这款智能体能像人类一样使用网页浏览器，点击按钮、打字输入内容，自动完成预订旅行住宿、餐厅预约、在线购物等复杂任务。

系统支持多任务并行处理，例如在某购物网站上订购搪瓷马克杯的同时，也能在另一平台预定露营地。用户可以为特定网页或全站添加自定义指令，并在主页保存，实现跨聊天窗口的多任务处理，如设置订机票时的首选航司。

技术原理主要由Computer-Using Agent模型驱动，结合了GPT-4o的视觉识别能力和基于强化学习的高级推理功能，使Operator能够“看见”网页并与之互动。目前，研究预览版率先向订阅200美元Pro计划的美国用户开放，后续将逐步扩展至Plus、Team和Enterprise级别用户。OpenAI希望很快将Operator集成到其所有ChatGPT应用中。

从现有体验来看，Operator在基础网页操作和重复性任务方面表现出色，如搜索筛选、创建购物清单和音乐播放列表等任务成功率较高。但在处理复杂的房产搜索等任务时，成功率相对较低；在处理不熟悉的UI界面和文本编辑时表现欠佳。发布演示和用户测试中，Operator出现了网页无法成功加载等情况，表明其在运行稳定性上存在不足。部分网站可能会屏蔽AI访问，导致智能体无法在这些网站上执行任务，限制了其应用范围。

据OpenAI介绍，这款智能体在WebArena测试中得分58.1%，在WebVoyager测试中实际网站导航成功率达87%，而在OSWorld测试中的得分为38.1%。WebArena测试用于评估智能代理在网络环境中执行任务的能力，WebVoyager测试则在真实网站上测试模型性能，OSWorld测试评估模型控制完整操作系统的能力。

尽管还谈不上完美，但这款产品标志着OpenAI进军智能体领域的开始。可以说，Operator是OpenAI向通用人工智能目标迈进的重要一步，也将进一步增强该公司在AI领域的竞争力。考虑到Operator在代替用户执行任务时可能需要输入敏感信息，如何避免潜在安全风险成为一个重要问题。

转载请注明原文地址:http://www.hongxiuz.cn/hot/1323373.html

OpenAI智能体可自主帮人订餐购物 迈向通用人工智能的重要一步

OpenAI智能体可自主帮人订餐购物迈向通用人工智能的重要一步