OpenAI推出Operator,首款浏览器操作AI,引领2025智能体革命!

chatgpt2025-01-24 09:18:1063

先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi

大家好,我是木易,一名专注于AI领域的互联网技术产品经理,作为国内Top2本科和美国Top10计算机科学研究生,辅修MBA的我,始终相信AI是普通人实现自我突破的“加速器”,我致力于分享AI领域的全方位知识,涵盖科普、工具测评、效率提升和行业洞察等多个维度。

OpenAI推出Operator,首款浏览器操作AI,引领2025智能体革命! 推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

如果说十日前发布的ChatGPT Tasks是OpenAI在AI Agent领域的初步尝试,那么最新推出的Operator则标志着2025年AI Agent大战的序幕正式拉开。

北美时间1月23日,OpenAI正式发布了Operator Agent。

尽管此前关于Operator的传闻已在网络上传播,但当它真正亮相时,依然令人眼前一亮。

根据OpenAI提出的AI到AGI五阶段理论,ChatGPT等传统AI工具属于第一阶段“基础AI”,而推理模型如o1和即将发布的o3则属于第二阶段“推理者”,Operator的发布标志着AI正式进入第三阶段:智能体(Agents)。

以往的AI更像是“工具”:如ChatGPT、Kimi、DeepSeek等,需要明确的指令才能执行任务,而Operator则更像一个真正的“助手”,具备自主性和决策能力,它能理解模糊意图,分解任务,自主执行操作,实现了从“被动处理信息”到“主动完成任务”的进化。

十日前发布的ChatGPT Tasks已展现出这一方向的雏形,但真正的突破在于Operator,你只需告诉它“帮我预定这家餐厅今晚7点的位置”,Operator便会自动打开浏览器,搜索餐厅,选择时间并完成预定。

如果发现选定时间不可用,Operator会主动提醒你,并在最终确认前再次核实。

Operator还能帮你完成其他日常任务,如买菜,你只需告诉它想买的菜品,它便会自动打开Instacart,选择商品并加入购物车。

在下单前,你可以随时修改购物车,直接通过自然语言与Operator沟通。

Operator的核心亮点在于它能够直接操作浏览器,而无需依赖API,这一功能通过名为CUA(Computer-Using Agent)的模型实现,CUA基于GPT-4o训练,具备视觉能力,能够与图形用户界面(GUI)直接交互,模拟鼠标和键盘操作。

Operator强调人机协作,它在执行任务时会主动与用户确认,尤其是在关键操作如预定和付款时,体现了“Human in the loop(HITL)”的设计理念,确保AI系统的安全性和可靠性。

尽管Operator展示了强大的潜力,OpenAI在演示中多次强调它仍处于“研究预览”阶段,这意味着用户不应对其功能抱有过高期望。

在演示中,Operator也出现了一些小问题,在预定餐厅时,它一度表示可选时间不存在;在访问StubHub时,也遇到了重定向问题。

Operator目前仅支持浏览器操作,高度依赖GUI界面,且响应速度较慢,这些都是需要改进的地方。

Operator仅对每月200美元的ChatGPT Pro用户开放体验,其他用户的使用权限将逐步开放,与Sora一样,Operator以独立产品的形式推出。

2025年,智能体大战正式拉开帷幕!

OpenAI推出Operator,首款浏览器操作AI,引领2025智能体革命!

本文链接:https://ynysd.com/chatgpt/969.html

ChatGPTOpenAI智能体革命

相关文章

网友评论