关闭广告

AI能力新高度!OpenAI发布ChatGPT智能体:能自主选择工具完成任务

澎湃新闻2025-07-18 12:00:013691人阅读

ChatGPT可以自主调用电脑资源执行任务了。

当地时间7月17日,人工智能(AI)巨头OpenAI推出ChatGPT智能体(Agent)系统,OpenAI CEO山姆·奥特曼(Sam Altman)和四位负责人进行了25分钟的直播。

据介绍,这是一套融合Operator远程浏览器执行能力、Deep Research网络信息整合技术以及ChatGPT对话优势的统一智能体平台,“可以思考和行动,能够主动从代理技能工具箱中进行选择,使用自己的计算机为您完成任务”。

奥特曼表示,智能体代表了AI系统能力的新高度。


此前,Operator和Deep Research各有优势:Operator可以在网页上处理内容,而Deep Research则擅长分析和汇总信息。但Operator无法深入分析或撰写详细报告,而Deep Research无法与网站互动以优化结果或访问需要用户身份验证的内容。此次,OpenAI直接将两者的优势进行了结合。

ChatGPT在Agent模式中会使用自己的“虚拟电脑”执行任务,基于用户指令处理复杂的工作,用户可以主动与网站互动,或在同一聊天中直接从对话过渡到直接请求操作。

在发布会上,OpenAI演示了用ChatGPT Agent同时进行买西装、做贴纸、订酒店等任务,Agent使用数秒启动虚拟电脑后便会询问用户明确需求,再进行衣服的挑选,Agent会滑动网页、点开商品详情,并留下相应的建议文字。此外,Agent也可以代替用户进行下单操作。


在“虚拟电脑”中,即使ChatGPT使用多种工具,也能保留任务所需的上下文,模型可以选择使用文本浏览器或可视化浏览器打开页面,从网络下载文件,通过在终端中运行命令进行操作,然后在可视化浏览器中查看输出。

同时,ChatGPT在执行重要操作之前会请求权限,用户可以随时中断、控制浏览器或停止任务。用户也可以安排已完成的任务自动重复,比如每周一早上生成每周报告。

在“人类最后一次考试”评估中,ChatGPT agent模型的SOTA(State of the arts,领域内最高水准)得分达到了41.6,当采用简单的并行部署策略(一次最多运行八次尝试,并选择自评置信度最高的一次)进行扩展时,得分提升至44.4。

此外,在FrontierMath等基准测试中,ChatGPT Agent的准确率也远超之前的模型。


Pro、Plus和Team用户可以使用Agent模式。企业版和教育版用户将在未来几周内获得访问权限。目前Pro用户每月有400次使用次数,其他付费用户每月有40次使用次数,也可以付费获得更多使用量。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这样选出来的裙子,绝对不会闲置

黎贝卡的异想世界 浏览 3639 08-12

G7对中国提出三个“不许” 媒体质问:凭什么

上游新闻 浏览 19 12-02

媒体:美国抛给以伪和谈计划 成以蚕食巴勒斯坦冲锋号

新民周刊 浏览 21 10-02

来自母校的鼓励,旧金山大学官方:祝贺王俊杰获得亚洲杯亚军

懂球帝 浏览 4289 08-19

田栩宁事件越闹越大!央妈下场回应 湖南台受牵连

TVB的四小花 浏览 2239 07-11

今冬高质感穿搭,很有气质!

Yuki女人故事 浏览 15 10-15

港科大突破:代码本技术提升AI医学图像分析稳定性

科技行者 浏览 9 01-29

男网又一35岁老将退役,德约科维奇动情告别老友

网球之家 浏览 1239 07-29

半夏投资创始人李蓓新“战场”:12888元卖课、“下凡”小红书!

独角金融 浏览 13 01-27

又爆了一部新片,他今年太火了

独立鱼 浏览 14 09-22

丁应虎履新蜀道集团党委副书记、董事、副总经理

红星资本局 浏览 4991 07-21

德天空:多特想要一个控球更稳的6号位,詹以后更多踢中卫

懂球帝 浏览 5506 07-23

36岁男子因糖尿病引发心衰去世 23岁妻子:我不会改嫁

极目新闻 浏览 8221 07-16

马杜罗在纽约首次“出庭” 多国发表联合声明

环球网资讯 浏览 14 01-06

两周抛售2.5亿美元!Prosus开始减持美团40亿美元股份

华尔街见闻官方 浏览 8100 07-31

奇瑞汽车宣布三大升级计划,2026年超35款车型将搭载猎鹰智驾

IT之家 浏览 13 01-18

泽连斯基:愿在特朗普领导下实现持久和平

都市快报橙柿互动 浏览 2257 03-06

AI正在建立自己的经济体,人类准备好被“降维打击”了吗?

硅星人 浏览 14 09-19

宋春雨:下一代颠覆性巨头,不会出现在大模型里

钛媒体APP 浏览 3952 08-09

小红书社区公约2.0里的「UGC社区进化史」

周天财经 浏览 15 01-20

少妇浓妆艳抹跑去和情夫发生关系 怕被丈夫杀写好遗书

北回归线 浏览 19 08-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2