关闭广告

AI能力新高度!OpenAI发布ChatGPT智能体:能自主选择工具完成任务

澎湃新闻2025-07-18 12:00:013675人阅读

ChatGPT可以自主调用电脑资源执行任务了。

当地时间7月17日,人工智能(AI)巨头OpenAI推出ChatGPT智能体(Agent)系统,OpenAI CEO山姆·奥特曼(Sam Altman)和四位负责人进行了25分钟的直播。

据介绍,这是一套融合Operator远程浏览器执行能力、Deep Research网络信息整合技术以及ChatGPT对话优势的统一智能体平台,“可以思考和行动,能够主动从代理技能工具箱中进行选择,使用自己的计算机为您完成任务”。

奥特曼表示,智能体代表了AI系统能力的新高度。


此前,Operator和Deep Research各有优势:Operator可以在网页上处理内容,而Deep Research则擅长分析和汇总信息。但Operator无法深入分析或撰写详细报告,而Deep Research无法与网站互动以优化结果或访问需要用户身份验证的内容。此次,OpenAI直接将两者的优势进行了结合。

ChatGPT在Agent模式中会使用自己的“虚拟电脑”执行任务,基于用户指令处理复杂的工作,用户可以主动与网站互动,或在同一聊天中直接从对话过渡到直接请求操作。

在发布会上,OpenAI演示了用ChatGPT Agent同时进行买西装、做贴纸、订酒店等任务,Agent使用数秒启动虚拟电脑后便会询问用户明确需求,再进行衣服的挑选,Agent会滑动网页、点开商品详情,并留下相应的建议文字。此外,Agent也可以代替用户进行下单操作。


在“虚拟电脑”中,即使ChatGPT使用多种工具,也能保留任务所需的上下文,模型可以选择使用文本浏览器或可视化浏览器打开页面,从网络下载文件,通过在终端中运行命令进行操作,然后在可视化浏览器中查看输出。

同时,ChatGPT在执行重要操作之前会请求权限,用户可以随时中断、控制浏览器或停止任务。用户也可以安排已完成的任务自动重复,比如每周一早上生成每周报告。

在“人类最后一次考试”评估中,ChatGPT agent模型的SOTA(State of the arts,领域内最高水准)得分达到了41.6,当采用简单的并行部署策略(一次最多运行八次尝试,并选择自评置信度最高的一次)进行扩展时,得分提升至44.4。

此外,在FrontierMath等基准测试中,ChatGPT Agent的准确率也远超之前的模型。


Pro、Plus和Team用户可以使用Agent模式。企业版和教育版用户将在未来几周内获得访问权限。目前Pro用户每月有400次使用次数,其他付费用户每月有40次使用次数,也可以付费获得更多使用量。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

轻松!孙颖莎/王曼昱3-0金娜英/柳韩娜,晋级瑞典大满贯女双决赛

直播吧 浏览 1 08-23

中国新能源汽车亮相尼泊尔汽车经销商协会展览会

环球网资讯 浏览 9532 08-20

春日穿裙必备!收腹提臀安全裤 + 显瘦神裤,搭编织包美到犯规

Yuki女人故事 浏览 6648 05-28

上年纪的女人别买太多衣服,初秋有这三种就够了,时髦还显瘦

静儿时尚达人 浏览 1 10-01

队史首胜&逆转日本!布雷迪:中国队太酷了,祝福她们继续前进

直播吧 浏览 6050 08-19

小米SU7Ultra纽北限量版发布 定价81.49万元

网易汽车 浏览 4787 06-27

小米汽车登记Vision GT概念车著作权

三言科技 浏览 1493 07-21

沪指创年内收盘新高!下周怎么走?

国际金融报 浏览 6604 07-19

《不眠日》大结局!墨远致是乌贼

丹妮观 浏览 1 09-22

男生636分报民办新校福耀科技大学:赌输最差去玻璃厂

大象新闻 浏览 3772 07-23

男子离婚后私自过户女儿名下房产卖了1160万 法院判了

极目新闻 浏览 9851 08-09

冯绍峰新恋情刚曝,陈晓赵丽颖就传二搭?

喜欢历史的阿繁 浏览 9311 08-11

倒计时7天 93秒超前感受盛大阅兵

央视新闻 浏览 1 08-28

他们曾是颜值扛把子 如今却成了这样?

安海客 浏览 2 09-01

美攻击型核潜艇首泊冰岛 俄罗斯反应强烈

澎湃新闻 浏览 6505 07-19

女骑手将女儿装外卖箱送外卖:孩子患恶性肿瘤无人照料

鲁中晨报 浏览 1539 07-21

苹果 AI 编码助手生态扩展,Claude 加入原生阵营

IT之家 浏览 2793 08-19

向鹏2-4不敌张本智和,无缘WTT横滨冠军赛男单四强

懂球帝 浏览 1128 08-11

詹姆斯换库明加?湖人队记称有点吸引力但不现实:要更成熟的回报

罗说NBA 浏览 1 08-23

阿里发布Q1财报:收入超2476亿元,“AI+云”板块超预期加速增长

红星资本局 浏览 1 08-30

长城证券盘中跌超9%!1.15亿解禁股将来袭,公司:未收到第二大股东减持计划

时代周报 浏览 6438 08-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2