关闭广告

DeepSeek R2有望8月下旬发布?内部人士:不属实

澎湃新闻2025-08-14 00:00:017992人阅读

近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。

8月13日,DeepSeek内部人士向澎湃新闻记者表示,上述消息不属实。

早在今年4月,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

不过,上述内部人士曾向记者坦言,该传言真实度不高。

此后,DeepSeek官宣推出R1新版本,业内普遍认为这是取代了R2的发布。

5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。

大模型行业的内卷正在加剧。7月31日,据国际开源社区Hugging-Face最新趋势热榜显示,前十名模型中,有9个是国产大模型,其中排名第一的是智谱最新发布的新一代旗舰大模型GLM-4.5,排名第二的是阿里旗下通义千问模型Qwen3,而腾讯混元最新发布的3D模型则排行第三。

但据排名数据显示,DeepSeek R1在Hugging-Face趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型,DeepSeek R1收到了1.25万个赞(like),远超其他国产大模型。

在年初成为大模型产业王炸黑马后,DeepSeek成为国内大模型厂商的集体竞标对手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了对标DeepSeek的目标,且在更新迭代上进展迅速。作为中国开源大模型的“风向标”,DeepSeek正在面临更激烈竞争。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

或引入国内 特斯拉Model Y高性能版谍照曝光

车质网 浏览 2489 06-24

女子称在健身房洗澡被教练用车内窥镜偷看:他还摸我头

红星新闻 浏览 14 08-21

央视公开“点名”孙俪,原来张艺谋没说错

银河史记 浏览 13 10-28

越来越多的园区,开始“0租金”了

快刀财经 浏览 15 08-23

广东渔民捕的"神兽"鉴定为韩江鼋 曾在《西游记》出现

极目新闻 浏览 22 09-22

还记得那一年的王菲、舒淇、铃木保奈美吗?来看看“经济上行的美”有多绝!

黎贝卡的异想世界 浏览 3440 06-24

哪吒汽车被申请破产审查 申请人为广告公司

太平洋汽车 浏览 9979 05-15

WAIC前线|汉王科技推出首个“仿生嗅觉识别”方案

网易科技报道 浏览 8914 07-28

饿了么前CEO确认被抓 4000万赃款藏在多处出租屋内

扬子晚报 浏览 9796 07-27

特朗普称"不许中国领先美国" 不到24小时中方定下规矩

军机Talk 浏览 7 01-18

零跑发布第一季度财报 营收达100.2亿元

太平洋汽车 浏览 8831 05-20

外国投资者重返中国资本市场

国际金融报 浏览 12 09-19

64岁男演员春节在景区打工,暴瘦引担忧!

扬子晚报 浏览 8 02-24

王诗龄放暑假回国,富家千金穿搭,被爸妈一起宠

睡什么起来嗨 浏览 9287 07-07

靠老婆出圈,成名后过河拆桥,这4位实在绝情!

丹妮观 浏览 11 10-13

师咏勇再成中科院院士有效候选人,曾在27岁破格晋升为上海交大副教授

澎湃新闻 浏览 11 08-22

以色列历史上首次 国家安全总局局长被解职

界面新闻 浏览 4224 03-21

腾讯、米哈游等超50家中国厂商亮相2025科隆国际游戏展

环球网资讯 浏览 11 08-22

于根伟:客场对阵海港必须要保持很好的防守,我觉得球员做的不错

直播吧 浏览 16 08-25

产品未出,估值120亿美元,前OpenAI CTO拿下史上最大种子轮投资

DeepTech深科技 浏览 7649 07-16

秋天外套不需要准备太多,但一定要拥有一件风衣,洒脱又百搭

静儿时尚达人 浏览 10 09-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2