关闭广告

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

机器之心Pro2025-08-20 12:00:014873人阅读



机器之心报道

编辑:Panda

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型DeepSeek-V3.1-Base



模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!



具体技术指标上,DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大,同样的参数量,采用了混合专家(MoE)架构,拥有 128k 上下文长度。



整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。

对此,你怎么看?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

向太儿子向佑近照流出 威胁父母“不给钱我就去借”

鲁中晨报 浏览 16 10-16

力挺西贝后,胖东来老板又“翻车”了

i王石头 浏览 20 09-20

尊界“刷屏”,江淮“刷新”!

功夫AUTO 浏览 4493 04-29

破纪录了!纯电续航跑了1205公里!量产车!

小李车评李建红 浏览 1882 07-12

真相大白!王晶爆赵文卓梅艳芳分手内幕,被当做小狼狗,没有尊严

温柔娱公子 浏览 235 08-16

乐道L90大三排SUV 7月31日上市,预售价27.99万元起

IT之家 浏览 9943 07-22

美对乌“送”导弹后 美媒:特朗普依旧认为俄方将获胜

环球网资讯 浏览 490 07-16

原来他们是爷俩,冷漠父子藏实力!低调逆袭

章眽八卦 浏览 15 10-16

铜互连的终结?

半导体行业观察 浏览 19 08-22

被嘲普,却艳压热巴、杨超越?她凭什么成为时装周收割机?

Yuki女人故事 浏览 3383 07-21

抖音:卖茅台低于市场行情价将被处罚

第一财经资讯 浏览 13 11-11

疯涨400%!光纤价格“狂飙”,四大龙头“躺赚”?

览富财经网 浏览 4 04-10

美中已同意延长“关税休战” 外交部回应

环球网资讯 浏览 1929 07-31

王大陆离奇“闪兵”案,搞垮半壁台娱圈

仙女事件簿 浏览 17 10-25

里瓦尔多:拉什福德难以取代拉菲的位置,后者目前是世界前五

懂球帝 浏览 5359 07-26

没有品牌的球衣 俄超球队因俄乌战争爆发,和常见的国际品牌无缘

直播吧 浏览 887 07-20

中国天眼再升级!FAST将建成巨型综合孔径阵列

环球网资讯 浏览 12 01-16

“闭嘴歌”是Z世代年轻人的集体共鸣?

时尚COSMO 浏览 288 04-09

叮咚买菜设10个独立事业部,强化供应链和自有品牌

经济观察报 浏览 3534 07-23

速卖通:过去一年国货美妆出海销量增加100%

网易科技报道 浏览 7649 08-11

官方:切尔西19岁前锋吉米-摩根租借加盟彼得堡联

懂球帝 浏览 21 09-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2