关闭广告

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

机器之心Pro2025-08-20 12:00:014868人阅读



机器之心报道

编辑:Panda

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型DeepSeek-V3.1-Base



模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!



具体技术指标上,DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大,同样的参数量,采用了混合专家(MoE)架构,拥有 128k 上下文长度。



整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。

对此,你怎么看?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

苏超,明年有新变化!省政府再做部署!

国是直通车 浏览 10 10-21

山东一饭馆发菜品视频拟被罚45万 官方通报

界面新闻 浏览 3886 07-12

35岁郑爽近照曝光!脸部又僵又肿网友直呼认不出,彻底成了素人

萌神木木 浏览 4 01-08

美媒:美方仍在追截第三艘涉委内瑞拉油轮

上观新闻 浏览 10 12-23

《双轨》空降逻辑混乱,赛车泰拳伪骨科叠加,虞书欣演技难撑人设

不八卦会死星人 浏览 5 12-19

微软AI CEO警告:我们需要警惕「看似有意识的AI」

机器之心Pro 浏览 11 08-22

谷歌 Pixel 手机新功能防听力损伤:超 105 分贝 / 分钟自动降音

IT之家 浏览 13 08-23

那群哄抢LABUBU的黄牛,开始倒卖小米YU7订单了!

少数派报告Report 浏览 6507 07-03

皇氏集团业绩亏损难止,资产负债率达全新高位

经理人杂志 浏览 8235 08-13

垂直深耕AI汽车,东软睿驰的技术底座让车企“轻装上阵”

赛博汽车 浏览 3308 05-01

胜火箭杨瀚森迎3喜1忧!调整+篮板亮眼,数据异常稳定,2点需提升

篮球资讯达人 浏览 8895 07-18

累计套现超400亿元!61岁富豪贝索斯大婚后减持,豪华婚礼耗资超3亿元

红星资本局 浏览 6025 07-28

泽连斯基在哈尔科夫召开军事会议

环球网资讯 浏览 3716 03-23

液化气站多次申请许可证被拒 市住建局曾被判滥用职权

经济观察报 浏览 7514 07-20

三架飞机在俄罗斯被扣 山河智能:收到1.6亿保险赔款

红星新闻 浏览 2352 08-12

男大学生电脑存700多张女性裸露色情照片 机构回应

大象新闻 浏览 6156 07-22

国产纯电SUV三代,全新蔚来ES8要来了

懂车之道 浏览 3260 08-15

谢娜中秋晚会主持仅1天引争议,网友评论两极化

淼犇爱历史 浏览 14 10-09

大回血,股票型ETF一周猛增1000亿元!上周两明星产品遭“反噬”,但资金“越跌越买”|ETF规模周报

每经牛眼 浏览 12 10-27

豆包手机助手调整AI操作能力,刷分、金融类应用、部分游戏等三大场景将限制使用

澎湃新闻 浏览 10 12-05

九旬李明启谈到容嬷嬷为自己发声

蜜桔娱乐 浏览 14 11-04
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2