关闭广告

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

机器之心Pro2025-08-20 12:00:014856人阅读



机器之心报道

编辑:Panda

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型DeepSeek-V3.1-Base



模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!



具体技术指标上,DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大,同样的参数量,采用了混合专家(MoE)架构,拥有 128k 上下文长度。



整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。

对此,你怎么看?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

破坏卢少骅制毒,被周少雄彻底枪杀,《扫毒风暴》老鬼正式下线!

电和影 浏览 598 07-24

8个观众,票房仅233元,2025年9月最惨新片诞生了

靠谱电影君 浏览 1 09-02

美女手撕许凯:第一次见面就强吻 扭头功夫把衣服脱光

萌神木木 浏览 1 08-23

小鹏汽车副总裁回应“G6 降本方案传闻”:虚假消息,恶意造谣

IT之家 浏览 5776 07-27

桑托斯1-2巴西国际遭两连败,博雷点射,内马尔中立柱

懂球帝 浏览 7000 07-24

AI 内容须亮明身份,《人工智能生成合成内容标识办法》明施行

IT之家 浏览 1 09-01

廖群:关于 “十五五” 期间高质量发展的若干思考

首席经济学家论坛 浏览 7033 07-20

汪林朋纵身一跃,居然智家开盘跌停

财视传播 浏览 8796 07-28

全球首款文商旅体专用双足机器人“镋钯”发布

IT之家 浏览 2337 07-17

钟楚曦怎么不算“恋夏”女孩呢?

时尚COSMO 浏览 9492 05-28

对话商汤科技首席科学家林达华:生成不等于完成,AI创作的关键是理解人的意图

时代周报 浏览 9429 07-29

穿百元国货却悄悄捐钱,孙颖莎的“隐形慈善”,比金牌更圈粉!

娱乐白名单 浏览 6611 07-13

黄奕女儿不读书想去韩国当练习生,颜值是硬伤

疯说时尚 浏览 8365 07-24

黄奕女儿要做爱豆 网友:连颜值关都过不了

扒点半吃瓜 浏览 7385 07-25

普京确定俄乌谈判俄方代表团名单

央视新闻客户端 浏览 3270 05-15

李晟因“豪迈岔腿坐”引热议 本人:为什么不能?

漫婷侃娱乐 浏览 3884 07-30

记者:美资哈堡集团已完成对沙特职业联赛球队拉斯永恒的收购

懂球帝 浏览 4532 07-25

恭喜郑钦文!荣获央视超级大奖,临时退赛后,会引发2大连锁反应

侃球熊弟 浏览 6234 07-18

王晶爆成龙被扇耳光,说刘亦菲没天赋

界史 浏览 4366 07-12

百亿主动权益选手半年盘点:谁是崛起的黑马

智谷趋势 浏览 7203 07-18

俄乌迎来大结局?停火条件令人心酸,对全球经济有何影响?

北向财经 浏览 5956 08-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2