关闭广告

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

机器之心Pro2025-08-20 12:00:014866人阅读



机器之心报道

编辑:Panda

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型DeepSeek-V3.1-Base



模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!



具体技术指标上,DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大,同样的参数量,采用了混合专家(MoE)架构,拥有 128k 上下文长度。



整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。

对此,你怎么看?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

190亿杭州厨电巨头,动用43亿买理财

21财闻汇 浏览 15 08-30

今年秋天最流行的穿法:针织+衬衫,时髦又减龄!

LinkFashion 浏览 16 09-28

62岁守门员教练李伟退休,定南赣联为其举办退休仪式

懂球帝 浏览 11 11-04

亚麻,让人爱的高级清爽

Yuki女人故事 浏览 4381 05-27

杨少华灵前突发意外!前央视导演当场情绪失控

石场阿鑫 浏览 6781 07-15

4人在青海无人区失联超30小时 为求救曾徒步40多公里

上游新闻 浏览 3448 07-29

先进装备不断登场 以伊战火中的“武器对垒”

环球网资讯 浏览 4094 06-20

公安部最新发声:杜绝智能驾驶功能不实营销

国际金融报 浏览 1834 07-24

今日热点:文淇工作室已取证;碧梨又破纪录了……

伊周潮流 浏览 5 01-10

传递足球正能量,多家俱乐部转发中足联声明

懂球帝 浏览 1558 07-20

自动驾驶真的来了 两款车型分别在北京/重庆获准上路

网易汽车 浏览 8 12-16

牛弹琴:英国"动真格"了 王子被"大义灭亲"剥夺头衔

上游新闻 浏览 34 11-01

武林外传成员齐聚喜剧电影夜,座位、服装暴露咖位,姚晨遥遥领先

温柔娱公子 浏览 270 07-15

汽车经销商为何越来越“艰辛”了?

汽车K线 浏览 2680 05-27

上海贵酒遭遇釜底抽薪

斑马消费 浏览 13 10-14

50+女人别踩坑!远离紧身裤和老年装,这样穿优雅又显瘦

静儿时尚达人 浏览 10 12-08

官方:尤文前锋冈萨雷斯先租后买加盟马竞,总价3300万欧

直播吧 浏览 13 09-02

你看不起的零跑,终于打响第一枪!

象视汽车 浏览 12 10-25

斯基拉:国米正计划加薪与皮奥续约到2031年

懂球帝 浏览 7 01-16

微博响应中央网信办重拳出击,整治网络黑公关仍在进行时

时代周报 浏览 9823 07-20

相约北京,第二届世界人形机器人运动会将于明年 8 月举办

IT之家 浏览 9147 08-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2