关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家2025-09-19 12:00:020人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。


  • 首个明确语音生成式预训练的目标和定义,并开源一套完整的语音预训练方案,包括无损压缩的 Tokenizer、全新模型结构、训练方法和评测体系。


目前小米已在 Huggingface 平台开源了这款模型的预训练、指令微调模型,同时在 Github 平台开源了 Tokenizer 模型,其参数量达 1.2B,基于 Transformer 架构,支持音频重建任务和音频转文本任务。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

广州一城中村耗时15年终于拆除 周边是每平10万元豪宅

每日经济新闻 浏览 2812 07-23

戴向宇曾单方面通知家人要和陈紫函离婚

乡野小珥 浏览 0 09-21

再战点球梦魇地,桑德兰前锋伊西多尔重返伯恩利

懂球帝 浏览 1 08-23

刚刚,蒋凡回应此前饿了么为何不敌美团|附阿里最新业绩会实录

蓝鲸新闻 浏览 1 08-30

杨议也没想到,郭德纲这次没给他留“一丝体面”

观察鉴娱 浏览 2592 07-13

罗体:凯泽斯劳滕主场安装假鸟模型,避免鸽子太多造成鸽粪污染

直播吧 浏览 5325 07-27

耗资14亿,《超人》9小时票房仅358万,中国观众给好莱坞上了一课

靠谱电影君 浏览 4570 07-11

对话无招:基本上,我可以用自己的想法重塑AI钉钉

硅星人 浏览 0 08-26

智能体豪华旅行车 享界S9T30.98万元起售

网易汽车 浏览 3 09-18

美中已同意延长“关税休战” 外交部回应

环球网资讯 浏览 1917 07-31

11岁小玥儿正脸曝光!居家吃雪糕悠闲自在,五官神态简直大S翻版

萌神木木 浏览 3077 08-11

上汽+华为/双动力可选 尚界H5预售16.98万起

网易汽车 浏览 0 08-26

中国男网华盛顿迎来突破:布云朝克特、吴易昺携手绽放硬地赛场

网球之家 浏览 6094 07-23

新的内卷,不只是卡在手臂上的纸杯套

时尚COSMO 浏览 1 08-30

奥迪 E5 Sportback开启预售 限时23.59万起

澎湃新闻 浏览 1146 08-19

九年虚增营收近200亿!*ST高鸿遭三记重锤:1.6亿罚款+触及退市+重罚第三方

中国经营报 浏览 2355 08-10

佩通坦上任未满一年下台 77岁的前部长或出任泰国总理

上游新闻 浏览 0 08-30

“80后”资本大佬朱江掌舵后,帝欧家居迎来大动作,涉4.77亿元募资

红星资本局 浏览 3358 07-29

周国平谈“养老的精神维度”:阅读、旅行、写作……要把“老”养成年轻的状态

国是直通车 浏览 1 08-22

演员张静初官宣研究生毕业 曾直播学习火上热搜

极目新闻 浏览 3283 08-13

宋丹丹也没想到,竟然能让英达彻底败下阵来

山河月明史 浏览 3172 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2