小米开源声音理解大模型MiDashengLM-7B！人车家全生态战略关键技术组件

admin • 2025年8月4日下午1:55 • 互联网

快科技8月4日消息，小米正式发布并开源声音理解大模型MiDashengLM-7B，该模型是小米“人车家全生态”战略的关键技术组件。

MiDashengLM通过统一理解语音、环境声与音乐的跨领域能力，不仅能听懂用户周围发生了什么事情，还能分析发现这些事情的隐藏含义，提高用户场景理解的泛化性。

基于MiDashengLM的模型通过自然语言和用户交互，为用户提更人性化的沟通和反馈，比如在用户练习唱歌或练习外语时提供发音反馈并制定针对性提升方案，又比如在用户驾驶车辆时实时对用户关于环境声音的提问做出解答，其应用场景有广阔的空间。

结合高效的推理部署性能，MiDashengLM将广泛赋能智能座舱、智能家居等场景，推动多模态交互体验升级。

基于Xiaomi Dasheng音频编码器和Qwen2.5-Omni-7B Thinker自回归解码器构建，通过通用音频描述训练策略，实现对语音、环境声音和音乐的统一理解。

训练数据100%来自公开数据集，涵盖五大类110万小时资源，以Apache License 2.0协议发布，支持学术和商业应用。

核心优势：

性能领先：在22个公开评测集上刷新多模态大模型最好成绩（SOTA），在音频描述、声音理解、音频问答任务中表现突出，同时具备可用的语音识别能力。其音频编码器Xiaomi Dasheng在X-ARES Benchmark多项关键任务，尤其是非语音类理解任务上显著优于Whisper。

推理效率高：单样本推理的首Token延迟（TTFT）仅为业界先进模型的1/4；同等显存下数据吞吐效率是业界先进模型的20倍以上，80GB GPU上处理30秒音频并生成100个token时，batch size可达512，而同类模型在batch size 16时即显存溢出。

训练范式革新：采用通用音频描述对齐范式，通过非单调全局语义映射，学习音频场景深层语义关联，避免传统ASR转录数据对齐的局限，数据利用率高，还能捕捉说话人情感、空间混响等关键声学特征。

原创文章，作者：admin，如若转载，请注明出处：http://www.kandianxun.com/internet/42327.html

赞 (0)

0

详解特斯拉2亿美元天价赔偿案：马斯克吹过的牛都成为了证据！

详解特斯拉2亿美元天价赔偿案：马斯克吹过的牛都成为了证据！

上一篇 2025年8月4日下午1:54

网友晒买华为手机要签知情同意书：鸿蒙使用或有缺陷产品无质量问题

网友晒买华为手机要签知情同意书：鸿蒙使用或有缺陷产品无质量问题

下一篇 2025年8月4日下午1:56

互联网

《黑神话：钟馗》发布6分钟实机预告冯骥发文：别太严肃差不多得了

2月10日消息，《黑神话：钟馗》是游戏科学继《黑神话：悟空》后，推出的全新作品，本作最早于2025年科隆游戏展上亮相，目前仍在开发当中，发售时间暂未确定。今日，游戏科学官方发布了…

2026年2月10日
互联网

于东来与刘强东联手！总投资12.5亿大项目来了年产值25亿

快科技5月7日消息，胖东来超市创始人于东来要和京东创始人刘强东合作了。日前，据河南省许昌市东城区管委会官网消息，胖东来商贸集团联合京东物流集团打造的首个河南供应链产业基地——京东…

2025年5月7日
互联网

荣耀Magic8 RSR保时捷设计核心配置出炉：第五代骁龙8至尊版、顶配24GB内存

快科技1月12日消息，荣耀手机今日宣布，荣耀Magic8 RSR保时捷设计将于1月19日正式发布。荣耀表示，荣耀Magic8 RSR保时捷设计传承经典保时捷流光飞线设计，艺术设计…

2026年1月12日
互联网

1000亿美元豪赌！美光宣布打造全球最先进的存储芯片工厂

快科技1月12日消息，存储巨头美光科技宣布，将于1月16日下午在美国纽约州正式破土动工，兴建其规划中的巨型晶圆厂。该项目总投资预计高达1000亿美元，是纽约州历史上规模最大的私人…

2026年1月12日
互联网

中国电信回应超过60岁不能办eSIM业务：10月24日起恢复办理

快科技10月24日消息，日前，iPhone Air 国行版发售，标志着中国智能手机市场正式迈入eSIM时代。然而，有网友发帖称，购买iPhone Air后前往中国电信营业厅办理e…

2025年10月24日
互联网

微软官方揭秘：放弃Windows“秋/春创意更新”等命名真实原因

快科技8月6日消息，在Windows版本名称改为相对合理的H1和H2之前，微软曾经使用过一些非常奇怪且随机的命名方式。比如“周年更新”（Anniversary Update）、“…

2025年8月6日
互联网

限时3天！华为手机免费贴膜、维修免人工费

快科技4月3日消息，日前，华为终端BG首席执行官何刚微博发文宣布，华为4月服务日将于今天开启，活动持续至4月5日，共持续3天。据介绍，华为用户在活动期间到店可享免费贴膜、维修免人…

2026年4月3日
互联网

越南一修理店充气时轮胎突然爆炸：成年男子被掀翻在地

快科技8月19日消息，轮胎，尤其是货车轮胎爆炸的威力非同小可，甚至能直接将人炸飞，近日在越南一家修车店就发生了可怕的一幕。监控摄像头拍摄的画面显示，此事发生在本月11日，当时一光…

2025年8月19日
互联网

小米17系列本月发布小米邀请850位米粉参加新品发布会

快科技9月16日消息，小米17系列将于本月发布，发布会时间暂未公布。今日，小米表示，将邀请850位米粉到北京参加科技盛会，显然就是小米17系列发布会。米粉、小米车主及锁单未交付…

2025年9月16日
互联网

开卷本田雅马哈！春风运动平踏摩托150SC-F上市：11580元起

快科技4月15日消息，今日上午，春风动力全新150cc运动平踏车型150SC-F正式上市，共推出基础版 (11580元)、中配版 (12580元) 和箱杠版 (13180元) 三个…

2026年4月15日

发表回复