0

MIT又一突破！用AI过滤音源，让音乐更悦耳

阅读时间大约2分钟（698字）

2018-07-09 MIT又一突破！用AI过滤音源，让音乐更悦耳

PixelPlayer 进行完全自监督的学习，人们无需对数据注释，而且系统目前已经能识别 20 种乐器。

【猎云网（微信号：ilieyun）】7月9日报道（编译：杨卟咚）

一般利用均衡器可以将音乐中的低音部分调出来，但是麻省理工学院的计算机科学和人工智能实验室（Computer Science and Artificial Intelligence Lab，CSAIL）的研究人员发现了更好的解决方案。他们所研发的新系统 PixelPlayer，能够利用人工智能来区分和过滤声音，让音乐听起来更洪亮或更柔和。

将指定视频录入经过充分训练的 PixelPlayer，系统随机能够过滤伴奏，同时识别音源，接着计算图像中每个像素的音量，然后通过“空间定位”确定产生相似音波的片段。

今年9月，德国慕尼黑即将举行欧洲计算机视觉会议（European Conference on Computer Vision），会议中要发表的一篇新论文则详细论述了“像素的声音（The Sound of Pixels）”。麻省理工学院计算机科学和人工智能实验室的博士生，同时也是这篇论文的合著者 Zhao Hang 同学表示，“最好的情况就是，我们能识别出哪种乐器发出怎样的声音。”

PixelPlayer 的核心是一种基于乐器组合多模态训练的神经网络，数据集采用了 Youtube 上 714 条未经修剪且未经标记的视频。其中，总时长为 60 小时的 500 条视频用于训练，剩余的则用于验证和测试。在训练过程中，研究人员分别根据原声吉他、大提琴、单簧管、长笛和其他乐器向系统馈入了算法。

这只是 PixelPlayer 多重机器学习框架的一个部分。经过训练后的视频分析算法将从剪辑帧中提取出视觉特征，这就是系统的第二个神经网络，即音频分析网络。音频分析网络将声音拆分为片段，并从中提取特征。最后，音频合成网络将把上述两个网络输出的特定像素和声波关联起来。

PixelPlayer 进行完全自监督的学习，人们无需对数据注释，而且系统目前已经能识别 20 种乐器。Zhao Hang 说，较大的数据集增强了系统的识别量，但识别乐器子类的能力却不佳。系统也可以识别音乐元素，例如小提琴的谐波频率。

研究人员认为 PixelPlayer 可以进行声音剪辑，或者帮助机器人理解动物、车辆和其他物体所制造的环境声音。他们写到，“我们希望我们的工作能够开辟新的研究途径，从视觉和听觉信号角度实现声源分离”。

MIT
音乐

1、猎云网原创文章未经授权转载必究，如需转载请联系官方微信号进行授权。

2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网（微信号：lieyunjingxuan

）字样。

3、猎云网报道中所涉及的融资金额均由创业公司提供，仅供参考，猎云网不对真实性背书。

4、联系猎云，请加微信号：jinjilei

相关阅读

{{item.post_title}}

{{item.time_ago}}

推荐阅读

{{item.post_title}}

grace33

报道请发邮件tougao@lieyuncapital.com或者加微信jinjilei

热门标签

热门文章

从Seedance 2.0到AI天团！海淀何以“生成”全球爆款

2026-02-15
最强开源模型助力！千问跃升国民级AI助手

18小时前
最强开源模型助力！千问跃升国民级AI助手

17小时前

投资机构

北京允泰投资管理有限公司成立于2017年，是一家聚焦国家战略新兴产业，以科技创投和资产管理为主业的私募股权投资机构。公司目前涉及两大主营业务：私募股权投资、定增投资。公司长期坚持以科技创新型企业投资为目标，重点投资于成长期的具有核心竞争力的高科技、高成长企业，覆盖半导体芯片、新材料、智能制造、新能源、医疗大健康等领域。

专注技术创新，专注早期投资，行业前瞻，与创业企业一起成长。

华兴资本是领先的私募股权投资者，专注于中国高增长及前景广阔的新经济行业。

黑洞投资成立于2014年，是一家聚焦于多资产类别、多策略投资的平台型投资机构。投资方向为：地产+、互联网+、人工智能、新零售、文化传媒等领域，通过股权投资、战略投资/孵化等形式为新经济生态圈中的创业者提供强有力的支持，携手打造具有高度商业价值和社会价值的优质企业。

北京长安投资

北京长安投资集团有限公司成立于 2002 年 9 月，总部位于北京市西城区闹市口大街 1 号长安兴融中心，注册资本三亿元人民币。经过二十余年的发展，长安投资集团已经成长为集金融、地产和投资三大核心业务为一体，拥有雄厚资本和优良信誉的大型多元化投资集团。

国科嘉和（北京）投资管理有限公司是中国科学院控股有限公司（简称“国科控股”）直属一级企业，成立于2011年。国科嘉和由国科控股牵头发起，并联合多家国内大型企业集团，共同设立了2支人民币风险创业投资基金（VC基金）、2支人民币并购基金(PE基金）、1支产业专项基金以及1支美元风险投资基金，管理资金总额达数百亿，是国科控股直属唯一同时涵盖VC、PE的专业投资机构。

银盛泰资本

专注医疗大健康和科技领域拥有一流品牌的领先企业，覆盖初创期、成长期、成熟期、Pre-IPO各个阶段，挖掘海内外优质投资机会，成就基业长青的伟大公司！

领沨资本自2015年9月成立以来，致力于投资新金融基础设施领域的优质成长期企业，重点关注具有核心技术壁垒，且具有创造大规模商业及社会价值潜能的企业。领沨资本投资的细分领域依次为人工智能、区块链、金融云／大数据、网络安全及物联网在金融领域中的应用、信贷科技如供应链金融科技、保险科技、投资／财富科技、支付、信用评级与风险管理企业等。领沨资本管理人民币及美元基金，已成为亚太和大中华区最大、最强的金融科技专业基金之一。

钟鼎资本，成立于2010年，是一家专注“以供应链为核心能力提升产业效率”的生态型基金。聚焦的投资领域包括物流、供应链、零售&品牌、数据科技等，为国内物流供应链领域最有影响力的投资机构。

联想创投为联想集团CVC，专注于面向未来的科技产业投资，投资方向主要为：IoT、边缘计算、云、大数据、人工智能、垂直行业、消费升级等。已投资和孵化超过百家优秀企业，包括美团点评、宁德时代、蔚来、旷视科技、寒武纪、每日优鲜、SHAREit等。

天风证券私募基金子公司，专业从事股权投资和私募基金管理，致力于构建人人受益的产融生态，坚持与客户共存共荣，助力实体经济发展和产业升级。

北辰星资本

目前主要关注体育、文化、娱乐、教育等领域的中早期项目投资；已投资包括肆客体育、伐木累、淘手游、河马牙医、竞彩猫、去滑雪GOSKI、羽贝纳、趣动户外、DS足球、福建天信职业足球俱乐部等项目。2016年肆客体育、竞彩猫、去滑雪三个项目被懒熊体育评选为“年度十佳体育创业项目”，同年由北辰星主导发起的去玩体育产业基金（去玩资本）和红衫、IDG等知名机构一起被猎云网评选为“2016年十大体育产业投资机构”。

菁英汇资本

菁英汇资本是受天津市政府引导基金支持的创投机构，投过的知名案例如奇安信、国开新能源等。主要投资于网络安全、产业互联网、大数据、云计算、物联网、教育信息化等数字经济领域的项目。标签：软科技、企业服务，阶段A轮以后

成立于2015年，是一家以价值投资为宗旨的精品VC，创始团队来自中路资本、上海实业直投部、工商银行投行部、创赢金融等公司的核心成员，具有丰富的一二级市场和互联网、互联网+、消费、教育等领域的投资经验、行业研究经验及资本运作经验，过往案例包括Blued、团车网、波奇网、小卫科技、小鸟教育，赛优教育、丝域养发等。

德联资本成立于2011年，重点关注高端制造、前沿科技、医疗健康等领域中技术驱动型项目，已投资启明医疗、盟科医药、珞石机器人、华捷艾米、梅卡曼德、得一微电子、飞致云等数十家创业公司，覆盖机器人、智能制造、人工智能、大数据、企业服务、医疗健康等多个细分领域。

东沙湖基金小镇

江苏省首批省级特色小镇，致力于构建一个以私募基金为核心，实施“资本+科技”双轮驱动，服务于实体经济的多层次体系。

凯旋创投成立于2008年，中国本土专注于早期科技企业投资的双币私募投资机构。致力于长期投资国家战略新兴产业，包括物联网、高端制造、人工智能、先进医疗、高性能材料等领域，不断构建与完善科技及产业投资生态圈，为创业者提供丰富经验经验、全球视野及资源，并持续赋能。团队拥有丰富的技术行业经验和坚实的高科技产业背景，具备跨越周期的投资能力。

众海投资成立于2014年，由前阿里巴巴集团高管鲁众、黄海军共同创办。目前管理着 5 期人民币基金，持续专注于互联网/消费、高新科技和医疗大健康等领域，主要覆盖阶段为初创期与成长期。已投资超过50家优秀的中早期企业，包括乐乐茶、爱慕、宜明昂科、言几又、新中冠、格隆汇、聚土网等。致力于做成长企业的合伙人。

青锐创投成立于2015年，是专注于中早期投资的双币风险投资机构。公司总部位于上海。覆盖范围包括消费、硬科技和前沿科技等领域。

青山资本，中国一线天使投资机构，专注消费、TMT领域，主张独立思考、价值投资。致力成为创业者最早、最重要的支持者，与优秀年轻人一道，创造美好生活，重仓中国。

${{item.author_display_name}}$

{{item.author_display_name}}

{{item.author_user_occu}}

{{item.author_user_sign}}

{{item.post_title}}

{{item.time_ago}}

{{item.author_display_name}} {{cat.name}}

{{loadMoreText}}

×