機器人小Ai準確預測我是歌手總決賽深度計
4月8日,在《我是歌手》的第四季总决赛中,出现了一个不速之客,这就是扬言能预测歌王的阿里云人工智能机器人小Ai总决赛开场前,小Ai预测黄致列夺冠几率第一,尽管最终的歌王是李玟,但小Ai成功预测了前三名
在了解阿里云人工智能机器人小Ai的基本运作进程后,认为小Ai的算法其实已不仅是深度学习,而是在深度学习之上的更高阶算法,并就此向阿里云人工智能科学院闵万里求证,得到的回复:是的
小Ai算法高阶在哪里
尽管阿里云方面没有泄漏关于小Ai更多算法方面的信息,只说小Ai主要基于神经络、社会计算(socialcomputing)、情绪感知等原理工作,善于洞察本质和实时预测,并能理解人类情感
但是小Ai挑战歌王预测难点有3:首先,这是在7个歌手之间的混战,并非AlphaGo与李世石之间的两人对弈;其次,唱歌是情感理解加艺术欣赏,不同的唱法、变声、假声等无常法也无定论,现场演唱更是即兴创作;再次,终究结果是湖南卫视节目组、电视观众、500位大众评审、7位歌手共同创造的结果,其中充满了巨大的随机性
简单的理解,用于AlphaGo围棋对弈、语音识别、图像识别等的深度学习算法,主要解决的是单目标优化问题,而小Ai要挑战的本质上是多目标优化问题,这从根本上就 迫使 阿里云选择更高阶的算法闵万里告知钛媒体,小Ai本身是一个基于几率的决策优化进程,在决策过程中需要多组变量输入,其中的部份变量是通过深度学习优化得来
之前,小Ai的算法已经被阿里云成功用于浙江省交通厅的路况预测,而能解决城市管理和宏观经济问题的人工智能算法都属于多目标优化算法西方已在城市综合管理和宏观政策制定等领域长期采用了多目标优化算法,包括摹拟退火算法、遗传算法等闵万里向钛媒体称,小Ai并没有采用现成的多目标优化算法,而是自己开发的算法体系
小Ai之父闵万里
那末,小Ai凭什么能够实现高阶算法呢这必须要提到小Ai之父、阿里云人工智能科学院闵万里
14岁被中科大的少年班录取,闵万里19岁赴美攻读物理学硕士,2004年获得芝加哥大学统计学博士,先后在IBM Watson研究院及Google担负研究员,201 年加入阿里云负责人工智能项目小Ai
闵万里说在IBM Watson研究院的经历让他受益匪浅IBM最早提出智慧城市战略,也是最早看到未来趋势2005年,IBM把PC硬件业务卖给联想后,开始自己的转型这个转型的过程,最缺的就是海量数据分析能力,因此补充了很多相关研究项目,包括海量数据分析、关键信息提取、预测建模、机器学习等,闵万里也借此接触了一线实战案例
之后到了Google,闵万里比较具体地负责移动端广告精准推送优化研究,主要是对海量数据进行研判,这其实已经非常接近今天小Ai要解决的问题了移动端广告精准推送优化是互联广告最核心的技术,需要通过大数据分析和机器学习等提升广告的精准推送,从而提高广告的点击率
移动端广告精准推送优化数据分析包括:研判用户当前上下文页的内容;研判用户所在地理位置 驾车状态下推送短广告、饭馆里推送复杂广告;研判用户对推送广告的喜爱程度等这些都属于多情景变量下的实时决策问题,与小Ai要挑战的歌王预测场景极为类似
闵万里长时间从事机器学习理论研究与运用算法研发,在脑电波(EEG)解析、高维数据发掘、随机进程理论、时间序列分析、络流理论等领域取得多项国际专利他于2011年发表的道路交通流预测研究,是该领域全球五年来被援用次数最多的论文之一
201 年,有猎头找到闵万里,希望游说他加入阿里云当时猎头说了一句话,中国有这样一家公司,数据总量比亚马逊、eBay、Paypal加起来还多 这一句话就已可以说明一切了,做大数据就要来阿里 闵万里如此断然加入
小Ai的研发过程
从2012年开始,阿里云研发了后来被称为 Max Compute 的海量数据处理计算引擎,当时叫做ODPS,这是小Ai非常重要的计算基础设施
ODPS是阿里团体 0多个事业部唯一的大数据处理平台,在2015世界Sort Benchmark排序比赛中,ODPS用 77秒完成了100TB的数据排序,打破了此前ApacheSpark创造的1406秒纪录,创造了4项世界纪录如今,Max Compute可在6小时内处理100PB数据、相当于1亿部高清电影
值得一提的是ODPS的实时计算系统StreamSQL,后来在阿里云数据加平台被称为 Stream Compute ,可日均处理万亿消息、PB级的数据和千万级的每秒查询率QPS,适用于根据用户实时行动数据(浏览、成交、收藏等)调剂推荐商品的实时推荐系统等
阿里云方面说,小Ai的学习速度是人类的1万倍,人类需要10万小时成为某一领域的专家,小Ai只需要10小时这其实就是基于Max Compute和Stream Compute等阿里云大数据分析的实战平台, 阿里云的大数据分析是经过了实战检验,这是与其它平台不一样的地方 这个平台经历了阿里上万名工程师的实战,其中包括7次双十一的考验
在研发Max Compute等计算平台的同时,阿里云人工智能小组还在开发深度学习、社交络情感分析、语意分析、优化算法等人工智能算法体系到2015年的时候,阿里云的人工智能算法在阿里各个业务场景下实现了成熟的运用,之后被抽象成通用的模块再嫁接到Max Compute上
所以阿里云的人工智能模块带有明确的可应用场景,不是闭门造车也不是我们憋了4年,就为做这件事(挑战《我是歌手》)这其实是在阿里整个业务生态中,慢慢成长起来的 闵万里对钛媒体说
小Ai的算法体系
阿里云于2012年就开始人工智能领域的技术研发和储备在参加湖南卫视《我是歌手》比赛之前,小Ai已经积累了不少实战经验,比如帮助光伏电厂预估发电产能减少能耗、帮助水利监管部门预测水库水位以预防灾害发生、帮助金融机构客服人员接、帮助阿里音乐预测音乐黑马等等
小Ai团队除工程师、科学家以外,还有多位阿里音乐和专业人士作为教练,学习了几百万首歌提升音乐品味和鉴赏能力小Ai基于阿里音乐数据库,自动学习音频的重要特点后形成对歌曲的多维度评价,包括音高、能量、语谱、基频等,通过特点来训练小Ai对音频及受欢迎程度之间的关联性思惟,不过目前小Ai还没有遍历韩文等外文歌曲
那末小Ai是如何现场预测比赛结果的小Ai从历史赛事和海量资料中寻找影响比赛结果的变量因子,训练出一个实时动态模型进行预测,包括歌曲、歌手、粉丝、现场氛围、友讨论等维度,每种维度都通过机器学习提取海量特点这些特征有静态的,也有跟随比赛而动态变化的,需要现场实时计算
闵万里泄漏,小Ai眼里的歌手是无数标签的集合,比如李玟就有女歌手、70后、华裔、美国、偶像、性感、奥斯卡、R B、Soul、粉丝量等标签而现场影响评委喜好的因素非常多,小Ai需要找到这些影响因素的每一个信息变量,包括歌手演唱相关的曲风、流派、编曲、帮唱佳宾、舞蹈、歌手颜值等现场热数据,以及场外的各种冷数据信息再把这些信息通过一定逻辑叠加在一起,形成整体决策机制
总结来说,小Ai要做的是去观察一切可能影响投票结果的因子,整个过程是在全空间、连续、动态地场景中, 理解人类的喜好 、 洞察人类的思考
与微软小冰的区别
作为一样主打 情感算法 的微软小冰,闵万里表示微软小冰与人类的一问一答对话很容易带入上下文情境,以后就可以用语言学等相干的模型进行建模和分析而小Ai要同时理解7个歌手的混战以及音乐欣赏等超出语言的内容,这是小Ai的不同之处
闵万里举例小Ai的算法难点,比如上一次的孙楠退赛完全出乎意料,小Ai也不可能预料到这样的事件,这对当时的模型训练造成了很大的困扰在现场比赛的时候,什么状态都有可能产生,不管最后小Ai预测的结果如何,都是一次成功的尝试
另外,在商业模式方面,小Ai看起来也不如微软小冰有一个比较容易的商业化线路,现在微软正把小冰变成整个微软产品与服务的人工智能基础设施与当前盛行的深度学习算法相比,小Ai的多目标优化算法似乎也难于看到一个清晰的商业化前景
对商业化模式问题,闵万里说阿里有一个战略:Happiness(幸福)和Health(健康),也就是幸福指数与健康指数小Ai的音乐和艺术欣赏能力,既跟幸福指数相关也与健康指数相干,仅仅实现这一点就已是巨大的技术成绩了另外,小Ai的能力可以很容易泛化到商业领域,之前已在交通管理、能源管理、天气预测等成功应用
《我是歌手》第四季总决赛中小Ai的实时预测尝试得到了广泛关注,IBM也提前为小Ai发来了祝愿更为重要的是,本次预测是多目标优化算法的一次挑战,可以说也是在中国首次被公众体验
从小冰到小i,开始研究和计算人类 情感 的算法,也意味着人工智能进入更高阶阶段
关键字:
剖宫产术后消化不良多久能恢复商城app开发
小儿积食会拉肚子吗
-
管理20个城市宣布购房可以拿到补贴你能轻松买
5G | 2020-09-18
-
阿森纳英超第1巨富3董事入最新福布斯富豪
5G | 2020-07-08
-
武磊爆发给中国足球带来1最大利好留
5G | 2020-06-30