今天(2016年9月1日)上午,在2016百度世界大会上,百度创始人、董事长兼CEO李彦宏花了1个多小时谈百度在人工智能上的成果“百度大脑”。涵盖语音、图像、自然语言处理和用户画像等四个领域的进展。
百度首席科学家吴恩达在演讲时则更加直白地说:“百度是一家人工智能公司。”
李彦宏表示,百度大脑已经建成超大规模的神经网络,拥有万亿级的参数、千亿样本、千亿特征训练,能模拟人脑的工作机制。它的智商已经有了超前的发展,在一些能力上甚至超越了人类。
在语音识别方面,百度演示了一位百度电话销售人员跟客户电话沟通,百度语音识别技术可以将语音转化成文字。但跟科大讯飞的实时转译成文字不同,百度是等到这个人讲完话后,一次性给出文字,不知道在这个过程中是否有纠错过程。
在语音合成方面,百度合成了张国荣的声音,不过遗憾的是,合成后的语音虽然有广普的口音,但却不是粤语,并且声音有些粗。
李彦宏介绍,百度人工智能在听了你差不多50句话后就可以模仿你的声音,在演讲最后的环节,李彦宏邀请著名演员胡歌上台,在胡歌朗读了一首宋词《青玉案·元夕》(百度名字由来)的上阕后,百度人工智能就模仿胡歌的声音特色朗诵了下阕。不过还是能听到,合成音还是挺粗犷的,跟胡歌的嗓音还是有明显区别,即它可以模仿你的语音特色,但声线的模仿上还有很大的提升空间。
而在语音模仿方面,前不久发布的第四代微软小冰虽然是个女孩子,但是她也可以模仿并发出男人的声音。上个月我参观科大讯飞时,科大讯飞的语音人工智能可以把我的声音合成林志玲的声音,然而问题也都跟百度类似,就是在声音的声线上并不太相像。
在图像能力方面,百度大脑人脸识别准确率达到99.7%;百度无人车刷新了KITTI测试的多个世界记录,在KITTI车辆检测评比中排名第一。
在图像识别环节,镜头对准台下第一排的嘉宾,当摄像头采集到张亚勤等人的脸时,会在其上面标注出他的名字。
自然语言处理方面,百度展示了度秘与体育评论员杨毅同台解说的画面,李彦宏也邀请杨毅上台分享他对度秘的看法,他认为度秘在单独解说篮球比赛的时候,比跟他一起解说时表现得更好,不排除他放水的可能。
用户画像领域,百度大脑拥有千万级别的用户标签体系,李彦宏还向胡歌展示了胡歌的粉丝用户画像分布情况。
广告营收作为百度营收中的主要构成部分,不打广告不百度。李彦宏在台上展示了跟欧莱雅合作的AR项目,欧莱雅基于百度AR技术,在品牌营销领域做创新,实现销售突破;《魔兽》出品方传奇影业利用百度的用户画像能力,实现精准推荐,提升票房。
通过李彦宏的介绍,给我印象最深刻的是,百度做人工智能也好,做AR也好,做无人车也好,它非常在乎这些技术商业化变现能力,并迅速将之付诸于实践,而不像谷歌那么慎重。
你可以说百度这叫务实,你也可以说这叫现实。而人工智能,总是需要一些浪漫的。