汤晓鸥:“明察秋毫”的源头创新

30.04.2017  17:31

   【知识人·强国梦】

  光明日报深圳4月29日电(记者 严圣禾 党文婷)利用城市各个角落的摄像头抓拍的人脸图像进行对比,自动识别出罪犯并发出警报;直接输入性别、年龄、服饰颜色等特征属性标签进行搜索,快速查找出所需要的人员信息……这是许多科幻、警匪电影都会出现的情节,而我国的科学家团队正在让这一情节成为现实。

  作为人脸识别准确率纪录的创造者和保持者,中国科学院深圳先进技术研究院副院长、香港中文大学教授汤晓鸥率领的团队早在2014年就打败了人眼,让机器学会了“明察秋毫”。去年,汤晓鸥的实验室入选NVIDIA评出的全球人工智能的十大先锋实验室,成为亚洲区唯一入选的实验室。

 

  汤晓鸥人物素描(插图:郭红松/光明图片)

   厚积薄发的关键布局

  “将人工智能应用到日常生活中是很重要的研究方向,其中的计算机视觉应用尤其会带来直接的影响。”1992年,还在美国麻省理工学院攻读博士学位的汤晓鸥就开始学习人脸识别的算法,毕业后,他在香港中文大学建立实验室继续从事计算机视觉相关领域的研究。汤晓鸥将这一时期的积累称作“深挖洞、广积粮”。

  诞生于1956年的人工智能,其技术应用在很长一段时间内并没有取得突破性进展。21世纪初,在人工智能和计算机视觉应用领域整体前景不明朗的情况下,汤晓鸥团队仍然坚持方向,潜心用了十几年时间来打基础。功夫不负有心人,2011年,深度学习算法和大数据为人工智能带来了“拐点”,人工智能应用领域开始了“加速赛跑”。

  作为最早投入深度学习技术研发的华人团队,在多年布局的关键技术基础之上,汤晓鸥团队迅速取得技术突破。2012年国际计算视觉与模式识别会议(CVPR)上仅有的两篇深度学习文章均出自汤晓鸥实验室,而在2013年国际计算机视觉大会(ICCV)上全球学者共发表的8篇深度学习领域的文章中,有6篇出自汤晓鸥实验室。

   顶住压力的关键赛跑

  然而,在汤晓鸥实验室的研究驶入“高速轨道”时,许多科技巨头企业、“大牌”实验室也正在紧锣密鼓地投入大量人力、财力进行研究,想要抢占计算机视觉应用这一拥有广阔前景的领域。2014年初,就在汤晓鸥团队即将发表GaussianFace人脸识别算法之时,Facebook抢先发布了DeepFace算法,达到接近于人眼识别能力(97.53%)的97.35%,引起了世界轰动。

  “Facebook的算法是基于其拥有的750万人数据库,而我们当时仅有20万人数据库,双方力量差距很大,我们的条件处于劣势。”汤晓鸥告诉记者。2014年3月,其团队发布GaussianFace人脸识别算法,在LFW数据库上准确率达98.52%,在全球首次突破人眼识别能力。

  2014年6月起,汤晓鸥实验室开始发表的DeepID系列算法,逐步将人脸识别准确率提升至99.55%,开启了整个人脸识别行业技术落地的时代,令我国在该领域跃居世界领先地位。

   长期投入的马拉松

  在视觉识别的产品应用领域,汤晓鸥团队仍然“赢得漂亮”,这项技术已经成功实现规模化应用。2016年,中国移动运用其算法为3亿用户做了手机卡认证,加上银行等金融领域和商业机构的应用,累计近4亿人使用了其团队所研发的技术。

  “人工智能与产业的结合将成为下一波产业升级的主要驱动力,加快源头创新是中国抓住新一轮发展机遇的关键。而原创技术研发没有捷径可走,是一场长期投入的马拉松。”汤晓鸥认为,研究人员只有先把“粮食”种出来,才能与产业相结合,真正发挥效力;只有通过技术的源头创新,才能不被别的国家扼住咽喉。

  “作为一名知识分子,一路上享受了国家最优质的教育资源,应该为国家源头创新发展做些有意义的事,在基础研究方面为中国人争一口气,这是中国当代知识分子应有的情怀。”为促进深港两地的研究人员交流互通和协同创新,他牵头组建了香港中文大学和中国科学院深圳先进技术研究院的联合实验室,并积极招募了一批海外优秀科研人才加入团队,继续在源头创新的道路上不断前行。