2017年11月23日晚7点,中国科学院大学科学前沿进展名家系列讲座III第103讲在玉泉路校区阶一五教室如期举行。本次讲座由中国科学院计算所研究员山世光主讲。山世光老师从AI的源起与发展,AI的应用,向同学们介绍了AI在计算机视觉方面的巨大进步和广阔的发展前景。
人工智能的发展经历了三次潮涨潮落。期间由于人们的过高期望不能兑现,人工智能的发展也曾出现过两次寒冬。但在一些科学家的坚持下,多层神经网络复兴,同声传译、自动驾驶、音乐智能、图像分类、人脸识别、文学、艺术以及金融、医疗、教育等其他领域被深度学习大大促进。对此,山老师启发同学们要敢于坚持去做冷门的研究。讲座中,山老师特别提到看图说话,即计算机通过识别图片描述图中的人物和行为,并指出这是计算机视觉的终极目标。
随后,山老师向同学们介绍了计算机视觉的概念和深度学习的源起。深度学习是人们从生物系统得到的启示。在生物体中,神经系统通过神经细胞处理和传递信息,在十亿量级的神经细胞中,每个都与数千个细胞连接。这些细胞通过模式发现器判断是否出现自己感兴趣的模式并依据“加权投票模型”进行工作。而在深度学习中,单神经元通过加权求和与非线性激活函数构建模型与多个单神经元互联形成多层神经网络,而全连接和卷积层的局部连接共同构成了卷积神经网络。
在介绍深度神经网络的学习过程时,山老师指出,深度学习通过BP算法利用有注标的样本来调整权重。深度学习在1980年代初发挥了巨大的威力,山老师形象地将其比喻为一团火,幽默地说:“有了高性能计算机的东风和有注标的大数据作汽油这团火才能烧得这么旺。”
随后,山老师用人脸识别作为例子:在前深度学习时代,通过收集图片,进行专家知识驱动的特征设计和专家选择的分类器对某一物体的识别可能要数十年的时间;在深度学习时代,收集图片,将专家选择深度模型交给机器进行优化,需要几个月才能达到识别目的;而在后深度学习时代,通过几张图片的收集以及机器选择和优化模型,可能只需要几个小时。山老师又将其与人脑进行对比,人脑对某一物体的识别只需要几分钟或者几秒钟!山老师对此进行了解释,“目前的只有专科智能,没有全科智能”,“深度学习只是’归纳法’的胜利”,“目前急需研制可以掌握课本知识的AI系统。”
之后,山老师用一个公式作了总结——“AI=A+B+C+D+E”,A为算法(algorithm),B为课本知识(book),C为算力(computing),D为大数据(data),E为生态体系(ecosystem)。ABC是AI的三大引擎,深度学习是思想。深度学习目前发展迅猛,但也存在着如“数据驱动产生的机器知识与人类知识在表示上的鸿沟”的问题。“目前科学家们进行的AI研究还只是管中窥豹,我们只是一群盲人在摸象。”“AI(爱),希望寄托在年青一代身上!”山老师如是说。
讲座最后,同学们就AI产业人才的争夺以及在AI研究领域选择的问题进行了提问,现场气氛热烈,山老师也对问题一一做了解答,讲座在热烈的掌声中圆满结束。(文/梁阳光 图/杨依涵 来源 国科大记者团)
山世光研究员为同学们做精彩报告
主讲人简介
山世光,中科院计算所研究员、博导,现任中科院智能信息处理重点实验室常务副主任,兼任中科视拓(北京)科技有限公司董事长/CTO,国家基金委优青、中国计算机协会青年科学家、科技部中青年科技创新领军人才。主要研究计算机视觉和机器学习,在人脸识别技术上有超过20年的研发经验,带领团队获得十余次学术竞赛冠亚军,所研发的人脸识别技术成功应用于公安部出入境管理局、十几省公安厅、华为手机等。在国内外刊物和学术会议上发表论文200余篇,其中CCF A类论文60余篇,论文被谷歌学术引用12000余次,曾应邀担任ICCV,ACCV,ICPR,FG,ICASSP等领域主流国际会议的领域主席,现任IEEE,TIP,CVIU,PRL,Neuro-computing,FCS等国际刊物的编委(AE)。研究成果或2005年度国家科技进步二等奖,2015年度国家科学二等奖。
延伸阅读:
“科学前沿进展名家系列讲座”创办于2014年9月,是中国科学院大学为本科生开设的必修课程,同时欢迎研究生与教职工参加,由中国科学院大学本科部主办,讲座召集人为徐涛副校长。该课程按照数学、物理、化学、生物、材料、计算机、天文、电子信息工程等专业,邀请相关科学领域的院士等知名专家开展专题讲座。通过讲述科学故事、介绍相关学科方向的科学前沿进展,让学生在本科阶段了解不同学科的科研方向与主要进展,拓宽学生的学术视野,为他们最终选择学科专业与专业方向提供丰富的判断依据。