/

En

专题论坛

*点击论坛跳转到相应位置


多模态数据感知与学习论坛

一、主题

多模态数据感知与学习

二、目的与意义

多模态感知数据是一种类似于人类感知学习的信息形式,并且易于大量获取。与单模态数据相比,这些数据中的模态之间包含的概念同步提供了用于解开每种模态 的潜在解释因素的监督信息。传统利用多模态数据处理的工作主要集中在保留模态不变因素而忽略其余因素。本论坛的旨在探讨类脑计算来实现像人类一样学习和 思考的人工智能,促进多模态数据感知学习的研究与发展,同时开拓模式识别领域的新问题、新方向和新挑战,为学术界和工业界提供一个国际交流、学习和合作 的平台。此外、论坛获得了IEEE Computer Society Big Data Technical Committee、IAPR Cognitive Robotics Technical Committee等组织的技术支 持。

三、论坛日程

论坛时间:2020年10月16日13:30-15:30
会场:金陵厅
时间 报告题目 报告人 主持人
13:30-14:00 平行视觉:从人工图像到计算智能 王飞跃 研究员 王栋 副教授
14:00-14:30 语言驱动的行人搜索 王亮 研究员
14:30-15:00 跨媒体智能分析与计算 杨阳 教授
15:00-15:30 对抗学习及知识迁移在跨媒体检索中的应用 徐行 副教授

四、拟讲授内容及邀请讲者简介

报告一:平行视觉:从人工图像到计算智能
  • 嘉宾简介:王飞跃,1961年生,智能系统专家,中国科学院自动化研究所研究员、 博士生导师,复杂系统管理与控制国家重点实验室主任。1982年王飞跃获得山东化工学院学士学位;1984年获得浙江大学硕士学位;1990年获得美国 伦塞利尔理工学院博士学位,博士毕业后在美国亚利桑那大学先后任助教授、副教授;1998年初作为国家计划委员会“引入海外杰出人才”;1999年在 中国科学院自动化研究所创办智能控制与系统工程中心,并担任首任主任;2001年获得国家杰出青年研究基金资助;2005年担任西安交通大学软件学 院院长;2006年担任中国科学院自动化研究所副所长;2007年当选为国际自动控制联合会会士;2011年创办复杂系统管理与控制国家重点实验室,并 担任首任主任;2013年推动共建青岛智能产业技术研究院,为首任院长;2014年获得诺伯特·维纳奖;2017年担任徐工集团独立董事等。王老师主要研 究领域为智能系统和复杂系统的建模、分析和控制与管理,是智能控制方面的国际知名学者,也是智能机器人、无人驾驶、智能交通等领域的早期开拓 者之一。


报告二:语言驱动的行人搜索
报告摘要:传统的行人搜索大多是单模态的,即给定一张包含行人的查询图像去检索同一个行人的其他图像。而自然语言驱动的行人搜 索则是给定一段描述行人的自然语言,然后查询描述相同行人的图像。目前应用场景主要为智能监控,未来可潜在应用到人机交互、跨模态检索等更一般的 场景。本报告将简要回顾自然语言驱动的行人搜索任务的定义和主要挑战,并举例介绍我们课题组在该方向上的最新研究工作,特别是如何在跨模态语义不一 致的基础上处理细粒度匹配和跨域学习等问题,并简要讨论未来可能的发展方向。
  • 嘉宾简介:王亮,1975年生,博士,中国科学院自动化研究所研究员。现任中国科学院自动 化研究所模式识别国家重点实验室副主任。1997、2000年于安徽大学电子工程与信息科学系获得学士、硕士学位,2004年于中国科学院自动化研究所 获得模式识别与智能系统专业博士学位。2004-2005年英国帝国理工学院计算机系RA,2005-2007年澳大利亚莫纳什大学电子与计算机系统工程系RA, 2007-2009年澳大利亚墨尔本大学计算机科学与软件工程系RF,2009-2010年英国巴斯大学讲师。2010年回国任中科院自动化所研究员、博士生导师。 获得奖项及荣誉称号包括:国际模式识别学会会士(IAPR Fellow 2014)、SCOPUS青年科学之星银奖(2011)、全国百篇优秀博士论文提名(2006) 、中科院优博(2005)、北京市科学技术一等奖(2004)、中科院院长奖学金特别奖(2003)等。目前承担和参与的科研项目包括基金委面上项目、 973计划等。


报告三:跨媒体智能分析与计算
报告摘要:多媒体将文本、图像、语音、视频等数据形式紧密混合一体,已经成为大数据的普遍表达方式。而跨媒体理解通过对语言、 视觉、和听觉的语义贯通,是实现智能行为的基础,在机器人、无人机、安防、交通、教育、互联网等领域有重大应用价值。在这里,我们将对跨媒体理解的 最新科研成果,展开一系列讨论,包括跨媒体的关联性挖掘、标注、搜索等。
  • 嘉宾简介:杨阳,1984年生,电子科技大学百人计划、国家青年千人计划获得者。研究方向涵 盖多媒体、机器学习、人工智能、大数据、计算机视觉、社交媒体等。近五年发表学术论文百余篇,包括ACM Multimedia、IJCAI、SIGMOD、CVPR、SI GIR、TKDE、TIP等在内的国际计算机领域顶级会议和期刊(CCF A类)。多次任职国际SCI期刊(客座)编委,多次担任国际会议的程序委员会成员,以 及多个国际顶级期刊的受邀审稿人。获得ACM Multimedia 2013(多媒体顶级会议、CCF A)最佳论文奖候选论文及最佳学生论文奖、ICME 2017最佳论 文铂金奖、WISE 2013最佳论文奖、SIGIR 2017最佳论文Honorable Mention、MMM 2015 Best Paper Runner-up等学术奖项。


报告四:对抗学习及知识迁移在跨媒体检索中的应用
报告摘要:随着不同类型的多媒体数据(如文本、图片、视频、音频、传感器数据等)的增加,如何实现不同模态间的数据检索已经成 为多媒体检索领域的研究热点,这一问题通常被称为“跨模态检索”。消除不同模态数据间的“语义鸿沟”和“异构鸿沟”是跨模态检索的核心挑战。近年来,生 成对抗网络(GAN)展现了其对数据潜在分布进行建模的强大能力。受此启发,利用跨模态生成对抗网络(Cross-Modal GAN)对不同模态数据联合分布进 行建模也成为多模态学习领域的研究热点。在本次报告中,本人将详细介绍跨模态生成对抗网络在跨模态检索任务中的具体应用。此外,本人还将介绍一些 利用知识迁移技术探究“零样本跨模态检索”这一新兴研究课题的方法。
  • 嘉宾简介:徐行,1988年生,本科、硕士毕业于华中科技大学,博士毕业于日本九州大 学。2016年加入电子科技大学计算机科学与工程学院,现任副教授。研究方向包括多媒体信息处理、计算机视觉和机器学习。近五年已在多媒体、计算 机视觉及人工智能相关领域的国内外学术期刊和会议累计发表论文70余篇,其中中国计算机学会(CCF)推荐A类会议论文以及中科院JCR二区以上期刊 论文30余篇(含ESI高被引论文3篇,ESI热点论文1篇)。获得包含2017年国际多媒体大会ACM MM (CCF-A)最佳论文奖,2017年国际多媒体展览会ICM E(CCF-B)的最佳会议论文铂金奖等国际会议奖项4项。获得2019年度IEEE计算机协会大数据技术委员会颁发的“杰出青年研究员”荣誉。主持国家自然 科学基金2项,省科技厅重大专项1项,并参与多项国家及省部级科研项目。



五、组织者

  • 陆慧敏,九州工业大学机械智能工学研究系副教授、IoT智能系统重点研发中心兼职副教授, ERiC环境智能实验室负责人。2014获得九州工业大学电气电子工程专业博士学位。2013年至2016年任日本学术振兴会(JSPS)特别研究员。2016年入选 第一批日本文部科学省青年千人计划“卓越研究员事业”。已主持国家和省部级科研项目20余项,承担日本制铁、安川电机、日本电装等企业合作项目4项 。已在CCF/CAA A/B类期刊或会议20余篇,SCI他引1500余次,ESI高被引或热点论文10余篇。担任SCI期刊Computers & Electrical Engineering主 编(2021-)、Applied Soft Computing、Wireless Networks、IEEE Internet of Things Journal、IEEE/CAA Journal of Automatica Sini ca、IEEE Trans on Network Science and Engineering, Pattern Recognition、ACM Trans on Internet Technology等期刊编委或首席客座 编委,IEEE高级会员。研究方向包括机器视觉、机器人、智能物联网和海洋观测。

  • 王栋,大连理工大学,信息与通信工程学院,副教授。研究方向为计算机视觉和模式识别, 主要从事目标跟踪与识别方面研究。2013年于大连理工大学获得博士学位,同年留校任教。2015年至2016年,美国天普大学(Temple University) 访问学者。2016年12月受聘副教授。迄今在本领域顶级会议(CVPR、ICCV、ECCV)及期刊(IEEE TPAMI、IEEE TIP、IEEE TCSVT等)发表论文30 余篇,ESI高引用论文4篇,Google Scholar引用3500余次。主持国家自然科学基金3项,博士后特别资助1项,CCF-腾讯犀牛鸟基金1项及阿里巴巴全 球创新研究计划1项。获CCF自然科学二等奖(排名第1),教育部自然科学二等奖(排名第2),辽宁省优秀博士论文提名奖,CCF青年人才托举计划, ACM大连分会新星奖,大连理工大学星海优青等多项团队及个人荣誉。担任IEICE Transactions on Information and Systems等多个SCI期刊编 委及客座编委。

  • 王兴刚,华中科技大学,电子信息与通信学院,副教授。主要研究方向为样本和计算高效的 物体识别技术。发表论文80余篇,其中包括(顶级期刊和会议IEEE TPAMI,IEEE TNNLS, IEEE TIP, CVPR, ICCV, ECCV, NIPS, ICML, AAAI) 40余篇。谷歌学术引用次数超过4000次。担任Image and Vision Computing (IMAVIS)期刊副编辑,IEEE TPAMI, JMLR, IEEE TIP, PR, ICCV, CVPR, ECCV, NeurIPS, ICML, AAAI等期刊会议审稿人。担任中国图象图形学学会图象视频通信专业委员会秘书长,VALSE第二届资深AC委员会成员。 获“微软学者”奖(全亚洲10名获奖者)、湖北省自然科学二等奖、Pattern Recognition等杂志优秀审稿人奖、CCF-腾讯犀牛鸟基金优秀奖等、ECCV '18&ICCV'19大规模视频物体分割竞赛第二名,入选中国科协“青年托举人才工程”。更多信息请参考个人主页:https://xinggangw.info

  • 高广谓,南京邮电大学先进技术研究院副研究员,硕士生导师。2014年获得南京理工大学国 家重点学科模式识别与智能系统专业博士学位。分别于2011年3月至2011年9月、2013年2月至2013年8在香港理工大学从事研究工作。江苏省自然科学 基金优秀青年基金获得者,江苏省“六大人才高峰”高层次人才。主持多项国家和省级科研项目。近年来,以第一作者身份在国内外学术期刊及重要学术 会议上发表论文数篇,包括IEEE Trans. Image Processing, Pattern Recognition, Neurocomputing等。担任IEEE Trans. Information Fo rensics & Security、IEEE Trans. Image Processing、IEEE Trans. Multimedia、IEEE Trans. Cybernetics、 Pattern Recognition等 十几个国际SCI期刊审稿人,以及ISAIR2020、ICONIP2017、 ACPR2017等一系列国际知名学术会议和论坛的技术委员会成员。中国计算机学会计算机 视觉专委会委员,中国人工智能学会模式识别专委会委员,江苏省人工智能学会模式识别专委会委员。主要研究方向为计算机视觉和模式识别。

  • 李玉洁,扬州大学信息工程学院讲师。2015获得九州工业大学电气电子工程专业博士学位。 2018年至2020年任日本学术振兴会(JSPS)特别研究员。已主持国家和省部级科研项目4余项,已发表SCI期刊50余篇,CCF/CAA A/B类期刊或会议10 余篇,SCI他引1000余次。担任Computers & Electrical Engineering、Mobile Networks and Applications、Wireless Networks等期刊首 席客座编委。研究方向包括机器视觉、人工智能和海洋观测。








三维视觉论坛

一、主题

三维视觉

二、目的与意义

三维重建、SLAM、视觉定位、场景理解、3D目标检测与跟踪等三维视觉问题是计算视觉研究中的热点与难点,也是VR/AR、机器人、无人驾驶等领域的核心技术。 近年来深度学习的兴起为三维视觉问题的解决带来了新的思路与工具,但在这些问题中的应用还远未成功。此外,三维视觉与图形学的深度融合也是值得探讨的问题。 本论坛旨在汇集三维视觉及图形学领域的专家学者,共同探讨三维视觉的研究现状和发展趋势。

三、论坛日程

论坛时间:2020年10月16日15:45-17:45
会场:金陵厅
时间 报告题目 报告人 主持人
15:45-16:15 视觉SLAM: 在线学习的途径 査红彬 教授 章国锋
16:15-16:45 三维视觉智能及应用 陈宝权 教授
16:45-17:15 Pose and Symmetry from Single View 徐凯 教授 周晓巍
17:15-17:45 三维视觉:从双目感知到点云理解 郭裕兰 副教授

四、邀请讲者简介

  • 查红彬,北京大学信息科学技术学院智能科学系教授,机器感知与智能教育部重 点实验室主任。主要从事计算机视觉与智能人机交互的研究,在三维视觉几何计算、三维重建与环境几何建模、三维物体识别等方面取得了一系列成果 。出版学术期刊及国际会议论文300多篇,其中包括IEEE T- PAMI,IJCV, IEEE T-VCG, IEEE T-RA, IEEE T-SMC,ACM T-IST, JMLR, PR 等国际 期刊以及ICCV, ECCV, CVPR, CHI, ICML, AAAI,ICRA等国际学术会议论文100余篇。




  • 陈宝权,北京大学博雅特聘教授,前沿计算研究中心执行主任,长江学者,杰青,IEEE/CCF Fellow。 研究领域为计算机图形学与数据可视化。曾任IEEE Vis 2005、ACM SIGGRAPH Asia 2014大会主席。获2003年美国NSF CAREER Award和2014年中国计算机 图形学杰出奖。兼山东大学特聘教授,北京电影学院高精尖创新中心首席科学家,中国图像图形学会三维视觉专委会主任。 个人网页:http://cfcs.pku.edu.cn/baoquan





  • 徐凯,国防科技大学教授。国防科技大学博士,西蒙弗雷泽大学、普林斯顿大学访问学者。 研究方向为数据驱动的几何处理与建模、三维视觉及机器人应用等。发表SIGGRAPH论文20余篇,CCF A类论文共40篇。担任ACM Transactions on Graphics、Computer Graphics Forum、Computers and Graphics和The Visual Computer等期刊的编委。担任CAD/Graphics 2017、ISVC 2018等国际会议的论文共同主席,以及SIGGRAPH、Eurographics等国际会议的程序委员。担任中国图象图形学会三维视觉专委会副主任,中国工业 与应用数学学会几何设计与计算专委会秘书长。曾获湖南省自然科学一等奖、军队科技进步二等奖、几何设计与计算青年学者奖、军队优秀博士论文 奖、湖湘青年英才奖。获国家优秀青年基金和湖南省杰出青年基金资助。

  • 郭裕兰,国防科技大学电子科学学院副研究员。2015年获工学博士学位,2016年至2018年获 “博新计划”支持于中科院计算所从事博士后课题研究。主要研究方向三维点云特征学习、三维目标检测识别与三维场景重建。目前已在IEEE TPAMI、 IJCV和CVPR等国际期刊和会议上发表学术论文90余篇,其中ESI热点论文1篇(前1‰),高被引论文5篇,论文被引用2800余次。合著英文专著1部, 著作章节1章,教辅书2部。目前担任中国图象图形学学会三维视觉专委会秘书长,IET Computer Vision和IET Image Processing期刊副编辑 (AE),CVPR 2021和ICPR 2020国际会议领域主席(AC),曾担任IEEE TPAMI期刊客座编辑。曾获得中国人工智能学会优秀博士学位论文奖 (2016年)及吴文俊人工智能优秀青年奖(2019年)。指导研究生获得2016年第十一届中国研究生电子设计竞赛第一名(特等奖)。



五、组织者

  • 章国锋,浙江大学CAD&CG国家重点实验室教授,博士生导师,国家优秀青年科学基金获得者, 入选浙江省151人才工程第二层次。主要从事三维视觉与增强现实方面的研究,尤其在同时定位与地图构建和三维重建方面取得了一系列重要成果, 研制了一系列相关软件,如ACTS、LS-ACTS、RDSLAM、RKSLAM等(http://www.zjucvg.net),并开源了基于非连续特征跟踪的大尺度运动恢复结 构系统ENFT-SfM、分段集束调整SegmentBA和高效的增量式集束调整EIBA、ICE-BA等算法的源代码(https://github.com/zju3dv/)。 获全国百篇优秀博士学位论文奖、计算机学会优秀博士学位论文奖以及教育部高等学校科学研究优秀成果奖科学技术进步奖一等奖(排名第4)。 目前为《虚拟现实与智能硬件》编委,中国图象图形学学会三维视觉专委会副主任和视觉大数据专委会委员,中国计算机学会计算机视觉专委会 委员,浙江省人工智能学会增强现实分会副主任;担任VALSE 2019大会程序委员会主席,CVPR 2021领域主席,ISMAR 2019、2020程序委员会 委员。

  • 周晓巍,浙江大学CAD&CG国家重点实验室“百人计划”研究员、博士生导师。2008年本科 毕业于浙江大学,2013年博士毕业于香港科技大学。2014年至2017年在美国宾夕法尼亚大学GRASP实验室从事博士后研究。研究方向主要为计算 机视觉及其在增强现实、机器人等领域的应用,在3D目标检测、姿态估计、运动捕捉、图像匹配等方面取得了一系列成果,相关工作曾多次获得 CVPR及ICCV等顶级会议口头报告,并获得CVPR’18 3DHUMANS Workshop Best Poster Award、CVPR’19 Best Paper Finalists。组织了 Geometry Meets Deep Learning Workshops(ECCV’16/ICCV’17/ECCV’18/ICCV’19)及Map Synchronization Tutorial(CVPR’19) 等研讨会和课程,担任CVPR’21和ACCV’21领域主席以及AAAI’20高级程序委员。




女科学家论坛

一、论坛日程

论坛时间:2020年10月16日13:30-17:45
会场:多功能北厅
时间 报告题目 报告人 主持人
13:30-14:10 从像素到语义-计算机视觉中知识迁移的探索与实践 张艳宁 教授 毋立芳
14:10-14:50 推进机器视觉中的IQ与EQ 姚鸿勋 教授
14:50-15:30 视觉认知与驾驶行为预测 马惠敏 教授
15:30-15:45 茶歇
15:45-16:15 从智能影像计算看计算之美 刘家瑛 副教授 董晶
16:15-16:45 面向物体识别的无监督领域自适应 阚美娜 副研究员
16:45-17:15 “众里寻他千百度”:基于视觉的人体检测与搜寻 张姗姗 教授
17:15-17:45 真实感材质建模和渲染方法 王贝贝 副教授

二、讲者简介及报告摘要

特邀报告一:从像素到语义-计算机视觉中知识迁移的探索与实践
报告摘要:大数据驱动下的计算机视觉技术在众多视觉领域中已成为主流,但在数据稀缺、跨任务域等应用场景下, 仍然面临着性能瓶颈。本次报告将介绍我们在计算机视觉领域中对知识迁移的探索与实践,主要通过先验知识迁移、跨数据域知识迁移、 跨媒体知识迁移、跨任务知识迁移及跨模型知识迁移等技术理念,挖掘知识与数据、任务的内在关联,将视觉计算模型由传统的“数据” 驱动转变为“数据+知识”驱动,进而使模型更为“智能”。我们在图像清晰化、图像分类、目标检测识别、视觉与语言交互、模型自主进化 等问题上进行了实践,结果充分验证了“数据+知识”驱动的合理性及必要性。
  • 嘉宾简介:张艳宁,西北工业大学教授,校长助理兼研究生院院长,长江 学者特聘教授,国防973项目首席、中组部首批“万人计划”科技创新领军人才,“空天地海一体化大数据应用技术”国家工程实验室主 任。长期致力于图像处理、模式识别、计算机视觉与智能信息处理等的研究,并与航天、航空等方面的国家重大需求相结合。获国家 教学成果二等奖1项、省部级科技进步奖3项,曾获全国三八红旗手称号和总装863科技攻关先进个人。先后承担国防973项目、国家 自然科学基金重点项目、国家/国防863、总装预研等国家级项目40余项。在IEEE TPAMI、IEEE TIP、PR、IEEE TSMC-B、Info. Fusion、CVPR、ICCV等国内外本领域权威期刊和重要国际会议上发表论文百余篇。研究成果被多个国家级重大工程攻关项目采用, 成功应用于航天、航空、能源、水利等行业的20余家单位。 获国家/国防授权发明专利50余项,陕西省科技进步一等奖一项,国防技 术发明一等奖一项,出版专著3部。

特邀报告二:推进机器视觉中的IQ与EQ
报告摘要:在计算机视觉及人机交互、智能感知领域中,目前深度算法已经能做很多事情,甚至在一些应用领域已 出超越人类极限的的性能,但这并不意味着机器的认知能力已经足够的深入和强劲。事实上,恰恰相反,需要走的路还很长,我们都在为 推进智能认知和情感理解而努力。在我们的工作一些列工作中,在对周围环境的认知准确性、视野目标的精准感知、目标语义的对应性、 目标语义理解和情感认知的本质描述方法及精度上,做了一些深入的推进,通过展现相关研究进展和成果,希望得到同行的评判和讨论。
  • 嘉宾简介:姚鸿勋,哈尔滨工业大学长聘教授,博士生导师,黑龙江省政 府特殊津贴专家,教育部"新世纪优秀人才",AI全球2000位最具影响力学者,哈工大人工智能专业负责人,省人工智能与物联系统创 新研发“头雁团队”核心成员。主要研究领域为计算机视觉智能、多媒体数据分析与理解、视频监控、模式识别。任中国图象图形学学 会理常务理事,中国图象图形学学会宣传与出版委员会副主任,中国计算机学会多媒体专委会委员,黑龙江省人工智能学会常务理事, ACM SIGMM BEIJING Chapter 核心委员;任国际互联网多媒体计算与服务会议ACM ICIMCS2010大会主席,国际情感计算会议ACII 2005大会协同主席。发表ICCV, CVPR, ACM MM等顶级国际会议及IJCV, TPAMI, TIP, TMM等高影响因子国际期刊文章学术论文200 余篇,H指数>40。获国家发明专利15项, 出版教材6部。主持完成国家自然基金重点项目2项,承担1项,主持完成国家自然基金面上 项目7项,完成国家863、973项目以及国际横向合作项目多项,获国家科学技术进步二等奖1项,黑龙江省自然科学二等奖2项,国防 科学技术奖三等奖1项,黑龙江省教学成果奖一、二、三等奖4项。

特邀报告三:视觉认知与驾驶行为预测
报告摘要:驾驶员驾驶行为预测是人机共驾中的关键技术之一,高级辅助驾驶系统(Advanced Driver Assistance Systems,ADAS)中的一些与驾驶行为相关的应用可以显著提高驾驶的安全性。本报告从认知驱动的角度和数据驱动的角度出发,将视觉 认知和驾驶场景目标检测结合,提出了以Thinking in 3D为核心的MV3D目标检测深度学习算法;将视觉认知和驾驶员行为预测结合, 依据驾驶员的感知-反应时间以及驾驶环境和驾驶员之间的交互关系,提出了以视觉惯性为核心的CF-RNN模型和Predictive-Bi-LSTM-CRF 驾驶行为预测算法。认知科学与计算机视觉的结合,为提高机器智能的水平提供了一条新的途径。
  • 嘉宾简介:马惠敏,教授,博士生导师,2001年博士毕业后在清华大学电子 工程系承担教学科研工作,担任三维图像认知与仿真实验室负责人,2019年担任北京科技大学计算机与通信工程学院物联网与电子工程 系主任、人工智能研究院副院长,现任中国图象图形学学会副理事长兼秘书长,北京市“三八红旗奖章”获得者。从事三维图像认知与多 模态学习交叉学科研究,将图像理解与认知心理学结合,取得了三维图像认知理论的原创性成果。首次在国际上建立了图像认知心理测 评智能系统,2016年获得吴文俊人工智能科技创新一等奖,教育部鉴定为“原始性创新,达到国际领先水平”;提出的基于GPU的高效能 复杂环境仿真方法及应用,2017年获得教育部技术发明奖二等奖;提出的复杂环境中三维目标检测方法,2015-2017年连续在国际最大 的自动驾驶数据集(KITTI)评测中获得第一名,2018-2019年在驾驶员状态预测国际数据集(Brain4Cars)上获得最好的成绩。作为 通讯作者在TPAMI、TIP、TITS、PR、CVPR、NIPS、ICCV、ICIP等发表论文100余篇.作为负责人承担了国家重点研发计划子课题、国家 自然科学基金、专项重点基金、国际国内企业合作等30余项科研项目,获批及申请专利十余项,两项专利完成了科研成果转化。

青年学者报告一:从智能影像计算看计算之美
报告摘要:本次报告以图像风格化与生成技术在智能影像编辑与生成建模方面为主线,分享我们研究小组围绕文字风格化 艺术生成方面的一些探索,系统性地介绍基于统计特征的文字风格化(CVPR 2017),基于非监督的文字风格化与图文自动生成(ACM MM 2018), 基于生成对抗网络的文字风格化与去风格化技术(AAAI 2019)以及形状可变的风格化文字生成技术(ICCV 2019)等一系列相关研究工作。
  • 嘉宾简介:刘家瑛,博士,北京大学 副教授。2010年毕业于北京大学计算机 应用技术专业,获理学博士并留校任教。研究领域包括图像/视频压缩、增强与理解。累计发表IEEE/ACM汇刊与CCF A类会议论文50余篇 ,获得授权国家发明专利43项。担任APSIPA杰出讲者,IEEE/CCF/CSIG高级会员,IEEE MSA/VSPC技术委员会委员,CSIG多媒体专委会 秘书长等。担任IEEE Trans. on Image Processing,Elsevier JVCI期刊编委,ACM ICMR-2021/IEEE ICME-2021会议程序主席, CVPR/ICCV/ECCV会议领域主席等,获教育部科技进步二等奖、CSIG石青云青年女科学家奖、北京大学教学卓越奖(最年轻获奖者), IEEE ICME-2020最佳论文奖等。主讲的全球MOOC课程获教育部首批“国家精品在线开放课程”。



青年学者报告二:面向物体识别的无监督领域自适应
报告摘要:在实际应用中,场景的变化会引起图像分布的差异,由此使得已有的物体识别模型出现显著性能下降,无监督 领域自适应方法旨在利用有标注的源域数据以及无标注的目标域数据构建针对目标域的物体识别模型,实现对目标场景的无监督自适应。该报 告将从领域分布对齐、领域分布-个体分布同步对齐、个体自适应三个方面介绍报告人在无监督领域自适应方面的研究工作及其在物体识别中 的应用。
  • 嘉宾简介:阚美娜,中科院计算所 副研究员。研究领域为计算机视觉与模式 识别,主要关注人脸识别、多视学习、迁移学习、弱少监督学习等问题,相关成果已发表在TPAMI、IJCV、CVPR、ICCV等相关领域主流 国际期刊与会议上面,谷歌学术引用2300余次。担任TPAMI、IJCV、TIP、TMM、CVPR、ICCV、ECCV等期刊会议的审稿人。2014年获得 CCF优秀博士学位论文奖、2016年入选CCF青年人才托举计划、2018年获得中国图象图形学学会石青云女科学家奖青年奖、2019年入选 北京市科技新星计划。此外,获得2015年IEEE FG视频人脸识别竞赛冠军、2015年IEEE ICCV年龄估计竞赛亚军、2017年IEEE CVPR人 脸面部关键点定位亚军等。



青年学者报告三:“众里寻他千百度”:基于视觉的人体检测与搜寻
报告摘要:基于视觉的人体检测与搜寻,目的在于获取视频中人体的位置和身份信息,其在自动驾驶、视频监控、智能机器 人等诸多领域中,都具有广泛的应用价值。随着深度学习的发展,人体检测与搜寻的精度得到很大提升,然而,在复杂多变的现实场景下我们依 然面临诸多挑战。该报告将介绍最新的人体检测方法,特别是在应对遮挡、恶劣天气等方面的研究成果;以及通过多任务联合学习实现快速精准人体搜寻的方法。
  • 嘉宾简介:张姗姗,南京理工大学计算机学院教授,博士生导师,江苏省“社会安 全图像与视频理解”重点实验室副主任。研究方向为计算机视觉,特别关注视频中人体检测和分析。曾于2015年在德国波恩大学获得计算机博 士学位,博士论文获大德语区(德瑞奥三国)计算机学会最佳博士论文提名;博士毕业后在德国马普计算机研究所从事为期两年的博士后研究 。2018年入选中国科协“青年人才托举工程”、江苏省“双创博士”、微软“铸星学者”计划等。目前以第一/通讯作者身份在CVPR、ECCV、 T-PAMI、T-IP等顶级国际期刊和会议上发表论文三十余篇,谷歌学术引用1800余次;在微软学术统计的全球学者近五年排位中,位列行 人检测领域第一位。目前担任模式识别权威期刊Pattern Recognition编委、中国人工智能学会模式识别专委会副秘书长、VALSE资深领域主席。


青年学者报告四:真实感材质建模和渲染方法
报告摘要:真实感渲染在影视动漫等数字创意产业作品的制作中发挥着越来越重要的作用,成为电影、动漫界关注的核心技术。 材质模型的真实感是影响画面真实感的重要因素,但是一些复杂的材质(比如说划痕、牛奶等)的高精度建模和渲染,存在依赖于高分辨率法向纹理 ,或者渲染效率低等问题。在本报告中将从微结构材质模型、特殊路径的光线传递、参与介质的高效渲染等方面介绍真实感材质建模和高效渲染方 法。
  • 嘉宾简介:王贝贝,女,南京理工大学,副教授,硕士生导师,中国计算机学会CAD&CG 专委会委员。主要研究方向是计算机图形学绘制方向,包括了全局光照算法、参与性介质光线传递和复杂材质模型等。王贝贝分别于2009年、2014 年在山东大学获得学士、博士学位,期间在巴黎高科进行两年联合培养。2015年在英国游戏公司Studio Gobo参与Disney游戏Infinity 3的研发。 2015年底到2017年初,在Inria(法国信息与自动化研究所)从事博士后研究。之后加入到南京理工大学。共发表高水平论文30于篇,其中以第一 作者在ACM TOG, IEEE TVCG, CGF上发表论文十余篇。







物体检测与分割论坛

一、主题

物体检测与分割

二、目的与意义

物体检测与分割的目的是从图像与视频中得到区域或者像素级的定位信息。物体检测与分割是计算机视觉的基本学术问题。基于物体检测与分割得到的信息,可以 进行进一步的后续理解,如识别、检索。本论坛的旨在探讨物体检测与分割的新方法,同时开拓计算机视觉和模式识别领域的新问题、新方向和新挑战,为学术界 和工业界提供一个国际交流、学习和合作的平台。

三、论坛日程

论坛时间:2020年10月17日15:20-17:20
会场:多功能中厅
时间 报告题目 报告人 主持人
15:20-15:50 特邀报告:驾驶情境理解与预测方法初探 薛建儒 教授 魏秀参
15:50-16:20 报告一:自适应视觉感知技术 程明明 教授
16:20-16:50 报告二:Object Detection and Segmentation: Our Attempts to deal with scale variance and data annotations 张兆翔 研究员
16:50-17:20 报告三:基于LiDAR 3D点云的目标检测 李鸿升 教授

四、拟讲授内容及邀请讲者简介

特邀报告:驾驶情境理解与预测方法初探
报告摘要:智能驾驶领域存在大量极具挑战性的视觉计算问题,如何利用视觉实现驾驶情境理解并能成功预测便是其中之一。驾驶情境理 解与预测对提高自主驾驶的的智能性和安全性至关重要,本报告旨在探讨如何将人的作用或者人的认知模型引入到驾驶情境理解与预测中,从而实现混合增强 智能驾驶。主要包括3D模型重建、动作识别、运动意图预测等核心问题及课题组所取得的部分研究进展。
  • 嘉宾简介:薛建儒,博士,教授。2003年在西安交通大学获工学博士学位,现在西安交通大 学人工智能与机器人研究所从事教学科研工作。主要研究领域为计算机视觉与模式识别、无人车环境理解及自主运动。担任中国自动化学会理事及混合 智能专业委员会主任,中国图形图像学会理事及视觉大数据专业委员会副主任。入选国家万人计划科技创新领军人才、教育部长江学者奖励计划,获国 家自然科学二等奖与技术发明二等奖、IEEE ITS学会杰出研究团队奖、ACCV2012最佳应用论文奖等奖项。合著有英文学术专著《Statistical Learn ing and Pattern Analysis Approaches to Image and Video Processing》(Springer出版,2009年)。2018年当选为中国自动化学会会士。




报告一:自适应视觉感知技术
报告摘要:从图像中快速鲁棒的获取目标信息是计算机视觉的核心任务。提取强大的图像特征并对输入特征进行高效的整合,对所有 常见计算机视觉应用都具有重要意义。本报告从特征提取和模型学习两个方面入手。首先,从多尺度特征获取的角度,介绍近年来几个重要的神经网络基础 模型的演化过程。通过介绍这些经典模型的优势与不足,引出一种轻量级计算量的新型神经网络基础模型。进而通过大量实验,验证该模型的有效性。其次 ,本报告将模型集成方法与深度学习相结合,介绍一种新的基于负相关学习的深度集成学习策略,新方法通过学习多组负相关子模型的基础上,提升集成模 型的预测能力,同时不增加总体模型的计算复杂度。然后,本报告还将介绍一种用于提升语义分割性能的自适应池化策略。最后,本报告将介绍这些核心能 力提升在一系列计算机视觉任务中的应用,包括:图像分类、物体检测、激活图预测、显著性检测、语义分割、实例分割、关键点估计、人群计数、年龄估 计、性格分析、以及图像超分辨率。
  • 嘉宾简介:程明明,南开大学教授,计算机系主任,国家“万人计划”青拔。他的主要研究方 向是计算机视觉和计算机图形学,在图像场景理解方面取得了多项具有国际影响力的创新性成果,有效地解决了视觉显著性物体检测、候选物体快速生 成、以及智能分析与交互技术中的一些关键问题。在相关领域顶级(CCF A类)国际期刊和会议上发表学术论文50余篇。相关研究成果受到了国内外同 行的广泛关注与认可,论文Google Scholar引用13000余次,一作论文单篇最高引用3000余次,入选Elsevier 2016-2018中国高被引学者榜单。其显 著性物体分割技术被应用于华为公司旗舰手机,为华为产品的智能拍照效果提供了支持,并在华为Mate 10发布会上展示。多项技术被普林斯顿大学、 布朗大学等国际著名大学的图形学和视觉课程列为课程内容。研究成果被英国《BBC》、德国《明镜周刊》、美国《赫芬顿邮报》等国际媒体撰文报道。


报告二:Object Detection and Segmentation: Our Attempts to deal with scale variance and data annotations
报告摘要:物体检测与分割是计算机视觉领域的重要问题,但是也存在相应挑战,就研究对象而言,场景中的物体在尺度上具有较大差 异,对物体检测与分割带来较大挑战;就数据标注而言,一方面目前的物体检测与分割以来规模大、标注精细的数据库,另一方面目前标注的数据库往往在 不同类别上也具有显著的长尾效应。本报告将针对上述的若干问题,介绍我们课题组近年来在物体检测与分割领域的相关进展,特别是针对多尺度问题、数 据标注长尾问题和弱监督问题,给出一系列相应解决方案。
  • 嘉宾简介:张兆翔,博士,中国科学院自动化研究所模式识别国家重点实验室与智能感知与 计算研究中心研究员、博士生导师,中国科学院大学岗位教授,中国科学院脑科学与智能技术卓越创新中心年轻骨干。IEEE高级会员,VALSE常务AC, 中国计算机学会CCF杰出会员、中国人工智能学会CAAI杰出会员、中国人工智能学会CAAI副秘书长、中国人工智能学会CAAI模式识别专委会秘书长、 中国图象图形学学会会员发展与服务委员会副主任、中国科学院学部科学规范与伦理研究支撑中心顾问委员会成员。担任IEEE T-CSVT、Patten Recognition、NeuroComputing 编委(Associate Editor),CVPR、ICCV、AAAI、IJCAI、ACM MM、ICPR、ACCV等国际会议的领域主席(Area Chair)或高级程序委员会主席(Senior PC)。入选“国家万人计划青年拔尖人才”和“教育部新世纪优秀人才支持计划”,曾获得中国人工智能学会 吴文俊技术发明奖二等奖。


报告三:基于LiDAR 3D点云的目标检测
报告摘要:3D目标检测算法在自动驾驶和机器人领域有着广阔的应用前景,近年受到来自工业界和学术界的持续关注。LiDAR传感器测 量得到的3D点云,具有测量距离远,对不同光照、天气条件测量稳定等特性。基于LiDAR点云的3D目标检测在自动驾驶车辆上被广泛应用,也因此吸引了大 量研究者专注于该方向算法的研究。本报告将介绍香港中文大学多媒体实验室基于LiDAR点云3D物体检测方向设计的多种算法,讲解实验室开源的3D物体检 测库,并对该方向未来发展方向的提出一系列见解。
  • 嘉宾简介:李鸿升现任香港中文大学电子工程系助理教授。在2013-2015年期间任电子科技 大学大学副教授,2015-2018年任香港中文大学研究助理教授。研究方向为面向计算机视觉的深度学习方法,高层次视觉与文本理解,以及图像建模。 他在机器学习及计算机视觉领域的顶级国际会议与期刊(如ICCV、CVPR、ECCV、NIPS、T-PAMI等)发表超过40篇学术论文。在2015-2016年,他带 领香港中文大学多媒体实验室团队参加ImageNet国际比赛获得视频物体检测项目冠军。获得2013年国家自然科学基金青年基金项目,以及2014年成都 市高层次创新创业人才计划(长期项目创业类)资助。同时李鸿升被多家刊物和国际会议邀请为审稿人,包括IEEE Trans. Pattern Analysis and Machine Intelligence,IEEE Trans. Medical Imaging, IEEE Trans. Image Processing,IEEE Trans. Circuit System and Video Technology等。


五、组织者

  • 欧阳万里于香港中文大学电子工程系获得博士学位。悉尼大学高级讲师。 ICCV最佳审稿人, IJCV客座编辑(Guest Editor),IEEE高级会员,ICCV2019展示主席。担任TPAMI, IJCV, TOG, TIP, CVPR, ICCV, SIGGRAPH等期刊/会议的审稿 人。研究方向包括计算机视觉,模式识别,深度学习,图像处理等。主要从事基于深度学习结构设计,物体检测与跟踪,以及与人相关的问题的课题研 究。


  • 魏秀参,博士,南京理工大学计算机科学与工程学院教授,南京大学学生创业导师,澳大利 亚阿德莱德大学访问学者,曾任旷视南京研究院创始院长。主要研究领域为计算机视觉和机器学习,在相关领域国际顶级期刊如IEEE TPAMI、IEEE TIP、IEEE TNNLS、IEEE TKDE、IEEE TMM、Machine Learning Journal等,及国际顶级会议如CVPR、ICCV、ECCV、IJCAI、ICDM、ACCV等发表 论文三十余篇,Google Scholar Citations 1200余次,并带队获得iNaturalist 在内的计算机视觉领域国际权威赛事共4项世界冠军。分别在国 际重要会议PRICAI 2018和ICME 2019组织题为“Fine-Grained Image Analysis”的短课程。著有《解析深度学习–卷积神经网络原理与视觉实践》 一书。曾获南京经开区中青年优秀人才、南京理工大学青年拔尖人才、CVPR最佳审稿人、南京大学博士生校长特别奖学金等荣誉,担任WebFG 2020 Workshop程序委员会主席,及ICCV、CVPR、ECCV、NeurIPS、IJCAI、AAAI等国际顶级会议程序委员会委员。更多信息: http://www.weixiushen.com/




医学影像智能分析论坛

一、主题

医学影像智能分析

二、目的与意义

随着越来越多的机构和企业将目光聚焦在医疗领域,广泛应用的人工智能(Artificial Intelligence, AI)技术正不断为医学影像分析和基于影像的 计算机辅助诊断带来变革。据统计,医学数据中有超过90%来自于医学影像,人工分析这些影像数据往往不够精确,甚至会产生误判。同时,专业人才培 养速度远远赶不上医学影像增长的速度,医疗影像诊断质量面临严重挑战。因此,急需将人工智能技术引入医学影像分析来改善这一日益严重的挑战。 医学影像智能分析旨在利用人工智能在感知和认知上的技术优势,在疾病早期筛查、准确诊断、确定治疗方案和预后评估上为医生提供辅助决策支持, 从而提高诊疗效率和准确率。本论坛针对医学影像智能分析的新发展,邀请了六位来自学术界和工业界的领域专家,对医学影像智能分析技术的现状和 前景进行深入的介绍和讨论。

三、论坛日程

论坛时间:2020年10月17日15:20-17:20
会场:多功能南厅
时间 报告题目 报告人 主持人
15:20-15:50 融合医学影像智能分析的微创精准诊疗 廖洪恩 教授 夏勇
15:50-16:20 面向脑电数据的智能特征选择算法研究 邬霞 教授
16:20-16:50 基于图的医学影像处理与分析 陈新建 教授 杨欣
16:50-17:20 Deep Learning for MR Image Reconstruction, Segmentation and Classification 张道强 教授

四、拟讲授内容及邀请讲者简介

特邀报告一:融合医学影像智能分析的微创精准诊疗
报告摘要:智能化精准诊疗近年引起越来越多国家的关注,成为医学领域的必然发展趋势之一。医学影像的采集、处理与显示技术 在医学研究与应用中体现出了日益显著的重要性,成为在介入治疗中提升操作精准性、手术安全性必不可少的关键技术。随着微创诊疗的推广,医学成 像已经从单一的诊断手段逐步拓展成为介入治疗必不可少的工具。与此同时,智能型诊疗器械和微创治疗方法的开发也为提高肿瘤的治愈率、降低复发 率、以及改善手术预后提供了更多的帮助。我们关注医学影像处理、分析和显示在精准诊疗研究中的热点与挑战,融合医学影像智能分析,系统开展了 从精准识别与分类筛查的“检”、精确诊断与方案制定的“诊”到多模影像引导精准治疗的“疗”的一体化研究,并深入结合病理、基因等多源信息,开展了 从基础研究到临床应用的系列探索。我们期待这些技术能突破传统意义微创手术概念,开拓新兴微创高精度诊疗一体化领域。
  • 嘉宾简介:廖洪恩,清华大学终身教授、博士生导师。清华大学长聘评审委员会委员, 医学院学术委员会副主任、生物医学工程系副系主任。任国际医学生物工程联合会亚太区共同主席,亚洲计算机辅助外科学会理事长等职。国家 自然科学基金国家重大科研仪器研制项目、国家重点研发计划重点专项等项目负责人。在三维医学影像和微创医疗器械领域取得系列国际瞩目的 重要成果,在世界上首次实现微创手术治疗的立体空间透视导航,并成功研制出世界上首台用肉眼即可观察到的具有5米以上图像纵深的立体图 像显示装置。在包括IEEE Trans系列,Nature Photonics, Theranostics, MedIA刊物等发表了250余篇国际期刊和学会论文、30余篇综述 文章,合编著书籍13部,专利50余项。以项目负责人的身份获得国内外30余项重要科学研究基金项目,以及另外10余项合作项目。曾获国际医学 生物工程联合会IFMBE青年学者奖、日本文部科学大臣表彰等十余项国际性奖项。2017年获得我国生物医学工程学科最高科技奖“黄家驷生物医学 工程奖”,2018年获“中国侨界贡献奖”,以及国务院侨办颁发的“全国归侨侨眷先进个人”,2019年被中国科协聘任为首席科学传播专家。受邀担 任国家自然科学基金、“长江学者奖励计划”、国家高层次人才特殊支持计划(“万人计划”)、国家食药监总局创新医疗器械等评审专家、专家组 组长。


特邀报告二:面向脑电数据的智能特征选择算法研究
报告摘要:近年来,研究者们致力于提取多种类型的脑电特征,用于解析脑状态。然而,高维的脑电特征向量给基于脑电数据的 脑状态智能分析带来了很大困难。为了解决这一问题,人们提出了各种特征选择算法。为了自动去除冗余和含噪特征,我们提出了基于正交回归和特 征加权的嵌入式特征选择算法及其改进算法,以提高脑状态分析准确性和效率。相较于传统基于最小二乘法的特征选择算法,基于正交回归的特征选 择算法对异常值不敏感,且能够保留投影空间内更丰富的判别信息,更适合于易被伪迹干扰的脑电信号。
  • 嘉宾简介:邬霞,北京师范大学人工智能学院教授,认知神经科学与学习国家重点实 验室研究员,博士生导师。国家自然科学基金优秀青年基金获得者,入选教育部新世纪优秀人才支持计划。近年来,在医学影像数据分析、机器 学习、情感计算、脑疾病诊断及预测等相关方面,以第一/通讯作者在IEEE TNNLS、TAC、PR、HBM、NI等高水平期刊,以及IPMI、MICCAI等医 学图像处理顶级国际会议发表论文60余篇。



特邀报告三:基于图的医学影像处理与分析
报告摘要:图割方法由于其对很多能量最小化问题能找到全局最优解的特性,在图像分割、计算机视觉等领域被广泛应用。本报 告围绕基于图的医学影像处理与分析进行展开,重点介绍图搜索和图割方法,以及在几种临床疾病上的应用,比如眼底视网膜疾病的诊断与分析,肾 组织多类分割等。
  • 嘉宾简介:陈新建,教授,博导,国家青年千人计划、国家优秀青年基金获得 者、青年973首席科学家。2006年博士毕业于中国科学院自动化研究所,并获得中国科学院院长优秀奖;博士毕业后加入微软亚洲研究院任副研 究员;2005年1月至2012年5月先后于美国宾夕法尼亚大学、美国国立卫生研究院、爱荷华大学做博士后研究;2012年6月加人苏州大学电子电 子信息学院,任特聘教授、博士生导师。现为苏州大学医学影像处理与分析实验室主任,主持973青年科学家项目(首席科学家),国家自然科 学基金委优青、面上项目、江苏省自然科学基金重点项目等,研发经费超过1500万元。主要研究方向为医学影像处理与分析,包括医学影像分 割、肿瘤生长预测, 疾病精准量化分析等,特别对眼科影像诊断与分析有着深刻的研究。现为医学领域顶级期刊IEEE-TMI、IEEE-JTEHM等副主 编,IEEE高级会员,中国生物医学工程青年委员会副主任委员。截至目前共发表150多篇国际顶级期刊/会议论文,申请中国发明专利30余项 (10项已获授权),申请美国专利3项(1项已获授权);获得中国国家科学技术进步二等奖1项,北京市科学技术奖二等奖2项和信息产业部重 大技术发明奖1项。

特邀报告四:Deep Learning for MR Image Reconstruction, Segmentation and Classification
报告摘要:近年来,“脑科学计划”吸引各国政府和公众的广泛研究。基于大脑MR图像的医学图像分析是研究脑科学的重要手段, 然而大脑MR图像数据获取代价较高,灰度对比度较低,且具有高维度、异构和时变等特性,对其进行快速有效分析是当前研究的关键问题之一。在本 报告中,我将首先介绍我们基于深度学习的MRI压缩感知重建过程中的相关工作,然后介绍基于深度学习的大脑MR图像分割研究,最后汇报我们近几 年在基于深度学习脑疾病诊断分类研究的一些进展。
  • 嘉宾简介:张道强,南京航空航天大学计算机科学与技术学院、人工智能学院教授, 副院长,国际模式识别协会会士(IAPR Fellow),国家科技部中青年科技领军人才,“万人计划”青年拔尖人才,国家优秀青年基金获得者; 担任中国图学学会图学大数据专委会副主任、中国图象图形学会理事、中国人工智能学会机器学习专委会常委、中国计算机学会人工智能与模 式识别专委会委员、江苏省人工智能学会医学图像处理专委会主任。主要研究方向为人工智能,机器学习,模式识别,医学图像分析,在相关 领域发表学术论文200 余篇,被SCI 收录100 余篇。部分第一/通讯论文发表在领域内重要国际期刊,如IEEE TPAMI、IEEE TMI、IEEE TIP、Neuroimage、Human Brain Mapping、Medical Image Analysis等,以及重要国际会议,如NIPS、MICCAI、IJCAI、AAAI、CVPR、 KDD等。据Google Scholar 统计,论文已被国际同行引用11400 余次。目前担任《Pattern Recognition》、《Journal of The Franklin Institute》、《PLOS ONE》、《自动化学报》等期刊编委,担任国际学术会议IDEAL’16、MLMI’13/14程序委员会主席。 研究成果获教育部自然科学二等奖(第一完成人)和一等奖(第四完成人)等,以及国际会议PRICAI’06 、STMI’12、BICS’16 和 MICCAI'9最佳(学生)论文奖。2014-2019 连续6年入选Elsevier 中国高被引学者榜。


五、组织者

  • 夏勇,博士,西北工业大学计算机学院长聘教授,博士生导师,国家级青年 人才计划入选者,中国图象图形学学会视觉大数据专委会常委,中国抗癌协会肿瘤影像专业委员会人工智能学组副组长,陕西省计算机学会人工 智能专委会主任。分别于2001、2004和2007年从西北工业大学计算机学院获得学士、硕士和博士学位,研究方向为医学影像处理、分析与学习, 侧重于与人工智能相结合的医学影像分割、鉴别诊断和预后预测。近三年在IEEE Trans、MedIA、IJCAI和MICCAI等本领域顶级期刊/会议上发 表学术论文40余篇,并先后在ISBI 2019 C-NMC、LiTS 2017和PROMISE12等国际学科竞赛中排名第一。层担任ISBI2017分会主席和MICCAI 2019领域主席。个人主页:http://jszy.nwpu.edu.cn/yongxia.html


  • 杨欣,女,博士,2013年获得加州大学圣塔芭芭拉分校博士学位。现任华中科技大学 电信学院教授。杨欣博士主要从事医学影像分析与计算机视觉领域研究工作,已在国际权威期刊及学术会议上发表学术论文70余篇,其中近五年 以一作/通信作者在国际权威期刊(TPAMI、IJCV、TMI、MIA等)和国际顶级会议(CVPR、ICCV、MM、MICCAI)上发表论文共53篇,授权美国 发明专利3项,出版英文书籍章节2部。她主持国家自然科学基金2项,腾讯AI Lab犀牛鸟专项、校企联合实验室及多项省市企业项目;获得 武汉3551长期创新人才、ACM武汉新星奖、湖北省自然科学基金创新群体等荣誉称号;担任SCI期刊Multimedia System编委及CCF A类会议 ACM MM和MICCAI领域主席;现任中国图象图形学会高级会员,CCF多媒体专委会副秘书长等。




极市技术专题论坛

一、主题

目标检测与跟踪

二、论坛日程

论坛时间:2020年10月17日15:20-17:20
会场:多功能北厅
时间 报告题目 报告人 主持人
15:20-15:50 基于特征优化匹配的目标检测方法 叶齐祥 刘若水
15:50-16:20 边缘AI赋能产业创新 张宇
16:20-16:50 视觉目标跟踪中的模型更新问题 王栋
16:50-17:20 圆桌讨论: 小目标检测 程明明、叶齐祥、王栋、顾典、
邓富城

三、拟讲授内容及邀请讲者简介

报告1:基于特征优化匹配的目标检测方法
  • 嘉宾简介:叶齐祥,中国科学院大学长聘教授。1999、2001年获哈尔滨工业大学 学士、硕士学位。2006年获中科院计算所博士学位。2013至2014年在美国马里兰大学先进计算机技术研究所(UMIACS)任访问助理教授, 2016年Duke大学信息技术研究所(IID)访问学者。研究方向为机器感知与学习。在视觉目标检测方面进行了长期研究,提出了高精度与弱监 督视觉目标检测方法,在金山、华为、航天等单位获得应用,并扩展到工业乙烯收率预测领域,在中国石化获得应用推广。在IEEE CVPR, ICCV, NeurIPS, AAAI、ECCV等顶级会议与T-PAMI, TNNLS, TIP, T-ITS, PR等JCR一区期刊发表论文60余篇,获得中国科学院卢嘉锡 青年人才奖,中国电子学会自然科学奖,IEEE 高级会员。

报告2:边缘AI赋能产业创新
  • 嘉宾简介:张宇,现任英特尔首席工程师及英特尔中国区物联网事业部首席技术 官,中国计算机学会以及IEEE会员。2000年从清华大学毕业,获得电子工程博士学位,2002年加入英特尔,目前负责基于英特尔处理器及 人工智能加速芯片的边缘计算与深度学习解决方案的创新和推广。领导的团队目前正在研究应用于智能安防,智能制造,智能零售,智能交 通等领域的物联网解决方案。目前担任边缘计算产业联盟测试床工作组主席,同时还代表英特尔参与IEEEP2805.3工作组的工作,与业界合 作伙伴共同制定有关边云协同环境下机器学习的协议标准。





报告3:视觉目标跟踪中的模型更新问题
  • 嘉宾简介:王栋,大连理工大学, 信息与通信工程学院, 副教授。研究方向为计 算机视觉和模式识别,主要从事目标跟踪与识别方面研究。迄今在本领域顶级会议(CVPR/ICCV等)及期刊(TPAMI/TIP等)发表论文30余篇, Google Scholar引用4000余次, 5次获得国际视觉目标(VOT)竞赛冠军。累计主持国家自然科学基金3项; 曾获CCF自然科学二等奖(排名第 1), 教育部自然科学二等奖(排名第2), CVPR2020最佳论文提名(通讯作者), IEEE大数据专委会杰出青年研究奖等多项学术奖励。担任IE ICE T INF SYST, Pattern Recognition等多个SCI期刊编委或客座编委。




四、圆桌讨论:小目标检测

  • 程明明,南开大学教授,计算机系主任,国家“万人计划”青拔







  • 叶齐祥,中国科学院大学长聘教授







  • 王栋,大连理工大学, 信息与通信工程学院, 副教授









  • 顾典,英特尔物联网事业部边缘人工智能方案开发总监







  • 邓富城,极视角科技合伙人&视觉算法负责人












以人为中心的视觉感知论坛

一、主题

以人为中心的视觉感知

二、目的与意义

近些年,计算机视觉取得了长足的发展,在诸多领域得到了广泛应用。人是计算机视觉系统的主要目标与服务对象,对人的理解是计算机视觉更好 地服务于人的基础。本论坛目的在于从多个不同的角度来探讨对于人的全方位的理解,包括人脸、人体、行为、姿态、表情、心率等多个维度,从 而促进对人的理解的研究交流与发展,为学术界和工业界提供一个国际交流、学习和合作的平台。

三、论坛日程

论坛时间:2020年10月18日15:20-17:20
会场:多功能中厅
时间 报告题目 报告人 主持人
15:20-15:50 Rich Representation Learning for Face/Person Detection, Parsing and Matching 王井东 研究员 阚美娜
15:50-16:20 Graph Learning and Reasoning on Visual Patterns 崔振 教授
16:20-16:50 图像跨域重建与识别 王楠楠 教授 张姗姗
16:50-17:20 面部微弱视觉信号分析与建模 韩琥 副研究员

四、拟讲授内容及邀请讲者简介

特邀报告1:Rich Representation Learning for Face/Person Detection, Parsing and Matching
报告摘要:Human centric vision is about research problems raised by the needs in our life, such as security and safety, medical imaging, health care, and so on. It is becoming increasingly important and attracting increasing research interest. In this talk, I will talk about our works on human image understanding and analysis. It covers our work on face detection and alignment, as well as human keypoint detection and human part parsing, where we adopt our HRNet (high-resolution network) for learning strong representations, and achieve state-of-the-art performance. I also talk about person matching/re-identification based on interpretable part-based representation learning schemes.
  • 嘉宾简介:Jingdong Wang is a Senior Principal Research Manager with the Visual Computing Group, Microsoft Research, Beijing, China. He received the B.Eng. and M.Eng. degrees from the Department of Automation, Tsinghua University, Beijing, China, in 2001 and 2004, respectively, and the PhD degree from the Department of Computer Science and Engineering, the Hong Kong University of Science and Technology, Hong Kong, in 2007. His areas of interest include deep learning, large-scale indexing, human understanding, and person re-identification. He is an Associate Editor of IEEE TPAMI, IEEE TMM and IEEE TCSVT, and is an area chair (or SPC) of some prestigious conferences, such as CVPR, ICCV, ECCV, ACM MM, IJCAI, and AAAI. He is a Fellow of IAPR and an ACM Distinguished Member. His representative works include deep high-resolution network (HRNet), interleaved group convolutions, discriminative regional feature integration (DRFI) for supervised saliency detection, neighborhood graph search (NGS) for large scale similarity search, composite quantization for compact coding, and so on. He has shipped a dozen of technologies to Microsoft products, including Bing search, Bing Ads, Cognitive service, and XiaoIce Chatbot. His NGS algorithm is a fundamental element of many products. He has developed Bing image search color filter using his efficient salient object algorithm. He has developed the first commercial color-sketch image search system. His homepage is https://jingdongwang2017.github.io/.

特邀报告2:Graph Learning and Reasoning on Visual Patterns
报告摘要:Feature representation learning dominates the main development of computer vision, especially recent deep learning. However, the study mainly focuses on feature patterns rather than the relationships between patterns, although the statistical observations indicate that videos/images often contain abundant structural pattern relationships. In this talk, we will introduce and discuss graph-based learning and reasoning on visual patterns/relationships. Concretely, we first will review and discuss the recent progress on graph deep learning, especially graph convolutional networks, and next report our works about graph modeling and learning for human-related vision tasks, especially including action recognition, emotion analysis, object tracking, etc.
  • 嘉宾简介:崔振,南京理工大学教授、博导。研究方向为计算机视觉和模式 识别,目前的研究聚焦于视觉计算中的图建模、学习及推理理论与方法。在IEEE汇刊(T-PAMI/T-NNLS/T-IP等)和CCF A类会议 (CVPR/NIPS等)发表论文40余篇。曾获中国科学院优秀博士论文奖、国内外重大/重要赛事冠亚军各2项;承担江苏省杰出青年基金 、国家自然科学基金、军委装备发展部项目等多项项目。






特邀报告3:人脸图像跨域重建与识别
报告摘要:跨域图像是指同一目标通过不同传感器所形成的不同类型的图像,而图像跨域重建是指利用跨域图像之间 内容的关联性和表达的互补性由一个域的图像生成另外一个域的图像或由一个域的图像识别另外一个图像的过程。本报告中的图像跨域重建 主要包括人脸画像-照片合成和图像超分辨率重建,图像跨域识别主要涉及人脸画像-照片的跨域识别与跨域的行人重识别问题。本报告将 介绍现有的图像跨域重建与识别方法以及我们课题组在此方向上的进展。
  • 嘉宾简介:王楠楠,教授,博士生导师,2015年3月博士毕业于西安电 子科技大学。西安电子科技大学综合业务网理论及关键技术国家重点实验室智能信息处理中心主任。2011年9月至2013年9月在澳大利亚 悉尼科技大学访问。近年来,一直从事计算机视觉和统计机器学习方面的研究,在异质图像变换与识别、图像跨域重建与识别方面进行了 深入研究,内容包括了画像-照片合成与识别,图像/视频超分辨率重建、图像恢复,行为定位与识别,行人重识别等。在IEEE TPAMI、 IJCV、NeurIPS等国际顶级期刊和会议上发表学术论文100余篇,获得国家自然科学基金委优秀青年基金,入选中国科协青年人才托举工 程,获中国人工智能学会优秀博士学位论文、陕西省优秀博士学位论文奖、陕西省科学技术一等奖等奖项,主持国家自然科学基金优青项 目、面上项目、装备发展部-教育部联合基金青年人才项目等十余项课题。


特邀报告4:面部微弱视觉信号分析与建模
报告摘要:不同视觉识别与分析任务的视觉信号强度差异巨大,很多视觉任务对应的视觉信号可能是极其微弱的,比如 混合在占主导的背景信号和噪声信号中,难于被人眼观察到甚至人眼不可见,因此传统方法在微弱视觉信号分析与建模中面临极大的挑战。 反观人类往往能从表面的(显式的)视觉信息中发现隐藏问题的蛛丝马迹,如何让机器具有像人一样甚至超越人的微弱视觉信号分析能力是视 觉信号分析与建模中的一个重要方向。报告将从基于物理模型的信号抽取、知识与数据联合驱动建模、微弱信号特征解耦以及弱监督建模等 方面,介绍研究小组在微弱视觉信号分析与建模方面的研究进展,以及在面部AU识别、基于人脸的遥测式心率估计以及影像增强与疾病分类 等方面的应用。
  • 嘉宾简介:韩琥,中科院计算所副研究员,2011年博士毕业于中科院计算所, 之后分别在美国密歇根州立大学和美国谷歌总部从事生物特征识别研究工作,曾担任谷歌Abacus项目核心研发成员。2015年回到中科院 计算所工作,主要研究方向为计算机视觉与模式识别、生物特征识别、医疗影像分析。担任国际期刊Pattern Recognition编委(AE), 国际会议ICPR2020领域主席(AC),以及CVPR2020/FG2020/WACV2020/FG2019/BTAS2019/PRCV2019等主会特别会议/专题论坛/竞赛的 共同组织者。在IEEE TPAMI/TIP/TIFS/TBIOM、PR、CVPR、ECCV、NeurIPS、MICCAI等领域权威国际期刊与会议上发表学术论文50 余篇(第一作者IEEE T-PAMI长文3篇),谷歌学术引用2700余次 (H-Index: 25)。作为负责人承担国家重点研发子课题、基金重点 子课题、基金面上、中科院对外合作及企业合作等课题10余项。相关研究工作3次获会议最佳学生/海报论文奖,3次获国际竞赛冠亚军。


五、组织者

  • 阚美娜,中科院计算所副研究员。研究领域为计算机视觉与模式识别,主要关 注人脸识别、多视学习、迁移学习、深度学习、弱监督学习等问题,相关成果已发表在TPAMI、IJCV、CVPR、ICCV等相关领域主流国际 期刊与会议上面,谷歌学术引用2200余次。2014年获得CCF优秀博士学位论文奖、2016年入选CCF青年人才托举计划、2018年获得中国 图象图形学学会石青云女科学家奖青年奖、2019年入选北京市科技新星计划。此外,获得2015年IEEE FG视频人脸识别竞赛冠军、 2015年IEEE ICCV年龄估计竞赛亚军、2017年IEEE CVPR人脸面部关键点定位亚军等。



  • 张姗姗,南京理工大学计算机学院教授,博士生导师,江苏省“社会安全图像 与视频理解”重点实验室副主任。研究方向为计算机视觉,特别关注视频中人体检测和分析。曾于2015年在德国波恩大学获得计算机博 士学位,博士论文获大德语区(德瑞奥三国)计算机学会最佳博士论文提名;博士毕业后在德国马普计算机研究所从事为期两年的博士 后研究。2018年入选中国科协“青年人才托举工程”、江苏省“双创博士”、微软“铸星学者”计划等。目前以第一/通讯作者身份在CVPR、 ECCV、T-PAMI、T-IP等顶级国际期刊和会议上发表论文三十余篇,谷歌学术引用1800余次;在微软学术统计的全球学者近五年排位中 ,位列行人检测领域第一位。目前担任模式识别权威期刊Pattern Recognition编委、中国人工智能学会模式识别专委会副秘书长、 VALSE资深领域主席。






底层视觉学习与应用论坛

一、主题

底层视觉学习与应用

二、目的与意义

底层视觉是近年来计算机视觉领域的研究热点之一,在智能拍照、智能监控、图像处理和图像/视频编辑等任务中获得了广泛的关注与应用。 由于底层视觉问题的复杂性和任务的多样性,如果构建一个满足重建性能要求的灵活性深度模型,以及如何结合无监督和自监督学习实现高质量的图像/视频复原、 图像/视频生成和图像/视频编辑,也是近年来底层视觉研究关注的重点。为此,中国图象图形学学会机器视觉专委会拟在PRCV期间组织“底层视觉前沿论坛”, 邀请国内知名学者介绍相关的研究成果及进展,探讨底层视觉的发展趋势、面临的困难、挑战和潜在机遇等问题。
本论坛的目的在于汇聚国内从事底层视觉研究与应用的相关学者,共同探讨相关领域的最新技术进展和在图像/视频复原、图像/视频生成和图像/视频编辑等领域的 落地应用,凝聚国内从事底层视觉研究的主要力量,推动底层视觉研究进展与实际应用。

三、论坛日程

论坛时间:2020年10月18日15:20-17:20
会场:多功能南厅
时间 报告题目 报告人 主持人
15:20-15:50 Variational Image Restoration Networks 孟德宇 教授 左旺孟
15:50-16:20 Image restoration: from model-based to model-guided deep networks 董伟生 教授 潘金山
16:20-16:50 基于大范围首先的异质图像增强 赫然 研究员 任冬伟
16:50-17:20 可调节图像复原 董超 副研究员 潘金山

四、拟讲授内容及邀请讲者简介

特邀报告1:Variational Image Restoration Networks
  • 嘉宾简介:孟德宇,博士,西安交通大学教授,博导。 任西安交大大数据算法与分析技术国家工程实验室机器学习教研室负责人。共接收/发表论文80余篇,其中包括IEEE汇刊论文30篇, CCF A类会议论文37篇。目前主要聚焦于自步学习、误差建模、张量稀疏性等机器学习与计算机视觉领域的基础研究问题。 入选第四批国家“万人计划”青年拔尖人才。






特邀报告2:Image restoration: from model-based to model-guided deep networks
  • 嘉宾简介:董伟生,男,1981年4月生,西安电子科技大学人工智能学院教授、 博士生导师,副院长。主要从事图像处理、深度学习、计算机视觉等方面的研究工作。主持国家优青、国家自然科学基金重大项目课题、 科技部重点研发项目课题等科研项目。在权威期刊和会议上发表论文60余篇,论文已被Google引用5000余次,7篇论文入选ESI 1%高被引论文。 曾任中国计算机学会推荐A类期刊IEEE Transactions on Image Processing编委,现任权威SIAM Journal on Imaging Sciences编委。 2017年入选教育部“长江学者奖励计划”青年项目和“万人计划”青年拔尖人才项目,曾获国家自然科学奖二等奖1项(排名第二)。



特邀报告3:基于大范围首先的异质图像增强
  • 嘉宾简介:赫然,博士,中科院自动化所模式识别国家重点实验室研究员, 中科院脑科学与智能技术卓越创新中心年轻骨干,中国科学院大学岗位教授。任中国科学院大学人工智能学院人工智能基础教研室主任, IAPR Fellow。从事模式识别应用基础理论研究,并应用到生物特征识别、底层计算机视觉和智能视频监控,获得视频生成竞赛冠军, 在华为Mate 30手机等取得应用(华为三年资助800余万);近期主要聚焦在非监督学习以及图像生成中遇到的瓶颈问题。出版信息理论学习专 著1部;在IEEE TPAMI(影响因子: 17.86)第一作者发表论文5篇,研究工作获得国家自然科学基金优秀青年科学基金、北京自然科学基金杰出 青年科学基金和中科院青年促进会优秀会员等项目资助。受邀参加70周年国庆阅兵观礼(2019)、中央电视台科教频道《透视新科技》科普 栏目(2020)。


特邀报告4:可调节图像复原
  • 嘉宾简介:董超,博士,副研究员, 2012-2016年就读于香港中文大学信息工程专业, 获博士学位。2014年9月,在欧洲计算机视觉大会(ECCV)上发表论文SRCNN,首次将深度学习引入图像超分辨领域。2017年-2019年,带队参加国 际超分辨率比赛NIRTE17, NIRTE18,PIRM18和NTIRE19,共获得7项冠军和1项亚军。2016年-2018年就职于商汤科技集团,任高级研究经理,带领 商汤超分团队开发了世界首款基于深度学习的数码变焦软件。2018年6月全职加入中科院深圳先进技术研究院,成立XPixel画质团队,专注于底层机器 视觉和图像处理。现担任视觉与学习青年学者研讨会(VALSE)执行AC、IEEE JSTSP期刊编委,中国科学院青促会会员,期刊TPAMI/IJCV/TIP审稿人, 会议CVPR/ICCV/ECCV审稿人。


五、组织者

  • 潘金山,南京理工大学计算机学院教授。主要从事图像去模糊、图像复原等相关底层视觉 问题的研究。在CVPR/ICCV/ECCV等国际会议以及IEEE TPAMI、IJCV等重要国际期刊上发表论文40余篇。研究工作获得国家自然科学基金优秀青年科学基 金资助。获得了中国人工智能学会优秀博士学位论文奖以及辽宁省优秀博士学位论文奖。





  • 任冬伟,天津大学人工智能学院助理教授。主要从事图像盲复原、图像修复等底层计算机视觉 问题的研究。在IEEE TPAMI、TIP、CVPR等国际期刊和会议上发表论文10余篇。







  • 左旺孟,哈尔滨工业大学计算机学院教授、博士生导师。主要从事图像增强与复原、 多域视觉学习、物体检测与目标跟踪、图像与视频分类等方面的研究。在CVPR/ICCV/ECCV等顶级会议和T-PAMI、IJCV及IEEE Trans.等期刊上发表 论文100余篇。