报告题目:基于Transformer的视觉跟踪算法探索
报告人:王栋 教授(大连理工大学)
报告时间:2022年4月18日(周一)上午9:30-10:20
报告地点:腾讯会议ID: 260-929-077
摘要:本报告简述Transformer模型在目标跟踪方面的进展,以及介绍团队近期利用Transformer模型在单目标跟踪方面取得的突破。首先,团队提出了基于Transformer的特征融合模型,通过建立非线性语义融合和挖掘远距离特征关联有效聚合目标和搜索区域的全局信息,显著提升了跟踪算法的精度。其次,团队提出了基于编码器-译码器Transformer的跟踪框架。其中编码器建模待跟踪目标与搜索区域之间的全局时空特征关联,译码器学习一个查询表示来预测待跟踪目标的空间位置。该算法在短时跟踪、长时跟踪数据集上均取得了SOTA的结果。最后,本报告将简述Transformer在单目标跟踪方面的前沿进展。
报告人简介:王栋, 大连理工大学, 信息与通信工程学院教授, 研究方向为视觉目标感知与跟踪。迄今在本领域顶级会议(CVPR/ICCV)及期刊(TPAMI/TIP)发表论文40余篇, 谷歌学术引用6000余次;获得国际视觉目标跟踪竞赛VOT冠军(7次), CCF自然科学二等奖, 教育部自然科学二等奖, CVPR2020最佳论文提名等学术奖励;获批国家自然科学基金优秀青年科学基金、面上项目等。
邀请人:机器学习与视觉团队