联系信息
Email: shawen@mail.ustc.edu.cn
Phone: +8618655053780
专业摘要
我是一名经验丰富的AI视觉算法工程师,擅长人脸和人体检测识别、手势识别、车辆与车牌检测识别等领域。在领先的AI科技公司担任算法团队的Leader,具有深厚的实战经验和丰富的产品落地经验,目前在智能座舱领域搬砖。
教育经历
- 中国科学技术大学(硕士) - 控制工程专业 - 2013年至2016年
- 安徽大学(本科) - 通信工程专业 - 2009年至2013年
工作经历
- 科大讯飞股份有限公司(合肥) - 算法工程师 - 2017年至今
- 中兴通讯股份有限公司(南京) - 算法工程师 - 2016年至2017年
业绩经历
-
车载智能座舱多模理解大模型业务
-
2025年2月至今:作为核心研究算法团队的研发总监,布局座舱多模态大模型,实现舱内理解和智能车控能力,推动座舱多模态大模型端侧部署和首单量产。
- 初创期(2025年2月至今):将公司星火大模型赋能智能座舱,从零构建点餐、买药场景的 GUI-Agent 能力(纯 VLM 技术路径),任务执行成功率达 80%,于今年公司 1024 汽车分会展亮相并达成准量产标准。同步助力日产实现多模问屏能力量产落地,达成行业首个 VLM 技术量产应用。此外,带领团队基于高通 8295 芯片,孵化2B尺寸的端侧多模态大模型方案,已落地广汽车型也同步亮相公司1024。
-
2025年2月至今:作为核心研究算法团队的研发总监,布局座舱多模态大模型,实现舱内理解和智能车控能力,推动座舱多模态大模型端侧部署和首单量产。
-
车载智能座舱视觉DMS&OMS业务
-
2020年2月至今:作为核心研究算法团队的Leader,我成功领导了一支30余人的精英团队,实现从零到一的突破,构建起专业的智能座舱视觉算法团队,协同助力汽车事业部团队不仅在奇瑞、江铃、日产、阿维塔、赛力斯、长安、广汽等国内知名车厂完成了数十款车型的量产交付,还成功拓展至国际市场,实现了海外数十款车型的算法部署,展现了团队强大的研发实力和高效的项目执行能力。
- 初创期(2020年2月至2021年2月):团队从零开始,着手开发驾驶员监控系统(DMS)。主要工作集中在自选的HiKey970开发板上,通过全流程演示,展示了纯CPU场景下的功能。借助QAT的8比特量化技术降低了算力需求,成功实现了DMS功能的稳定演示。
- 痛苦期(2021年3月至2022年2月):团队面临了纯视觉无定点的挑战,无法独立生存。因此采取了两步走策略:一是绑定多模态进行销售以确保有落地成效,二是深入开发平台异构能力。这一年,团队在效果优化和引入部分OMS能力的同时,成功整合了安霸CV25、MT8666和高通8155(SNPE/HexagonNN)推理异构支持,并可进行演示。
- 稳定期(2022年3月至2023年2月):感谢奇瑞的信任,经过多次演示和打磨,纯视觉方案终于可以独立运行,并获得了前三个量产项目的机会。整个团队逐渐稳定下来,经过深入打磨后,DMS的整体效果达到了业界领先水平,助力奇瑞从国内走向国际。
- 成长期(2023年3月至2024年2月):基于奇瑞的基地和国际法规的要求,DMS技术随奇瑞出海,顺利通过了ADDW和DAAW相关认证。同时,还实现了OMS前三个量产项目的交付,并围绕奇瑞形成了批量化交付的经验。
- 爆发期(2024年3月至今):奇瑞在高通8155平台上获得的多个量产和出海经验吸引了国内许多车厂的关注。团队陆续获得了江铃、日产、阿维塔、赛力斯、长安、广汽等车厂的合作机会。根据实际交付需求沿途积累了芯驰X9SP、联发科MT8675/MT8676和高通8295(QNN)异构的经验,实现了批量交付的能力。
-
2020年2月至今:作为核心研究算法团队的Leader,我成功领导了一支30余人的精英团队,实现从零到一的突破,构建起专业的智能座舱视觉算法团队,协同助力汽车事业部团队不仅在奇瑞、江铃、日产、阿维塔、赛力斯、长安、广汽等国内知名车厂完成了数十款车型的量产交付,还成功拓展至国际市场,实现了海外数十款车型的算法部署,展现了团队强大的研发实力和高效的项目执行能力。
-
视线追踪&手势识别业务
-
2019年6月至今:作为核心研究算法团队的Leader,我和我的团队开发出领先的注视感知与手势识别算法,并在业界率先推出眼神打字与凌空手写创新Demo,赢得政府及市民的高度赞誉。如今,我们的视线与手势技术已广泛应用于护眼及交互大屏产品中,展现出巨大的应用前景。
- 预研期(2019年6月至2021年2月):我们进行了深入的方案调研,并积极与高校老师交流,逐步孵化并验证了视线追踪和手势识别的AI能力。我们在PC设备和多模大屏的android设备上成功完成了研发,并制作了演示Demo,在公司内部的嘉年华上获得了广泛好评。
- 落地期(2021年3月至2022年2月):我们的视线追踪和手势识别技术展现出了惊艳的表现,吸引了业务部门的关注,并在智能座舱、学习机以及多模大屏交互等场景中进行了实际效果的打磨,实现了业务价值。在公司1024发布会上,我们展示的眼神打字和凌空手写技术惊艳了所有人。
- 稳定期(2022年3月至今):智能座舱、学习机以及交互大屏的成功推动了公司更多业务线的推广,并与阿里达成了战略合作,成为重要的视觉AI交互出口。
-
2019年6月至今:作为核心研究算法团队的Leader,我和我的团队开发出领先的注视感知与手势识别算法,并在业界率先推出眼神打字与凌空手写创新Demo,赢得政府及市民的高度赞誉。如今,我们的视线与手势技术已广泛应用于护眼及交互大屏产品中,展现出巨大的应用前景。
-
人脸识别业务
- 2017年6月至今:作为核心研究算法团队的Leader,我专注于人脸人体识别能力的优化。在云端GPU与离线Android设备上,均实现显著效率提升。人脸识别效果卓越,虚警率仅0.1%时,Top1命中率高达99.9%。在RK3288@单核A17离线设备上,全流程耗时控制在300ms内。凭借这些成果,我们成功在不同省市小区实现批量交付,获得广泛认可。
- 云端人脸行人安防应用(2017年6月至2018年2月):在与港中文汤晓鸥教授携手合作的基础上,我们的人脸识别技术借助DeepID模型取得了初步进展,并逐步发展成为我们自己的云端人脸识别"大"模型。通过实际安防业务的实施和对前沿科技文献的深入研究,我们的技术不断精进,使得我们的人脸识别效果达到行业领先水平。
- 互联网媒资政要(人物)检索应用(2018年3月至2019年2月):随着人脸识别技术在安防领域的辉煌成就,我们应市场需求,将这项技术应用于互联网媒资和政要人物检索领域。我们成功开发了一套全流程的人物检索解决方案,不仅顺利落地实施,还完美契合了业务需求。
- 人脸识别边缘计算应用(2019年3月至2020年2月):我们致力于将人脸识别技术从云到边缘再到端点的全面部署,成功实现了技术的轻量化。特别是在标准的RK3288门禁系统上,我们优化了人脸识别流程,将响应时间压缩至300ms以内,并顺利完成了端侧闸机门禁系统的批量部署。
- 集团优秀CBB演进(2020年3月至今):随着人脸识别技术的持续进步,其效能逐渐触及瓶颈,但这已足以全面满足各项业务需求。如今,这项技术已稳步成为集团内备受推崇的优秀CBB(通用基础模块),为集团的科技发展和业务创新注入了持久动力。
-
2022年10月至今:带领研究与工程团队,我们专注于人、眼、手、车、物的视觉感知CBB能力建设。为应对技术瓶颈,我们在cuda支持基础上,进一步适配了寒武纪MLU370(s4/x8)与昇腾310P等国产NPU,实现功能与效果的完全替代,确保技术自主可控。
- AI创意拼图应用(2022年10月至2023年2月):为满足学龄前儿童学习机的需求,成功开发并实施了AI创意拼图功能,该功能的推出显著提升了2023年学习机在线下体验店的客流量与互动体验。
- 车辆车牌检测识别应用(2022年10月至2023年10月):完成了全系列车辆识别功能对信创国产化平台的支持,确保了多项业务需求得到高效满足。
- 其他应用(2022年3月至今):成功将人脸识别、手势识别、眼部识别等核心技术转化为CBB模块,并实现了对信创国产化平台的支持,持续进行技术维护与升级,以适应不断变化的市场需求,不再赘述。
授权专利
- (第一发明人)一种身份认证的方法、设备及计算机可读存储介质-发明专利证书
- (第一发明人)人机交互方法、装置、相关设备及计算机程序产品-发明专利证书
- (第二发明人)人脸识别模型构建方法、识别方法、装置、设备及存储介质-发明专利证书
- (第二发明人)人脸识别模型构建方法、人脸识别方法及相关装置-发明专利证书
- (第三发明人)一种对象识别方法、装置、设备及存储介质-发明专利证书
- (第三发明人)汽车座舱监控方法、装置、相关设备及计算机程序产品-发明专利证书
- (第三发明人)健康监测方法、装置、电子设备和存储介质-发明专利证书
- (第四发明人)视线估计方法、装置、电子设备和存储介质-发明专利证书
- (第五发明人)一种单目标视频跟踪方法、装置、存储介质及设备-发明专利证书
专业技能
- 丰富的AI视觉感知相关产品任务落地经验
- 精通C++,具备架构师级别的代码开发能力
- 精通各种芯片NPU异构计算,包括高通系、周易系、RK系、MTK系等
关键经验
- 人员管理-规模/复杂团队管理
- 扭转劣势-扭转局面
- 研发经验-产品研发经验
- 研发经验-多业务方向研发
- 开创新经验-从0到1
作品展示-解决方案示意












作品展示-视频Demo
视线交互-眼神打字
姿态行为-坐姿&学习行为
通用检测-创意拼图
视线交互-注视感知
智能座舱-DMS
智能座舱-OMS
视线交互-眼肌锻炼
人脸识别-门禁闸机