Profile Image

赵凯

赵凯老师现任 上海大学 通信与信息工程学院副教授, 在教育部长江学者特聘教授曾丹教授团队开展多模态大模型、智能工业质检等方向的研究工作。 赵凯老师于 2025 年 8 月加入上海大学,入选上海市及国家级海外高层次人才引进计划。

赵凯老师本科和硕士均毕业于上海大学, 硕士导师是沈为 教授 (现上海交通大学教授);2020年获南开大学计算机科学与技术专业博士学位, 师从程明明教授。 博士毕业后入选腾讯校招技术大咖(T9级技术专家,腾讯校招最高技术职级), 并在腾讯优图实验室担任高级研究员。 2022年起在加州大学洛杉矶分校(UCLA)从事博士后研究,2025年8月加入上海大学任教。

赵凯老师的研究领域主要包括计算机视觉多视角几何机器学习。 他在计算机视觉和机器学习相关的顶级期刊和会议上发表论文20余篇, 包括 IEEE TPAMI,、CVPR、NeurIPS、ICCV, ECCV 等顶级期刊和会议, 多篇论文入选 ESI 高被引,谷歌学术总引用 6,000 余次。 赵凯老师关于掌纹识别的研究被《麻省理工科技评论》报道, 并应用于微信刷掌支付、北京地铁大兴机场线刷掌入站中。 赵凯老师是很多开源库(例如 PyTorch mmdetection)的活跃贡献者。

联系方式

  • WeChat QR Code
  • 上海大学宝山校区东区12号楼527室
  • Email(发邮件时请说明来意并尽量简洁直接)

教育背景、任职经历:

  • Aug 2025~: 副教授,上海大学。
  • Mar 2022~Jul 2025: 博士后,加州大学洛杉矶分校,洛杉矶。
  • Oct 2020~Feb 2022: 高级研究员,腾讯优图实验室,上海。
  • Sep 2018~Jan 2019: 研究实习生,松下研发中心,新加坡。
  • Sep 2017~Jun 2020: 博士生,南开大学,天津。
  • Jul 2016~Nov 2016: 研究实习生,腾讯优图实验室,上海。
  • Sep 2014~Jun 2017: 硕士生,上海大学,上海。
  • Sep 2010~Jun 2014: 本科生,上海大学,上海。

Publications:

  • Kai Zhao and Liting Ruan and Haoran Jiang and Xiaoqiang Zhu and Xianchao Zhang and Dan Zeng, "Beyond Predictive Resampling: Learning Input-Agnostic Downsampling for Efficient Aligned Vision Recognition", Proceedings of the AAAI Conference on Artificial Intelligence, 2026. (oral presentation, top 4.5%) [PDF [Google Scholar
  • Kai Zhao and Wubang Yuan and Zheng Wang and Guanyi Li and Xiaoqiang Zhu and Deng-ping Fan and Dan Zeng, "Open-Vocabulary Camouflaged Object Segmentation with Cascaded Vision Language Models", Computational Visual Media, 2025. (影响因子=18.3) DOI: 10.26599/CVM.2025.9450512  [PDF [Google Scholar
  • Kaifeng Pang and Kai Zhao* and Alex Ling Yu Hung and Haoxin Zheng and Ran Yan and Kyunghyun Sung, "NExpR: Neural Explicit Representation for fast arbitrary-scale medical image super-resolution", Computers in Biology and Medicine, 2025. (影响因子=7, 中科院 2 区)(* 通讯作者) DOI: 10.1016/j.compbiomed.2024.109354  [PDF [Google Scholar
  • Kai Zhao and Alex Ling Yu Hung and Kaifeng Pang and Haoxin Zheng and Kyunghyun Sung, "MRI Super-Resolution with Partial Diffusion Models", IEEE Transactions on Medical Imaging, 2024. (影响因子=11.3, 中科院 1 区, Top期刊) DOI: 10.1109/TMI.2024.3483109  [PDF [Google Scholar
  • Kai Zhao and Zuojie He and Alex Hung and Dan Zeng, "Dominant Shuffle: A Simple Yet Powerful Data Augmentation for Time-series Prediction", arXiv:2405.16456, 2024. [Google Scholar
  • Kai Zhao and Kaifeng Pang and Alex LingYu Hung and Haoxin Zheng and Ran Yan and Kyunghyun Sung, "A Deep Learning-Based Framework for Highly Accelerated Prostate MR Dispersion Imaging", Cancers, 2024. (影响因子=4.5, 中科院 3 区) DOI: 10.3390/cancers16172983  [PDF [Google Scholar
  • Alex Ling Yu Hung and Haoxin Zheng and Kai Zhao and Kaifeng Pang and Demetri Terzopoulos and Kyunghyun Sung, "Cross-Slice Attention and Evidential Critical Loss for Uncertainty-Aware Prostate Cancer Detection", International Conference on Medical Image Computing and Computer-Assisted Intervention, 2024. [Google Scholar
  • Kai Zhao and Tao Wang and Ruixin Zhang and Wei Shen, "Adaptive feature alignment for adversarial training", Pattern Recognition Letters, 2024. (影响因子=3.9, 中科院 3 区) DOI: j.patrec.2024.10.004  [PDF [Google Scholar
  • Alex Ling Yu Hung and Kai Zhao and Haoxin Zheng and Ran Yan and Steven S Raman and Demetri Terzopoulos and Kyunghyun Sung, "Med-cDiff: Conditional medical image generation with diffusion models", Bioengineering, 2023. [Google Scholar
  • Yating Xu and Kai Zhao and Liangang Zhang and Mengyao Zhu and Dan Zeng, "Hyperspectral anomaly detection with vision transformer and adversarial refinement", International Journal of Remote Sensing, 2023. [Google Scholar
  • Kai Zhao and Lei Shen and Yingyi Zhang and Chuhan Zhou and Tao Wang and Ruixin Zhang and Shouhong Ding and Wei Jia and Wei Shen, "B'ezierpalm: A free lunch for palmprint recognition", European Conference on Computer Vision, 2022. DOI: 10.1007/978-3-031-19778-9_2  [PDF [Google Scholar
  • Xuehui Wang and Kai Zhao and Ruixin Zhang and Shouhong Ding and Yan Wang and Wei Shen, "Contrastmask: Contrastive learning to segment every thing", Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022. [Google Scholar
  • Lei Shen and Yingyi Zhang and Kai Zhao* and Ruixin Zhang and Wei Shen, "Distribution alignment for cross-device palmprint recognition", Pattern Recognition, 2022. (影响因子=7.5, 中科院 1 区, Top期刊)(* 通讯作者) DOI: 10.1016/j.patcog.2022.108942  [PDF [Google Scholar
  • Jia Li and Junjie Zhang and Fansheng Chen and Kai Zhao and Dan Zeng, "Adaptive material matching for hyperspectral imagery destriping", IEEE Transactions on Geoscience and Remote Sensing, 2022. [Google Scholar
  • Kai Zhao and Xuehui Wang and Xingyu Chen and Ruixin Zhang and Wei Shen, "Rethinking mask heads for partially supervised instance segmentation", Neurocomputing, 2022. (影响因子=5.5, 中科院 2 区) DOI: 10.1016/j.neucom.2022.10.003  [PDF [Google Scholar
  • Kai Zhao and Qi Han and Chang-Bin Zhang and Jun Xu and Ming-Ming Cheng, "Deep hough transform for semantic line detection", IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021. (影响因子=20.8, 中科院 1 区, Top期刊) DOI: 10.1109/TPAMI.2021.3077129  [PDF [Google Scholar
  • Shang-Hua Gao and Ming-Ming Cheng and Kai Zhao and Xin-Yu Zhang and Ming-Hsuan Yang and Philip Torr, "Res2net: A new multi-scale backbone architecture", IEEE transactions on pattern analysis and machine intelligence, 2019. (影响因子=20.8, 中科院 1 区, Top期刊) [Google Scholar
  • Kai Zhao and Shanghua Gao and Wenguan Wang and Ming-Ming Cheng, "Optimizing the F-measure for threshold-free salient object detection", Proceedings of the IEEE/CVF international conference on computer vision, 2019. [PDF [Google Scholar
  • Kai Zhao and Jingyi Xu and Ming-Ming Cheng, "Regularface: Deep face recognition via exclusive regularization", Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, 2019. [PDF [Google Scholar
  • Wei Shen and Yilu Guo and Yan Wang and Kai Zhao and Bo Wang and Alan Yuille, "Deep differentiable random forests for age estimation", IEEE transactions on pattern analysis and machine intelligence, 2019. (影响因子=20.8, 中科院 1 区, Top期刊) [Google Scholar
  • Kai Zhao and Wei Shen and Shanghua Gao and Dandan Li and Ming-Ming Cheng, "Hi-Fi: Hierarchical Feature Integration for Skeleton Detection", Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence, 2018. DOI: 10.24963/ijcai.2018/166  [PDF [Google Scholar
  • Wei Shen and Yilu Guo and Yan Wang and Kai Zhao and Bo Wang and Alan L Yuille, "Deep regression forests for age estimation", Proceedings of the IEEE conference on computer vision and pattern recognition, 2018. [Google Scholar
  • Wei Shen and Kai Zhao and Yuan Jiang and Yan Wang and Xiang Bai and Alan Yuille, "Deepskeleton: Learning multi-task scale-associated deep side outputs for object skeleton extraction in natural images", IEEE Transactions on Image Processing, 2017. [Google Scholar
  • Wei Shen and Kai Zhao and Yilu Guo and Alan L Yuille, "Label distribution learning forests", Advances in neural information processing systems, 2017. [Google Scholar
  • Wei Shen and Kai Zhao and Yuan Jiang and Yan Wang and Zhijiang Zhang and Xiang Bai, "Object skeleton extraction in natural images by fusing scale-associated deep side outputs", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016. [Google Scholar

The list is generated from publications.bib. Please visit my Google Scholar for full publication list.

Academic Services:

  • 会议审稿: CVPR, ICCV, ECCV, ICML, ICLR, NeurIPS, AISTAT, ACCV
  • 期刊审稿: Nature Communications, IEEE TPAMI, IEEE TIP, IEEE TNNLS, IEEE TMM, Pattern Recognition
  • Guest Editor: MDPI Diagnostics

研究生入组与培养要求

新生入组要求

  1. 所有已确定录取的研究生(博士和硕士)须在暑期提前进组,参与科研项目并参加相关课程学习;实验室将协助解决暑期住宿安排。
  2. 本校保研学生的毕业设计须在实验室完成;外校保研学生如条件允许,也建议在实验室完成毕业设计,以便更好地融入科研工作。
  3. 考研学生在复试结束后可主动联系实验室参加组内面试。面试通过并确认入组意向后,其入组安排与外校保研学生相同,于大四暑期到校报到并参与实验室科研工作。

相关先修课程和书籍

所有研究生 必须 在入学第一学年结束前完成以下在线课程和教材的学习,通过考核后方可开展科研和学术论文写作。

  1. 动手学深度学习:教材+课程+代码
    必修
  2. 斯坦福-CS231n 深度学习和计算机视觉b站搬运中文讲解), 课程中的 Python numpy矩阵编程教程 也很重要,要跟着教程实践
    必修
  3. 斯坦福 CS229 机器学习(2018年秋季),(b站搬运
    必修
  4. 麻省理工学院-矩阵方法及其在信号处理和机器学习中的应用
    必修
  5. 麻省理工学院-计算机科学教育中缺失的一课中译版) 这门课边学边在实践中应用,重点了解“ Shell Tools and Scripting,Command-line Environment,Version Control (Git),Debugging and Profiling,Metaprogramming”这几个章节
    部分章节必修
  6. 斯坦福 CS234: 强化学习
    选修
  7. 计算机视觉中的多视角几何: 这是一本经典教材,有中翻版(但是翻译质量很一般), 建议直接读英文版或者中英对照; 做3D相关的学生必修,其它学生可选修。
    选修

对于申请阶段的保研和考研学生,如能提前修读并通过相关课程(尤其是 CS231n、CS229),将在导师遴选时获得优先考虑,该课程内容也是面试的重要参考。

研究生论文阅读基本要求

本规范用于指导研究生系统、深入、批判性地阅读高质量论文,培养独立科研判断力,并将论文阅读转化为可复用的研究能力与研究产出。

论文阅读的核心目标不是“看过”,而是逐步做到:读得懂、讲得清、用得上、能质疑

一、总体要求

论文阅读是科研训练的基本功,是从事科研工作的核心能力之一。 研究生应将系统、深入、批判性地阅读高质量论文作为日常科研工作的组成部分,与算法设计、代码实现和实验分析同等重要。

读论文的目的不仅是理解已有工作,更是形成“理解—评估—迁移—创新”的能力链条,最终服务于自身课题设计与学术论文写作。

二、论文选择要求

1. 论文来源

  • 计算机视觉与多模态:优先选取 CVPR、ICCV、ECCV、NeurIPS、ICLR、ICML 等顶会的 Oral 论文;
  • 医学影像与视觉分析相关:MICCAI、IEEE TMI、Medical Image Analysis,Nature Methods, Nature Communications, Nature Computational Sciences
  • 机器人与智能感知(涉及视觉):ICRA、IROS

Workshop 论文或未经同行评审的 arXiv 论文不建议作为主要阅读对象,仅可作为补充材料,并需明确其不确定性。

2. 论文质量

  • 原则上应选择近 3–5 年内发表的高质量论文,例如 Nature 系列子刊、伯克利/CMU/MIT/牛津等顶尖高校一流实验室的研究成果,以及顶级会议的 Oral 论文或 Best Paper 等具有代表性的工作。
  • 论文应具备清晰的问题定义、方法创新点和充分的实验验证。
  • 优先选择回答“为什么要做”和“为什么这样做”的工作。
  • 优先选择代码/数据集公开的工作。

三、阅读深度要求

1. 问题层(Why)

  • 论文解决的核心问题是什么,其研究背景和意义是什么。
  • 该问题在现有研究体系中的位置,以及现有方法的不足。

要求能够用 3–5 句话准确概括论文“在解决什么问题,以及为什么重要”。

2. 方法层(How)

  • 理解方法整体框架模块组成数据流, 重点理解各个模块的输入与输出,以及这些输入输出在计算机中的表示形式(例如,图像通常表示为尺寸为 HxWx3 的张量)。
  • 明确关键创新点及其设计动机
  • 说清方法与已有方法的本质差异。

3. 实验层(Evidence)

  • 实验设计是否合理,数据集和指标是否匹配研究目标。
  • 对比方法是否充分且公平。
  • 消融实验是否有效验证假设。
  • 代码和数据是否公开可得 。

4. 反思与延展(Critical Thinking)

  • 方法的隐含假设及可能失效的场景。
  • 计算复杂度、工程实现和实际应用限制。
  • 与自身研究方向的结合方式与潜在改进点。

四、阅读输出要求

  • 完成一次结构化的论文汇报(15–20 分钟)。
  • 形成可复用的阅读笔记(Markdown / LaTeX 等)。
  • 在条件允许的情况下进行方法复现或关键模块验证。

五、数量与频率要求

  • 硕士研究生:每周精读 1 篇,粗读 1-2 篇高质量论文。
  • 博士研究生:每周精读 1-2 篇,粗读2-4篇高质量论文,并形成方向性认识。

六、培养目标

通过系统的论文阅读训练,研究生应逐步具备判断论文价值、拆解复杂模型、设计实验验证假设以及提出自身研究问题的能力。

论文阅读的终点不是“理解别人”,而是“形成自己的研究判断力”。

指导过的学生 / 实习生

  • Katarina Chiam,UCLA,2023 级硕士生。
  • Sohaib Naim,UCLA,2022 级博士生。
  • 李润嘉,腾讯优图,实习生。去向:牛津大学 VGG 组博士。
  • 庞凯风,UCLA,2022 级硕士生。去向:UCLA 攻读博士。
  • Alex Hung,UCLA,2020 级博士生。
  • 郑昊昕,UCLA,2020 级博士生。去向:亚马逊。
  • 王雪辉,上海交通大学,2020 级博士生。
  • 高尚华,南开大学,2018 级博士生。去向:哈佛大学博士后。
School of Athens
The School of Athens.