CV
教育经历 Education
- Ph.D in CS, Waseda University, 2021 - 2024
- 指导教授: 酒井哲也 (Prof. Tetsuya Sakai)
- 副指导教授:亀山 渉 (Prof. Wataru Kameyama)
- 客座学生指导教授: 杨余久 (Prof. Yujiu Yang)
- 研究方向: 基础大模型(大多模态模型,大语言模型), 人类价值观对齐。
- Thesis: Towards Building a DIKW Pyramid for Conversational Systems
- M.S. in CS, Waseda University, 2019 - 2021
- 指导教授: 酒井哲也 (Tetsuya Sakai)
- 研究方向:自然语言处理,多模态。
- Thesis: Learning Multimodal Interaction Representations from Trilinear Transformers for Visual Question Answering
- B.S. in CS, Waseda University, 2015 - 2019
- 指导教授: 酒井哲也 (Tetsuya Sakai)
- Thesis: Toxic Comment Classification Challenge based on CNN, RNN and BERT
履历 Employment History
- 2025.01 - Present: 博士后
- 清华大学
- 指导老师: 杨余久 (Prof. Yujiu Yang)
- 研究方向: 可控生成, 具身智能
- 2023.10 - 2024.02: 研究助理
- Hong Kong University of Science and Technology (HKUST)
- 指导老师: 付杰
- 科研合作, 助团队管理, 日常事务
- 2021.05 - 2021.10: 算法实习生
- 粤港澳大湾区数字经济研究院 CCNL-认知计算与自然语言研究中心
- 指导老师: 张家兴, 甘如饴
- 主要工作内容:致力于研究AIGC相关的基础模型,比如,统一的语言模型、多模态大模型。如,太乙系列大模型,二郎神系列等。
- Paper:https://arxiv.org/abs/2209.02970
- Github: Fengshenbang-LM
- Huggingface: https://huggingface.co/IDEA-CCNL
- 2021.05 - 2021.10: 策略算法实习生
- 深圳市腾讯计算机系统有限公司 CDG-广告产品技术部
- 指导老师: 杨建博
- 主要工作内容:多模态广告推荐相关的研究 (多模态图神经网络, 已中ACM MM 2022)
专业服务 Professional Services
审稿员
- 会议: SIGIR, ACL, EMNLP, ACM MM, CVPR, CoLM
- 期刊: TCSVT
组织者
这个任务主要是即时网络搜索(即针对给定的搜索主题进行网页的排名检索),其中包括中文和英文子任务。任务的目标是量化网络搜索技术的进步(以搜索引擎结果页面“首屏”的质量为标准),并解决可重复性(即某个研究小组X报告的结果能否在相同数据上被研究小组Y复现)和可再现性(即某个研究小组X报告的结果能否在不同数据上被研究小组Y再现)的问题。
该任务包含两个子任务:Web搜索(WS)子任务和对话式搜索(CS)子任务。主要研究问题:对于那些不如其他实体知名但同样相关的实体,能否在搜索结果中给予应有的曝光度?即,任务不仅关注相关性,还关注从多个角度确保搜索结果的公平曝光。与上一届(NTCIR-17 Fair Web-1)的主要区别:WS子任务新增了可复现性(reproducibility)要求。CS子任务是新引入的,用于处理文本对话场景下的搜索。目标:推动公平信息检索和推荐,鼓励参与者从不同视角考虑搜索公平性。
教程讲师 (Tutorial Speaker)
特邀作者
- 2023.04 - 2024.02: Readpaper
- 论文阅读,学术趋势等
Publications
Details in Publications Page
Talks
SIGIR-AP 2023 in Beijing
Conference proceedings talk at SIGIR-AP 2023, Beijing, China
Large Models bridge the Digital-Real World Gap: from Understanding to Generation
Tutorial at 2023 International Conference on Neural Computing for Advanced Applications, Hefei, China
首个中文Stable Diffusion模型背后的技术:IDEA研究院封神榜团队揭秘
Talk at 机器之心, online
IDEA研究院原作团队解读封神榜体系:致力于成为中文认知智能的基础设施
Talk at 机器之心, online
MOOC 证书
主要是大一和大二期间获得的MOOC证书,约40张
Language
- 中文 / 英语 / 粤语 / 日语