CV
张长旺,他是CCF理论计算机科学专业委员会常务委员,他是OPPO研究院AI智能体检索技术负责人。 他分别于2011年和2015年获得伦敦大学学院(UCL)的硕士和博士学位。 他2016年至2017年在阿里巴巴从事LBS数据挖掘,2018年至2022年在腾讯从事广告推荐和用户画像,2022年至2024年在华为从事推荐广告和大模型智能体。
张长旺目前的研究方向是AI检索(RAG、多模态、搜推广),AI智能体(意图识别、智能体框架),AI大模型(大推理模型R1/O1)。 他曾多次担任人工智能会议AAAI高级程序委员会(SPC)成员。
张长旺的研究受到了众多媒体的关注,并被英国卫报和每日邮报报道。他曾获得腾讯研发卓越金奖、腾讯运营卓越奖、腾讯开源协作奖、腾讯微创新奖、2012实验室总裁奖、最佳技术规划奖等。 他面试了300多名应聘者,包括应届毕业生和有社招员工。他曾担任腾讯线下校园招聘官方技术面试官及演讲嘉宾。
我们提出OThink-MR1(论文 报道)多模态推理模型和框架, 这一技术使业界突破多模态泛化推理能力。我们提出GRPO-D动态强化学习算法,GRPO-D在多模态任务评估中展现出了卓越的跨任务泛化能力,相较于监督微调(SFT)平均实现了超过 61.63% 的相对性能提升。
我们提出EulerFormer模型(SIGIR’24, 论文 报道),通过复数注意力网络+自适应旋转位置编码,显著提升Transformer模型表达能力和鲁棒性。EulerFormer提供了一个统一的理论框架,用于统一语义信息和位置信息,从而在序列建模中具有更强的表达能力。在EulerFormer中,token之间的语义差异和位置差异都可以直接建模为复向量的统一旋转形式。与之前的方法(如RoPE)相比,EulerFormer 对语义变化更加鲁棒,并具有更优越的理论性质(如可控远程距离衰减)。
我们提出了PoseCrafter(ECCV’24,论文 报道),这是一种可以精确控制灵活姿势的个性化视频生成的方法。利用Stable Diffusion和ControlNet框架,我们精心设计了一个推理方案,无需依赖对应的真实帧,就可以生成高质量个性化数字人动作视频。我们通过包含面部和手部标志的仿射变换矩阵进行直接潜变量编辑。跨多个数据集的全面实验表明,PoseCrafter在8个广泛使用的指标上优于在大量视频上预先训练的基准线。此外,PoseCrafter能够同时遵循来自各种个人或人工编辑的姿势,并在开放域训练视频中保持人类身份。
张长旺提出了首个基于ChatGPT的自然语言开发框架PromptAppGPT:全自动编译、运行、界面生成。PromptAppGPT大大降低了GPT应用开发的门槛,任何人都可以用低代码开发类似AutoGPT的应用。PromptAppGPT已经被众多高影响力的媒体报道,包括中国顶级的人工智能媒体:新智元1, 新智元2。
我们欢迎:
- 加入我们,共同开发这个框架:https://github.com/mleoking/PromptAppGPT/
- 访问网站试用该框架:https://promptappgpt.wangzhishi.net/
- 查看示例应用程序,包括类似AutoGPT的AI自动助手的70行低代码实现:https://github.com/mleoking/PromptAppGPT/blob/main/PagApps.md#my-autogpt
联系方式: mleoking {at 去除} qq.com
研究员招聘和资助: 我们正在寻找优秀的、积极进取的学生和研究人员,共同致力于信息检索(搜推广)、自然语言处理和大数据挖掘的研究和应用。 请将您的简历和项目通过电子邮件发送给我。
微信公众号: 请关注《旺知识》公众号,获得更多中文AI讲座、采访、研发经验。
教育背景
- 2011: 跨学科(包括计算机科学)硕士,伦敦大学学院
- 2015: 跨学科(包括计算机科学)博士,伦敦大学学院
工作经历
- 2024.08 - : 技术主管@OPPO研究院
- AI检索(RAG、多模态、搜推广),AI智能体(意图识别、智能体框架),AI大模型(大推理模型R1/O1)
- 2022.05 - 2024.08: 技术专家@华为
- 推荐广告和大模型智能体。
- 2018.01 - 2022.05: 高级研究员@腾讯
- 广告推荐和用户画像
- 2016.06-2017.12:算法专家@阿里巴巴
- 地理位置 (LBS) 数据挖掘和应用
社会服务
- CCF理论计算机科学技术委员会常务委员
- AAAI人工智能会议(AAAI-23)高级程序委员会(SPC)委员
- AAAI人工智能会议(AAAI-24)高级程序委员会(SPC)委员
- 腾讯线下校园招聘官方技术宣讲官
- 腾讯犀鸟精英人才计划信息检索方向导师
代表文章
- B Wang, F Liu, J Chen, X Lou, C Zhang, J Wang, Y Sun, Y Feng, C Chen, C Wang. MSL: Not All Tokens Are What You Need for Tuning LLM as a Recommender. ACM SIGIR Conference on Research and Development in Information Retrieval, 2025. (SIGIR 2025) (CCF A) (pdf code)
- B Gan, Y Zhao, T Zhang, J Huang, Y Li, S X Teo, C Zhang, W Shi. MASTER: A Multi-Agent System with LLM Specialized MCTS. North American Chapter of the Association for Computational Linguistics, 2025. (NAACL 2025) (CCF B) (pdf code)
- R Feng, Z Tian, Q Peng, J Mao, X Zhao, D Hu, C Zhang. MGIPF: Multi-Granularity Interest Prediction Framework for Personalized Recommendation. ACM SIGIR Conference on Research and Development in Information Retrieval, 2025. (SIGIR 2025) (CCF A) (pdf code)
- H Huang, X Lou, C Zhang, C Chen, K Dong, F Lu, H Lei, Y Wang, W Zhou, J Wang. Training-free Periodic Interest Augmentation in Incremental Recommendation. ACM SIGIR Conference on Research and Development in Information Retrieval, 2025. (SIGIR 2025) (CCF A) (pdf code)
- Z Tian, W Zhao, C Zhang, X Zhao, Z Ma, J Wen. EulerFormer: Sequential User Behavior Modeling with Complex Vector Attention. ACM SIGIR Conference on Research and Development in Information Retrieval, 2024. (SIGIR 2024) (CCF A) (pdf code)
- Y Zhong, M Zhao, Z You, X Yu, C Zhang, C Li. PoseCrafter: One-Shot Personalized Video Synthesis Following Flexible Pose Control, 2024. (ECCV 2024) (CCF B) (pdf code)
- Y Ye, Z Li, Z Dou, Y Zhu, C Zhang, S Wu, Z Cao. Learning from the Wisdom of Crowds: Exploiting Similar Sessions for Session Search. Proceedings of the AAAI Conference on Artificial Intelligence, 2023. (AAAI 2023) (CCF A) (pdf code)
- P Zhang, S Wang, L Li, C Zhang, X Liu, E Zhu, Z Liu, L Zhou, L Luo. Let the Data Choose: Flexible and Diverse Anchor Graph Fusion for Scalable Multi-View Clustering. Proceedings of the AAAI Conference on Artificial Intelligence, 2023. (AAAI 2023) (CCF A) (pdf code)
- Z Zheng, C Zhang, X Gao, G Chen. HIEN: Hierarchical Intention Embedding Network for Click-Through Rate Prediction. ACM SIGIR Conference on Research and Development in Information Retrieval, 2022. (SIGIR 2022) (CCF A) (pdf code)
- W Tu, S Zhou, X Liu, Y Liu, Z Cai, E Zhu, C Zhang, J Cheng. Initializing Then Refining: A Simple Graph Attribute Imputation Network. International Joint Conference on Artificial Intelligence (IJCAI), 2022. (IJCAI 2022) (CCF A) (pdf code)
- S Liu, S Wang, P Zhang, K Xu, X Liu, C Zhang, F Gao. Efficient one-pass multi-view subspace clustering with consensus anchors. Proceedings of the AAAI Conference on Artificial Intelligence, 2022. (AAAI 2022) (CCF A) (pdf code)
- Y Zhang, X Liu, J Liu, S Dai, C Zhang, K Xu, E Zhu. Fusion Multiple Kernel K-means. Proceedings of the AAAI Conference on Artificial Intelligence, 2022. (AAAI 2022) (CCF A) (pdf code)
- C Zhang, S Wang, J Liu, S Zhou, P Zhang, X Liu, E Zhu, C Zhang. Multi-view Clustering via Deep Matrix Factorization and Partition Alignment. ACM International Conference on Multimedia, 2021. (ACMMM 2021) (CCF A) (pdf code)
- S Zhou, X Liu, M Li, E Zhu, L Liu, C Zhang, J Yin. Multiple kernel clustering with neighbor-kernel subspace segmentation. IEEE transactions on neural networks and learning systems, 2019. (TNNLS 2019) (CCF B) (pdf code)
- C Zhang, S Zhou, E Groppelli, P Pellegrino, I Williams, P Borrow, B M. Chain, C Jolly. Hybrid Spreading Mechanisms and T Cell Activation Shape the Dynamics of HIV-1 Infection. PLOS Computational Biology, 2015. (PLoS Comput. Biol. 2015) (CCF B) (pdf code)
代表报道
- 业界突破多模态泛化推理能力,OPPO研究院&港科广提出OThink-MR1技术, 量子位, 2025.
- 真低代码!首个基于ChatGPT的自然语言开发框架PromptAppGPT:全自动编译、运行、界面生成, 新智元, 2023.
- PromptAppGPT重磅更新!AI助手0门槛开发+运行:几十行代码即可实现AutoGPT, 新智元, 2023.
- 2023年人工智能体(AI Agent)开发与应用全面调研:概念、原理、开发、应用、挑战、展望, 旺知识, 2024.
- AFSPP唤醒智能体内心世界:首个支持心理学实验的AI Agent偏好性格塑造框架发布!, 旺知识, 2024.
- 高级检索增强生成技术(RAG)全面指南:原理、分块、编码、索引、微调、Agent、展望, 旺知识, 2024.
- HIV spreads like computer worms, say scientists, 卫报(The Guardian), 2015.
- HIV spreads like a computer worm: Researchers find virus mimics an online infection - and warn early detection is key, 每日邮报(Daily Mail), 2015.