CV
张长旺,高级研究员,CCF理论计算机科学专业委员会常务委员。 他分别于2011年和2015年获得伦敦大学学院(UCL)的硕士和博士学位。 他2016年至2017年在阿里巴巴从事LBS数据挖掘,2018年至2022年在腾讯从事广告推荐和用户画像。
张长旺目前的研究方向是信息检索(搜索, 推荐, 广告)、生成式AI(LLM, Agent, RAG)、大数据挖掘的研究与应用。 他曾多次担任人工智能会议AAAI高级程序委员会(SPC)成员。
张长旺的研究受到了众多媒体的关注,并被英国卫报和每日邮报报道。他曾获得腾讯研发卓越金奖、腾讯运营卓越奖、腾讯开源协作奖、腾讯微创新奖等。 在腾讯和阿里巴巴,他面试了200多名应聘者,包括应届毕业生和有社招员工。他曾担任腾讯线下校园招聘官方技术面试官及演讲嘉宾。
我们提出EulerFormer模型(SIGIR’24, 论文 报道),通过复数注意力网络+自适应旋转位置编码,显著提升Transformer模型表达能力和鲁棒性。EulerFormer提供了一个统一的理论框架,用于统一语义信息和位置信息,从而在序列建模中具有更强的表达能力。在EulerFormer中,token之间的语义差异和位置差异都可以直接建模为复向量的统一旋转形式。与之前的方法(如RoPE)相比,EulerFormer 对语义变化更加鲁棒,并具有更优越的理论性质(如可控远程距离衰减)。
我们提出了PoseCrafter(ECCV’24,论文 报道),这是一种可以精确控制灵活姿势的个性化视频生成的方法。利用Stable Diffusion和ControlNet框架,我们精心设计了一个推理方案,无需依赖对应的真实帧,就可以生成高质量个性化数字人动作视频。我们通过包含面部和手部标志的仿射变换矩阵进行直接潜变量编辑。跨多个数据集的全面实验表明,PoseCrafter在8个广泛使用的指标上优于在大量视频上预先训练的基准线。此外,PoseCrafter能够同时遵循来自各种个人或人工编辑的姿势,并在开放域训练视频中保持人类身份。
张长旺提出了首个基于ChatGPT的自然语言开发框架PromptAppGPT:全自动编译、运行、界面生成。PromptAppGPT大大降低了GPT应用开发的门槛,任何人都可以用低代码开发类似AutoGPT的应用。PromptAppGPT已经被众多高影响力的媒体报道,包括中国顶级的人工智能媒体:新智元1, 新智元2。
我们欢迎:
- 加入我们,共同开发这个框架:https://github.com/mleoking/PromptAppGPT/
- 访问网站试用该框架:https://promptappgpt.wangzhishi.net/
- 查看示例应用程序,包括类似AutoGPT的AI自动助手的70行低代码实现:https://github.com/mleoking/PromptAppGPT/blob/main/PagApps.md#my-autogpt
联系方式: mleoking {at 去除} qq.com
研究员招聘和资助: 我们正在寻找优秀的、积极进取的学生和研究人员,共同致力于信息检索(搜推广)、自然语言处理和大数据挖掘的研究和应用。 请将您的简历和项目通过电子邮件发送给我。
微信公众号: 请关注《旺知识》公众号,获得更多中文AI讲座、采访、研发经验。
教育背景
- 2011: 跨学科(包括计算机科学)硕士,伦敦大学学院
- 2015: 跨学科(包括计算机科学)博士,伦敦大学学院
工作经历
- 2018.01 - : 高级研究员@腾讯
- 广告推荐和用户画像
- 2016.06-2017.12:算法专家@阿里巴巴
- 地理位置 (LBS) 数据挖掘和应用
社会服务
- CCF理论计算机科学技术委员会常务委员
- AAAI人工智能会议(AAAI-23)高级程序委员会(SPC)委员
- AAAI人工智能会议(AAAI-24)高级程序委员会(SPC)委员
- 腾讯线下校园招聘官方技术宣讲官
- 腾讯犀鸟精英人才计划信息检索方向导师
代表文章
- Z Tian, W Zhao, C Zhang, X Zhao, Z Ma, J Wen. EulerFormer: Sequential User Behavior Modeling with Complex Vector Attention. ACM SIGIR Conference on Research and Development in Information Retrieval, 2024. (SIGIR 2024) (CCF A) (pdf code)
- Y Zhong, M Zhao, Z You, X Yu, C Zhang, C Li. PoseCrafter: One-Shot Personalized Video Synthesis Following Flexible Pose Control, 2024. (ECCV 2024) (CCF B) (pdf code)
- Y Ye, Z Li, Z Dou, Y Zhu, C Zhang, S Wu, Z Cao. Learning from the Wisdom of Crowds: Exploiting Similar Sessions for Session Search. Proceedings of the AAAI Conference on Artificial Intelligence, 2023. (AAAI 2023) (CCF A) (pdf code)
- P Zhang, S Wang, L Li, C Zhang, X Liu, E Zhu, Z Liu, L Zhou, L Luo. Let the Data Choose: Flexible and Diverse Anchor Graph Fusion for Scalable Multi-View Clustering. Proceedings of the AAAI Conference on Artificial Intelligence, 2023. (AAAI 2023) (CCF A) (pdf code)
- Z Zheng, C Zhang, X Gao, G Chen. HIEN: Hierarchical Intention Embedding Network for Click-Through Rate Prediction. ACM SIGIR Conference on Research and Development in Information Retrieval, 2022. (SIGIR 2022) (CCF A) (pdf code)
- W Tu, S Zhou, X Liu, Y Liu, Z Cai, E Zhu, C Zhang, J Cheng. Initializing Then Refining: A Simple Graph Attribute Imputation Network. International Joint Conference on Artificial Intelligence (IJCAI), 2022. (IJCAI 2022) (CCF A) (pdf code)
- S Liu, S Wang, P Zhang, K Xu, X Liu, C Zhang, F Gao. Efficient one-pass multi-view subspace clustering with consensus anchors. Proceedings of the AAAI Conference on Artificial Intelligence, 2022. (AAAI 2022) (CCF A) (pdf code)
- Y Zhang, X Liu, J Liu, S Dai, C Zhang, K Xu, E Zhu. Fusion Multiple Kernel K-means. Proceedings of the AAAI Conference on Artificial Intelligence, 2022. (AAAI 2022) (CCF A) (pdf code)
- C Zhang, S Wang, J Liu, S Zhou, P Zhang, X Liu, E Zhu, C Zhang. Multi-view Clustering via Deep Matrix Factorization and Partition Alignment. ACM International Conference on Multimedia, 2021. (ACMMM 2021) (CCF A) (pdf code)
- S Zhou, X Liu, M Li, E Zhu, L Liu, C Zhang, J Yin. Multiple kernel clustering with neighbor-kernel subspace segmentation. IEEE transactions on neural networks and learning systems, 2019. (TNNLS 2019) (CCF B) (pdf code)
- C Zhang, S Zhou, E Groppelli, P Pellegrino, I Williams, P Borrow, B M. Chain, C Jolly. Hybrid Spreading Mechanisms and T Cell Activation Shape the Dynamics of HIV-1 Infection. PLOS Computational Biology, 2015. (PLoS Comput. Biol. 2015) (CCF B) (pdf code)
代表报道
- 真低代码!首个基于ChatGPT的自然语言开发框架PromptAppGPT:全自动编译、运行、界面生成, 新智元, 2023.
- PromptAppGPT重磅更新!AI助手0门槛开发+运行:几十行代码即可实现AutoGPT, 新智元, 2023.
- 2023年人工智能体(AI Agent)开发与应用全面调研:概念、原理、开发、应用、挑战、展望, 旺知识, 2024.
- AFSPP唤醒智能体内心世界:首个支持心理学实验的AI Agent偏好性格塑造框架发布!, 旺知识, 2024.
- 高级检索增强生成技术(RAG)全面指南:原理、分块、编码、索引、微调、Agent、展望, 旺知识, 2024.
- HIV spreads like computer worms, say scientists, 卫报(The Guardian), 2015.
- HIV spreads like a computer worm: Researchers find virus mimics an online infection - and warn early detection is key, 每日邮报(Daily Mail), 2015.