Large Models and Graph Structures

Friday, Aug. 23, 2024

Session: Large Models and Graph Structures

Time: 1:30 p.m. — 3:00 p.m.

Location: Weizhen Building，Ziyou Campus，Northeast Normal University（东北师范大学自由校区惟真楼）

Session Chair: Zhewei Wei

Large Models and Graph Structures

Jun Zhu

Department of Computer Science, Tsinghua University

Title: 扩散概率模型的前沿进展

Abstract: AIGC发展迅速，扩散概率模型是AIGC的关键技术之一，在跨模态的文图生成、3D生成、视频生成等方面取得显著进展。该报告将介绍扩散概率模型的若干进展，包括扩散概率模型的基础理论和高效算法、大规模多模态扩散模型、文到3D生成、文到视频生成等内容。

CV: 个人简介：朱军，清华大学计算机系博世AI教授、清华大学人工智能研究院副院长、IEEE/AAAI Fellow。2001到2009年获清华大学计算机学士和博士学位，之后在CMU做博士后和项目科学家，2011年回清华任教，2015到2018年任卡内基梅隆大学兼职教授。主要从事机器学习基础理论、高效算法及应用研究，在国际重要期刊与会议发表论文百余篇。担任顶级期刊IEEE TPAMI的副主编和编委、AI编委，担任ICML、NeurIPS、ICLR、IJCAI、AAAI等国际会议的资深领域主席、地区联合主席、评奖委员会委员、研讨会主席等20余次。获求是杰出青年奖、科学探索奖、吴文俊人工智能自然科学一等奖、CCF自然科学一等奖、ICLR杰出论文奖、ICME/IEEE CoG最佳论文奖等，入选国家高层次人才计划、MIT TR35中国先锋者以及IEEE Intelligent Systems评选的“AI’s 10 to Watch”。研制Vidu视频大模型，以及开源的“珠算”深度概率编程库和“天授”强化学习库。

Ruihua Song

College of Artificial Intelligence, Renmin University of China

Title: 做活的AI

Abstract: 人之所以为人，在认识世界、创造新知、与人与世界交互方面有独特之处。在这个讲座中，我会介绍多模态理解、创作和交互方向最新的研究成果，梳理通用人工智能领域发展的脉络，并探讨做一个活的AI还差什么，图灵测试是否已经过时，如果过时应该用什么来取代等有趣的问题。

CV: 宋睿华博士，国家高层次人才特聘教授，现任中国人民大学高瓴人工智能学院长聘副教授。曾任微软亚洲研究院主管研究员、微软小冰首席科学家。近期研究兴趣为多模态理解、创作和交互。发表学术论文100余篇，申请专利30余项。曾获WWW 2004最佳论文提名奖，AIRS 2012最佳论文奖，和CLWS 2019优秀论文奖，2022年度教育部自然科学一等奖。她的算法完成了人类史上第一本人工智能创作的诗集《阳光失了玻璃窗》。2021-2022年作为学术带头人，发布文澜系列中文多模态对齐大模型，并成功落地快手、OPPO等企业。2023年，参与发布玉兰大语言模型，完成从基础模型到对话模型的自研训练。曾担任SIGIR短文和讲习班主席，ACL的领域主席，EMNLP的资深领域主席，和Information Retrieval Journal的主编。

Di He

Peking University Intelligent College

Title: 是否所有大模型都具备思维链涌现能力？

Abstract: 国内外有许多研究工作提出多种Transformer的高效变体，但对于众多模型变体，有许多问题需要回答：这些变体模型是否存在理论缺陷？面临具体实际问题时模型结构应当如何选择？到底哪些变体模型能真正完美地取代Transformer？最近的研究发现，思维链（Chain-of-Thought）提示（CoT）可以显著提高大型语言模型（LLMs）的性能，特别是在处理涉及数学或推理的复杂任务。尽管经验上取得了巨大的成功，但CoT背后的机制以及它如何发挥LLMs的潜力仍然难以捉摸。是不是所有大模型都具备思维链推理能力？这种能力是如何涌现的？在这个talk中，我们首次尝试在理论上回答这些问题，并展示不同模型（高效Transformer v.s. 标准Transformer）的能力上限差异。

CV: 贺笛，北京大学智能学院助理教授，前微软亚洲研究院主管研究员。主要从事机器学习模型、算法与理论方向的研究工作，已发表ICML、NeurIPS、ICLR等重要期刊/会议论文50余篇，谷歌引用数超过8000，指导学生2次在图神经网络国际顶级评测竞赛上取得冠军。所设计的模型、算法多次被DeepMind、OpenAI、微软、Meta等国际顶尖研究机构使用。获得机器学习顶级国际会议ICLR 2023杰出论文奖。