11月12日下午,学院邀请北京大学马尽文教授、张树义高级工程师到院作主题为《大语言模型在数学性能上的挑战与发展》、《高性能集群的搭建、开发与管理》的学术报告,报告会由学院执行院长韩道军主持。报告会在学院603会议室举行,学院教师和研究生参加了本次报告会。
报告会上,马尽文分析了大语言模型(LLM)所面临的数学计算、推荐和大模型专业化发展所面临的问题和挑战,并介绍了改进的方法和策略。在提升数学推理能力上,马尽文提出了基于图形形式化强化的多模态大模型,能够进行有效的几何问题解答。在大模型的专业化方面,构建了针对国资委企业的专业化大模型,为专业化发展开辟了新的途径。
报告会第二阶段,张树义深入解析了高性能集群计算的关键技术,包括异构系统的处理、Ansible批量操作、调度系统更换以及分区管理,介绍了在不同操作系统上登陆集群的方法、Jupyter-notebook的使用、个人虚拟环境的创建,以及程序监控工具的应用。最后,张树义分享了AI在科研体系重构中的应用,如AlphaFold2和DeepMD的突破性进展。
专家简介:
马尽文,北京大学数学科学学院信息科学系系主任,教授、博士生导师。研究领域包括神经网络、模式识别、机器学习、计算机视觉、智能信息处理等。目前已发表学术论文300余篇,其中60余篇发表在国际核心期刊和国际顶级会议上,被引用4500余次。在高斯混合模型的参数学习和自适应模型选择方面建立了一套系统的理论和有效的学习算法,并被广泛地应用于聚类分析、模型识别和图像处理等领域。先后主持国家自然科学基金项目8项、国家重大或重点研发计划课题4项。担任中国电子学会会士、中国电子学会信号处理分会副主任委员、国际信息科学学会中国分会教育信息化专委会主任委员、中国工业与应用数学学会理事、《Mathematical Computation》、《Computerized Medical Imaging and Graphics》、《Mathematics》、《信号处理》等杂志主编、副主编、客座编辑及编委,入选斯坦福大学发布的2020全球前2%顶尖科学家“生涯影响力”榜单。
张树义,高级工程师,北京大学数学科学学院中心实验室主任,IT 办公室主任,国际信息研究学会中国分会教育信息化专业委员会秘书长,科技部、财政部、北京市信息化评审专家。