本组博士生杨君维联合华盛顿大学助理教授王晟、博士后肖之屏在国际顶尖人工智能期刊Nature Machine Intelligence
(简称NMI,该Nature子刊最新影响因子为18.8)上发表了题为:Poisoning medical knowledge using large language models 的研究论文。
论文开发了名为Scorpius的条件文本生成系统,该系统利用大模型为指定的药物-疾病关系对生成恶意文本。
论文发现,只需要一篇恶意文本就能显著误导推理系统对相应药物-疾病关系的认知。
同时,论文也提出了高效的防御手段来减少这种误导所产生的负面影响。 该论文获得
NMI当期封面推荐 ,获
美国医学信息协会2025年“转化生物信息学突破进展”奖
[论文简介][论文链接]
本组博士毕业生唐建领衔发表的论文Visualizing Large-scale and High-dimensional Data提出的 LargeVis 是一种基于LINE的高维数据可视化算法,比 t-SNE 更快更稳定而且有更好的可视化效果;获得WWW 2016 Best Paper nominee奖项。
[获奖链接][论文链接]
本组博士毕业生唐建领衔发表的论文LINE: Large-scale Information Network Embedding提出了高效的网络嵌入表征学习算法LINE,是图神经网络计算领域著名的算法,是WWW 2015被引最多论文(2026.3.30 谷歌学术引用超过7200余次)。获Test of Time时间检验奖。
[论文链接]
本组博士毕业生唐建领衔发表的论文Understanding the Limiting Factors of Topic Modeling via Posterior Contraction Analysis,获机器学习顶会 ICML 2014惟一的Best Paper[获奖链接]。论文开创性地将后验收缩理论应用于主题模型;严格证明了主题模型的极限性能受限于先验分布;量化分析了关键参数对模型性能的具体影响。
[论文链接]
本组校友丁宏骏、本组博士研究生陈滨琪等人合作发表用于公式化 Alpha 挖掘的全面且高效评估框架论文。论文作者包含丁宏骏,陈滨琪,黄进晟,郭泰安,毛正阳,Guoyi Shao,邹鲁童,刘卢琛,张铭等。
Hongjun Ding, Binqi Chen, Jinsheng Huang, Taian Guo, Zhengyang Mao, Guoyi Shao, Lutong Zou, Luchen Liu, Ming Zhang.
AlphaEval: A Comprehensive and Efficient Evaluation Framework for Formula Alpha Mining.
我组在机器学习领域顶会 ICML 2026 有四篇论文上榜。 (ICML 2026 共收到近23,918篇投稿,录用率为26.6%)
[相关链接] 其中:
本组博士研究生赵禹昇等人合作发表面向带噪图学习的双标准语义同质性与动态优化框架论文。论文作者包含赵禹昇,谢佳晔,张岐鑫,张为知,罗霄,肖之屏,俞士纶,张铭等。
Yusheng Zhao, Jiaye Xie, Qixin Zhang, Weizhi Zhang, Xiao Luo, Zhiping Xiao, Shilun Yu, Ming Zhang.
DREAM: Dual-Standard Semantic Homogeneity with Dynamic Optimization for Graph Learning with Label Noise.
本组硕转博研究生李厚润等人合作发表面向公平感知图自适应的因果表征解耦与结构对齐框架论文。论文作者包含李厚润,王一帆,冉清华,罗钧宇,肖之屏,杨加,周昌令,琚玮,罗霄,张铭等。
Hourun Li, Yifan Wang, Qinghua Ran, Junyu Luo, Zhiping Xiao, Jia Yang, Changling Zhou, Wei Ju, Xiao Luo, Ming Zhang.
CELL: A Causal Perspective for Fairness-aware Graph Adaptation.
本组校友琚玮等人合作发表通过影响矛盾识别和纠正标签噪声实现鲁棒图神经网络的论文。论文作者包含琚玮,张唯,易思宇,毛正阳,王一帆,袁境阳,肖之屏,乔子越,张铭等。
Wei Ju, Wei Zhang, Siyu Yi, Zhengyang Mao, Yifan Wang, Jingyang Yuan, Zhiping Xiao, Ziyue Qiao, Ming Zhang.
Identifying and Correcting Label Noise for Robust GNNs via Influence Contradiction.
本组本科生袁子烨等人合作发表面向多模态大模型 OCR 的特征融合架构与图像重建式诊断方法论文。论文作者包含袁子烨,姚汝昌,郑诚信,赵禹昇,董大祥,张铭等。
Ziye Yuan, Ruchang Yao, Chengxin Zheng, Yusheng Zhao, Daxiang Dong, Ming Zhang.
Detached Skip-Links and R-Probe: Decoupling Feature Aggregation from Gradient Propagation for MLLM OCR.
我组在自然语言处理顶会 ACL 2026 有三篇论文上榜。 (ACL 2026 共收到近12148篇投稿,主会录用率为19%)
[相关链接] 其中:
本组博士研究生刘成武等人合作发表面向 Lean 4 困难模式自动化定理证明的智能体框架论文。论文作者包含刘成武,尹伊淳,袁野,谢佳璇,李博涛,李思齐,沈剑豪,徐妍,尚利峰,张铭等。
Chengwu Liu, Yichun Yin, Ye Yuan, Jiaxuan Xie, Botao Li, Siqi Li, Jianhao Shen, Yan Xu, Lifeng Shang, Ming Zhang.
Discover and Prove: An Open-source Agentic Framework for Hard Mode Automated Theorem Proving in Lean 4.
本组博士研究生顾怿洋等人合作发表面向大语言模型科学能力的定制化评估框架论文。论文作者包含顾怿洋,杨君维,罗钧宇,袁野,冯斌,夏应策,解曙方,刘凯丽,吴伯涵,施琪,李浩然,肖贝儿,肖之屏,罗霄,张为知,俞士纶,刘泽群,张铭等。
Yiyang Gu, Junwei Yang, Junyu Luo, Ye Yuan, Bin Feng, Yingce Xia, Shufang Xie, Kaili Liu, Bohan Wu, Qi Shi, Haoran Li, Beier Xiao, Zhiping Xiao, Xiao Luo, Weizhi Zhang, Philip S. Yu, Zequn Liu, Ming Zhang.
SciCustom: A Framework for Custom Evaluation of Scientific Capabilities in Large Language Models.
本组校友罗霄等人合作发表数据稀缺环境下大语言模型强化学习综述论文。该工作系统探讨了在数据受限条件下提升大语言模型强化学习能力的关键问题与解决方案。
Xiao Luo et al.
A Survey of Reinforcement Learning for Large Language Models under Data Scarcity: Challenges and Solutions.
我组在自然语言处理顶会 ICLR 2026 有五篇论文上榜。(ICLR 2026 共收到近19000篇投稿,录用率为28.18%)
[相关链接] 其中:
本组博士研究生陈滨琪等人合作发表基于生成流网络(GFlowNets)的结构感知量化因子挖掘方法论文。
论文作者包含陈滨琪,丁宏骏,沈宁,郭泰安,黄进晟,刘卢琛,张铭等。
Binqi Chen, Hongjun Ding, Ning Shen, Taian Guo, Jinsheng Huang, Luchen Liu, Ming Zhang.
AlphaSAGE: Structure-Aware Alpha Mining via GFlowNets for Robust Exploration.[论文链接]
本组博士研究生顾怿洋等人合作发表面向部分标签图学习的关系推断方法论文。
论文作者包含顾怿洋,吴文睿,覃义方,郭泰安,者韬,唐嘉如,肖之屏,张为知,乔子越,琚玮,王东杰,罗霄,俞士纶,张铭等。
Yiyang Gu, Wenrui Wu, Yifang Qin, Taian Guo, Tao Zhe, Jiaru Tang, Zhiping Xiao, Weizhi Zhang, Ziyue Qiao, Wei Ju, Dongjie Wang, Xiao Luo, Philip S. Yu, Ming Zhang.
PRISM: Partial-label Relational Inference with Spatial and Spectral Cues.[论文链接]
本组博士研究生罗钧宇等人合作发表基于层次化共形校准的不确定性感知自适应散列方法论文。
论文作者包含罗钧宇,黄进晟,徐洋,邹鲁童,罗霄,吴伯涵,王一帆,琚玮,张铭等。
Junyu Luo, Jinsheng Huang, Yang Xu, Lutong Zou, Xiao Luo, Bohan Wu, Yifan Wang, Wei Ju, Ming Zhang.
COLA: Conformalized Hierarchical Calibration for Uncertainty-Aware Adaptive Hashing.
[论文链接]
本组校友肖之屏和博士研究生罗钧宇等人合作发表基于层级编码树与模态混合的跨模态散列方法论文。
论文作者包含肖之屏,罗钧宇,周航,赵禹昇,罗霄,王鹏云,琚玮,Siyu Heng,张铭等。
Zhiping Xiao, Junyu Luo, Hang Zhou, Yusheng Zhao, Xiao Luo, Pengyun Wang, Wei Ju, Siyu Heng, Ming Zhang.
HINT: Hierarchical Encoding Tree with Modality Mixup for Cross-modal Hashing.
[论文链接]
本组校友肖之屏和博士研究生赵禹昇等人合作发表面向大模型强化学习的关键样本无监督发现方法论文。
论文作者包含肖之屏,赵禹昇,张岐鑫,谢佳晔,赵万佳,张为知,罗霄,俞士纶,张铭等。
Zhiping Xiao, Yusheng Zhao, Qixin Zhang, Jiaye Xie, Wanjia Zhao, Weizhi Zhang, Xiao Luo, Philip S. Yu, Ming Zhang.
Sample Lottery: Unsupervised Discovery of Critical Instances in RLVR of LLMs.[论文链接]
我组在自然语言处理顶会 WWW 2026 有三篇论文上榜。(WWW 2026 共收到3370篇投稿,最终仅录用676篇,录用率约为20.1%)
[相关链接] 其中:
本组博士研究生罗钧宇等人合作发表基于空间参数进化的图模型持续学习方法论文。论文作者包含罗钧宇,欧阳子绚,罗霄,李厚润,肖之屏,王一帆,张铭等。
Junyu Luo, Zixuan Ouyang, Xiao Luo, Hourun Li, Zhiping Xiao, Yifan Wang, Ming Zhang. Space-based Parameter Evolving with Lightweight Optimization for Graph Adaptation to Evolving Shifts.
本组校友和硕士研究生毛正阳等人合作发表融合证据专家的图级别长尾分类方法论文。论文作者包含琚玮,易思宇,毛正阳,覃义方,王一帆,肖之屏,付艺伟,乔子越,张铭等。
Wei Ju, Siyu Yi, Zhengyang Mao, Yifang Qin, Yifan Wang, Zhiping Xiao, Yiwei Fu, Ziyue Qiao, Ming Zhang. Long-Tailed Recognition of Evidential Experts for Graph-level Classification.
[论文链接]
本组校友王一帆、博士研究生赵禹昇等人合作发表基于核增强潜在子结构学习的图分布外检测方法论文。论文作者包含王一帆,张皓东,肖之屏,赵禹昇,易思宇,尹楠,刘新旺,张铭,琚玮等。
Yifan Wang, Haodong Zhang, Zhiping Xiao, Yusheng Zhao, Siyu Yi, Nan Yin, Xinwang Liu, Ming Zhang, Wei Ju. KEGOD: Kernel-enhanced Latent Substructure Learning for Graph Out-Of-Distribution Detection.
本组博士研究生刘成武、博士研究生袁野等人合作发表大语言模型中的数学推理增强方法的主会论文。作者包含刘成武,袁野、尹伊淳、张铭等。
Chengwu Liu, Ye Yuan, Yichun Yin, Yan Xu, Xin Xu, Zaoyu Chen, Lifeng Shang, Qun Liu, Ming Zhang. Safe: Enhancing Mathematical Reasoning in Large Language Models via Retrospective Step-aware Formal Verification.
[论文链接][代码][数据集]
本组硕转博研究生赵禹昇等人合作发表基于大语言模型的交通流量预测方法的Findings论文。论文作者包含赵禹昇,罗霄,肖之屏,琚玮,张铭等。
Yusheng Zhao, Xiao Luo, Haomin Wen, Zhiping Xiao, Wei Ju, Ming Zhang. Embracing Large Language Models in Traffic Flow Forecasting.[论文链接]
张铭老师团队于 ICML2025 共有四篇高质量论文发表(ICML2025 共收到12107篇投稿,其中3260篇被接受,接受率为26.9%)。
[相关报道] 其中:
本组博士生郑康杰、杨君维等人合作发表的ExLM: Rethinking the Impact of [MASK] Tokens in Masked Language Models
提出了一种新颖的增强上下文ExLM,在输入上下文中扩展“[MASK]”标记,并对这些扩展状态之间的依赖关系进行建模。
这种增强提高了上下文容量,使模型能够捕获更丰富的语义信息,从而在预训练期间有效缓解了损坏的语义问题。
[论文链接]
本组硕转博研究生赵禹昇等人合作发表的Test-time Adaptation on Graphs via Adaptive Subgraph-based Selection and Regularized Prototypes
提出了一种名为基于自适应子图选择和正则化原型监督ASSESS新方法,用于图上的可靠测试时适应。
采用了一种基于细粒度个体级子图互信息的自适应选择策略,而且从训练良好的模型中构建语义原型作为未知训练图的先验知识并根据未标记的测试图优化后验。
本组博士生罗钧宇等人合作发表的Sparse Causal Discovery with Generative Intervention for Unsupervised Graph Domain Adaptation
提出了一种通过稀疏因果建模和动态干预机制实现稳定图表示迁移的新方法。
在本组实习的北京大学计算中心硕士生李厚润联合对外经济贸易大学助理教授王一帆发表的DANCE: Dual Unbiased Expansion with Group-acquired Alignment for Out-of-distribution Graph Fairness Learning
提出了一种名为 DANCE模型,用于在分布偏移下进行图公平性学习。其核心思想是在图形和隐藏空间中生成具有挑战性但无偏见的虚拟图形数据,从以数据为中心的视图模拟分布变化。
本组博士生黄进晟等人在NAACL 2025合作发表论文MMEvalPro: Calibrating Multimodal Benchmarks Towards Trustworthy and Efficient
Evaluation。
论文创新性地推出了MMEVALPRO,一个专门用于检验多模态大模型性能的全新评估框架。初步实验验证显示,当前市场上备受推崇的多模态大模型在MMEVALPRO的严格审视下,其实际实力远未达到公众普遍预期的高度。
相比现有的评估数据集,MMEVALPRO设定了更为严苛的考验门槛。根据实验结果,目前表现最优的大语言模型(LMM)在MMEVALPRO上的表现与人类水平之间存在31.73%的显著差距,而这一差距在此前的基准测试中仅被估测为8.03%。此外,LLM和LMM在MMEVALPRO上的性能差距也远超过原始评测数据集,突显了新基准在甄别模型真正多模态理解能力方面的高要求与可信性。
[项目主页][论文简介][论文链接][GitHub][数据集]
张铭老师团队于 AAAI2025 共有五篇高质量论文发表(AAAI2025 共收到12957篇投稿,其中3032篇被接受,接受率为23.4%)。
[相关报道] 其中:
本组硕转博研究生赵禹昇、博士生罗钧宇等人合作发表的TRACI: A Data-centric Approach for Multi-Domain Generalization on
Graphs提出了从数据驱动的角度,生成虚拟对抗性和混合图样本,以增强GNN的泛化能力。
本组硕转博研究生赵禹昇、博士生黄进晟、袁境阳等人合作发表的Attention Bootstrapping for Multi-modal Test-time Adaptation
提出了提出了一种名为ABPEM的新方法,核心思想是解决“注意力差距”问题,即模态内部的自注意力和模态间的交叉注意力之间的差异。
[论文链接]
本组博士生覃义方、本科生谢佳璇等人合作发表的GeoMamba: Towards Multi-granular POI Recommendation with Geographical State Space
Model
改进了线性SSM中利用的HiPPO近似算子,并引入了一种新颖的GaPPO算子,将模型的状态空间扩展到基于图表示的地理域。
[论文链接]
在本组实习的北京大学计算中心硕士生李厚润等人合作发表的DisCo: Graph-Based Disentangled Contrastive Learning for Cold-Start
Cross-Domain Recommendation提出了一种名为 DisCo
的新型基于图的去耦对比学习框架。该框架旨在通过捕获用户的细粒度意图表示,并过滤源域中不相关的信息,来有效解决冷启动跨域推荐中的负迁移问题。
[论文链接]