曾文锋博士

教师团队曾文锋博士

曾文锋博士

Wen-Feng Zeng, Ph.D.

计算多维蛋白质组学（FennOmix）实验室

联系

邮箱: zengwenfeng@westlake.edu.cn

网站: https://fennomix.com/

曾文锋博士

Wen-Feng Zeng, Ph.D.

计算多维蛋白质组学（FennOmix）实验室

联系

邮箱: zengwenfeng@westlake.edu.cn

网站: https://fennomix.com/

“在西湖大学提供的这块试验田上，去追求我们原以为难以企及的目标。”

个人简介

曾文锋，1988年生，福建霞浦人。曾文锋博士2010年毕业于西安电子科技大学软件工程专业；2017年毕业于中科院计算技术研究所，获得博士学位；之后担任计算所助理研究员；2020年加入德国马克斯普朗克-生物化学研究所Matthias Mann实验室从事博士后研究工作。曾参与国家重点研发计划，担任子课题负责人。以通讯作者或第一作者身份在Nature Methods、Nature Communications、Cell Systems等SCI刊物上发表了论文十余篇论文。2021年被杂志Journal of Proteome Research评选为“40-under-40 Rising Stars in Proteomics and Metabolomics”。曾文锋博士现已加入西湖大学，受聘应急医学研究中心和工学院，任助理教授。

学术成果

曾文锋课题组主要从事基于质谱技术的计算蛋白质组学和糖蛋白质组学。开发了糖蛋白质搜索引擎pGlyco系列，和肽段谱图等属性预测的深度学习模型pDeep与软件AlphaPeptDeep。pGlyco系列在领域内率先提出糖链鉴定的质控问题并提出使用诱饵糖链的算法进行糖链质控，解决了糖肽鉴定的精度问题；接着提出了“糖链离子倒排索引”的快速糖肽检索算法，解决了速度问题。pDeep系列是国际上首个使用深度学习进行肽段理论谱图预测的模型；后来AlphaPeptDeep框架将模型拓展到任意肽段属性预测问题上。曾文锋博士已在SCI杂志上发表论文共计30余篇，包括Nature Methods等十余篇通讯作者或者第一作者的论文。现担任BMC Bioinformatics编委，并担任Nature Methods、Nature Communications、Nature Machine Intelligence和Journal of Proteome Research等期刊的特约审稿人。

代表论文（#代表第一作者，*代表通信作者）

1.Wen-Feng Zeng^#,*, Wei-Qian Cao, Ming-Qi Liu, Si-Min He, Peng-Yuan Yang. Precise, fast and comprehensive analysis of intact glycopeptides and modified glycans with pGlyco3. Nature Methods 18, 1515-1523 (2021).

2. Wen-Feng Zeng^#, Xie-Xuan Zhou, Sander Willems, Constantin Ammar, Maria Wahle, Isabell Bludau, Eugenia Voytik, Maximillian T. Strauss & Matthias Mann^*. AlphaPeptDeep: a modular deep learning framework to predict peptide properties for proteomics. Nature Communications 13, 7238 (2022).

3. Ching Tarn^*, Wen-Feng Zeng^#,*. pDeep3: Toward More Accurate Spectrum Prediction with Fast Few-Shot Learning. Analytical Chemistry 93 (14), 5815-5822.

4. Matthias Mann^*, Chanchal Kumar^*, Wen-Feng Zeng^*, Maximilian T.

Strauss^*. Artificial intelligence for proteomics and biomarker discovery. Cell Systems 12 (8), 759-770 (2021).

5. Bo Wen^#,*, Wen-Feng Zeng^#, Yuxing Liao, Zhiao Shi, Sara R. Savage, Wen Jiang, Bing Zhang^*. Deep Learning in Proteomics. Proteomics 20 (21-22), 1900335.

6. Wen-Feng Zeng^#,*, Xie-Xuan Zhou, Wen-Jing Zhou, Hao Chi, Jianfeng Zhan, and Si-Min He. MS/MS Spectrum Prediction for Modified Peptides Using pDeep2 Trained by Transfer Learning. Analytical Chemistry 91 (15), 9724-9731 (2019).

7. Siyuan Kong^#, Pengyun Gong^#, Wen-Feng Zeng^#, Biyun Jiang^#, Xinhang Hou, Yang Zhang, Huanhuan Zhao, Mingqi Liu, Guoquan Yan, Xinwen Zhou, Xihua Qiao, Mengxi Wu, Pengyuan Yang, Chao Liu^*, Weiqian Cao^*. pGlycoQuant with a deep residual network for quantitative glycoproteomics at intact glycopeptide level. Nature Communications 13, 7539 (2022).

8. Ming-Qi Liu^#, Wen-Feng Zeng^#,Pan Fang^#, Wei-Qian Cao^#, Cao Liu^#, Guo-Quan Yan, Yang Zhang, Chao Peng, Jian-Qiang Wu, Xiao-Jin Zhang, Hui-Jun Tu, Hao Chi, Rui-Xiang Sun, Yong Cao, Meng-Qiu Dong, Bi-Yun Jiang, Jiang-Ming Huang, Hua-Li Shen, Catherine CL Wong^*, Si-Min He^*, Peng-Yuan Yang^*. pGlyco 2.0 enables precision N-glycoproteomics with comprehensive quality control and one-step mass spectrometry for intact glycopeptide identification. Nature Communications , 438 (2017).

9. Wen-Feng Zeng^#, Ming-Qi Liu^#, Yang Zhang^#, Jian-Qiang Wu^#, Pan Fang, Chao Peng, Aiying Nie, Guoquan Yan, Weiqian Cao, Chao Liu, Hao Chi, Rui-Xiang Sun, Catherine CL Wong, Si-Min He^*, Pengyuan Yang^*. pGlyco: a pipeline for the identification of intact N-glycopeptides by using HCD- and CID-MS/MS and MS3. Scientific Reports 6, 25102 (2016).

10. Xie-Xuan Zhou^#, Wen-Feng Zeng^#, Hao Chi, Chunjie Luo, Chao Liu, Jianfeng Zhan^*, Si-Min He^*, Zhifei Zhang^*. pDeep: Predicting MS/MS Spectra of Peptides with Deep Learning. Analytical Chemistry 89 (23), 12690-12697 (2017).

联系方式

电子邮箱：zengwenfeng@westlake.edu.cn

蛋白质是基因翻译而来，是细胞功能的主要执行者，因此蛋白质组学在生物标志物发现、药物研发和免疫治疗等研究中起着关键作用。由于蛋白质翻译在个体间存在可变剪切等差异，并且蛋白质会被磷酸和多糖等化学基团修饰，导致蛋白质分析的复杂度非常高。质谱技术是目前对蛋白质组和翻译后修饰进行大规模分析的主要手段，而如何从质谱数据中解析出蛋白质组定性和定量的信息，是目前蛋白质搜索引擎的主要任务。曾文锋课题组的主要研究方向为深度学习或人工智能驱动的蛋白质和糖蛋白质搜索引擎，包括：

1、兼容AI模型的开源搜索引擎框架

与网页搜索引擎类似，蛋白质搜索引擎也包括数据库构建、索引、匹配打分、过滤和定量等环节。此框架的主要目标是能够兼容不同环节的AI模型。框架的接口主要用Python开发，内核将用Numba和C/C++/Rust等工具进行开发，不仅保证搜索引擎的搜索速度，也能方便生化背景的研究人员使用此框架。

2、针对搜索引擎不同环节的AI模型开发

对于某些蛋白质组学问题，传统的蛋白质搜索引擎存在局限性，而引入AI有机会解决这些问题。例如，传统算法在处理免疫肽组问题上存在灵敏度和速度问题，AlphaPeptDeep的工作证明了免疫肽预测能够完成解决灵敏度和速度问题。实际上，还有很多类似的问题可以通过AI进行解决，例如糖蛋白质组学。而利用上述搜索引擎框架，这些AI模型能够“即插即用”地嵌入到搜索引擎中，开发人员仅需要关注AI模型的开发本身。

3、利用AI引擎解决实际蛋白质组学问题

在完成AI引擎后，曾文锋课题组也会围绕一些蛋白质组学问题开展大规模数据分析的工作，包括搭建大规模糖蛋白质组和免疫肽组等分析的干湿结合的平台等。

针对上述三大方向，课题组诚聘对AI for Scinece感兴趣的计算机相关、人工智能和数据分析刚兴趣的博士后、博士生、研究助理和实习生，也诚招对软件开发和AI感兴趣的生物和化学等“湿实验”背景的博士后、博士生、研究助理和实习生。课题组旨在为生化背景的学者提供软件开发/AI设计的学习研发平台，并且为计算机相关专业的学者提供与用户紧密结合的实际应用场景，从而培养面向未来交叉学科的“两栖”科学家。欢迎联系。