首页 > 行业资讯 > Nat Commun|DIA 蛋白质组学和磷酸化蛋白质组学常用软件和分析工作流程的基准测试

Nat Commun|DIA 蛋白质组学和磷酸化蛋白质组学常用软件和分析工作流程的基准测试

时间:2023-06-07 来源: 浏览:

Nat Commun|DIA 蛋白质组学和磷酸化蛋白质组学常用软件和分析工作流程的基准测试

zhanghanqing 靶标发现与药物研发
靶标发现与药物研发

gh_81699510287f

文献阅读交流

收录于合集 #蛋白质组学 15个
大家好,今天给大家分享一篇 202 3 1 发表在 Nature Communications 上题目 “Benchmarking commonly used software suites and analysis workflows for DIA proteomics and phosphoproteomics” 的研究论文。文章的通讯作者是来自 上海科技大学 水雯箐研究员 水雯箐 课题组致力于运用生物质谱、蛋白质组学、生物信息学等手段 进行 新型配体发现与新药物靶点的挖掘。
研究 概要
研究人员建立了  DIA 基准数据集,模拟复杂背景下数千种蛋白质的调节,在 Orbitrap timsTOF 采集 。通过分析蛋白质组学数据 以及 磷酸化蛋白质组学数据,评估了四种常用的 DIA 软件( DIA-NN Spectronaut MaxDIA Skyline )。 研究结果提示  DIA-NN Spectronaut 在分析 DIA 蛋白质组学数据方面 具有 独特优势。
研究结果一: DIA 基准 实验设计

研究人员 制备了小鼠脑膜蛋白,以规定的比例掺入酵母蛋白质组背景中(图 1a )。每个基准样品都在五个过程重复 制备, DIA 模式下的 QE HF diaPASEF 模式下的 timsTOF Pro (图 1a )。 同时, 构建了三类库以使用每种软件工具进行测试(图 1b )。使用 FragPipe 从原始 DDA 数据生成通用库 。通过四种软件工具对通用库进行的数据分析建立了相同的评估基线。 Spectronaut MaxDIA Skyline 允许使用集成搜索引擎处理 DDA 数据,以生成特定于软件的 DDA 库。总的来说,利用四个软件与七个光谱库(一个通用库、三个特定软件的 DDA 依赖库和三个 DDA 独立库)相结合,从而产生 10 种不同的数据分析工作流程(图 1b )。

Fig. 1 | Schematic of the benchmarking experiment and DIA data analysis
workflows.
研究结果 蛋白质组鉴定性能

使用  DIA-NN Spectronaut MaxDIA Skyline (均为最新版本)来处理 HF 数据集。借助通用文库, DIA-NN Skyline Spectronaut 产生了小鼠膜蛋白质组( 4919-5173 种蛋白质),但 Skyline FDR 控制不足。借助特定于软件的 DDA 依赖库, Spectronaut 报告 5354 种小鼠蛋白质和 67,310 种肽获得了最高的覆盖率(图 2a )。当使用计算机库时, DIA-NN 通过报告 5186 种小鼠蛋白质和 51,313 种肽实现了最佳识别性能(图 2a )。计算机库的 DIA-NN 覆盖了通用文库本身鉴定的 94.3% 的蛋白质。 DIA-NN Spectronaut MaxDIA 获得了类似数量的每种蛋白质的肽,但密度图偏向 Skyline 的下端, Skyline 报告的肽鉴定最少(图 2b )。

研究结果 三: FDR 测试

研究人员 生成了一个预测的诱饵库,该库基于先前从拟南芥蛋白质组中鉴定的肽 肽段 。将这个诱饵库的增量部分( 10% 20% 50% 100% )附加到通用库中以创建一系列目标诱饵库,不仅可以评估 FDR ,还可以评估假阴性率 (FNR) 蛋白质组学鉴定。

计算了拟南芥蛋白质或 肽段 在所有用目标诱饵库识别的蛋白质或 肽段 中的百分比作为 FDR ,称为错误 ID 百分比。不控制蛋白质水平的 FDR DIA-NN Spectronaut 在处理这两个数据集时发挥了同样充分的 FDR 控制(在蛋白质和 肽段 水平上 <1.5% 0.32% ), DIA-NN 适度地优于 Spectronaut (图 2g )。当通过添加诱饵库的比例来扩大搜索空间时, DIA-NN 始终如一地恢复了 >98.1% 的小鼠和酵母蛋白以及超过 96.4% 肽段 ,这些 肽段 最初仅通过通用库从 HF 数据中识别出来(图 2h )。
 
Fig. 2 | Evaluation of proteome identification and FDR/FNR assessment.
研究结果 四: 生物环境中的 DIA 磷酸化蛋白质组学数据分析

为了在细胞信号研究中评估 DIA-NN Spectronaut 研究人员 进行了 TNF-α 诱导的磷酸化蛋白质组学实验,其中在不存在或存在 I-kappa-B 激酶抑制剂 TPCA 的情况下用 TNF-α 刺激 MCF-7 细胞 -1 (图 5a )。然后,在 QE HF-X timsTOF Pro 仪器上获取每个重复的 DIA DDA 数据。 DIA 数据集由两个软件工具处理,使用项目特定的 DDA 库或独立于 DDA 的库(图 5a )。

 

Fig. 5 | Comparison of DIA-NN and Spectronaut in TNF-α-induced phosphoproteomedata
analysis.
考虑到 TNF-α 诱导的信号转导,随后选择了上调的磷酸化位点( >1.5 倍变化, p < 0.05 )来评估对信号转导网络获得多少的生物学洞察力。在 HF-X 数据分析中,特定 DDA 库的 DIA-NN 产生了最多数量的上调位点( 183 个),而在 TIMS 数据分析中, Spectronaut directDIA 库产生了最多数量( 254 个) 。基于 TNF-α 诱导位点的信号通路分析揭示了每个分析工作流程概括已知 TNF-α 信号网络的能力 (图 5c
总结:

研究人员对 DIA 系统全面性的评估提示在进行 DIA 数据分析时 DIA-NN Spectronaut 表现尤为出色。 蛋白质组学基准数据分析中, Spectronaut 使用通用或 DDA 依赖库的蛋白质鉴定略多,但 同样  DIA-NN 使用 DDA 独立库产生了更高的蛋白质组覆盖率。此外, DIA-NN FDR/FNR 控制、量化准确性和精确度以及 DEP 检测的灵敏度和特异性方面比 Spectronaut 表现更好。

版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。
相关推荐