PGA¶

简介¶

基于质谱（MS）的蛋白质组学数据通常是通过将实验质谱与从参考蛋白数据库中获得的理论质谱进行比较来进行肽鉴定来实现的，但是，这种策略不能识别新的肽和蛋白质序列。PGA提供了基于RNA-Seq数据构建定制蛋白质数据库的功能，有/没有基因组引导，数据库搜索，后处理和报告生成。这种定制的蛋白质数据库既包括参考数据库（如Refseq或ENSEMBL）也包括形成RNA-Seq的新型肽序列数据。一般来说，定制的蛋白质数据库包括以下四种新肽（或蛋白质）：1）单核苷酸变异（SNV）引起的肽；2）短插入和删除（INDEL）引起的肽；3）选择性剪接引起的肽；4）新的转录本编码肽。此外，PGA还可以用于基于RNA-Seq数据从头组装的转录本序列创建蛋白质组学数据库。这种蛋白质组学数据库的构建策略在非模式生物的蛋白质组学研究中非常有用。

使用方法¶

singularity exec /dssg/share/imgs/pga/pga_1.15.4.sif R