【摘要】 土壤和沉积物微生物具有高度的系统发育多样性,但目前在公共分子数据库中的代表性不足。
土壤和沉积物微生物具有高度的系统发育多样性,但目前在公共分子数据库中的代表性不足。它们通过宏蛋白质组学的功能表征通常使用为同一样本获得的宏基因组序列进行。然而,如此多样化的宏基因组数据集很难组装。同时,通用数据库中可用的分离株的理论蛋白质组是高质量的。这两个因素都提倡在宏蛋白质组学解释管道中使用理论蛋白质组。在这里,我们研究了许多数据库构建策略,以增加对土壤样品进行的宏蛋白质组学研究的输出。当使用公共或特定样本的宏基因组学衍生数据库时,发现肽谱匹配的数量具有可比性。然而,当在两步级联搜索中结合使用两种类型的信息时,数量会显着增加。我们的数据还表明,可以通过组合使用两种类型的数据库来最大化元蛋白质组学数据集的功能注释。结合样本特定宏基因组数据库和公共数据库(如非冗余 NCBI 数据库和大量土壤基因目录)的两步策略允许在分配光谱的比率和功能衍生信息的检索方面最大化宏蛋白质组学解释。当在两步级联搜索中使用两种类型信息的组合时,数字显着增加。我们的数据还表明,可以通过组合使用两种类型的数据库来最大化元蛋白质组学数据集的功能注释。结合特定样本宏基因组数据库和公共数据库(如非冗余 NCBI 数据库和大量土壤基因目录)的两步策略允许在分配光谱的比率和功能衍生信息的检索方面最大化宏蛋白质组学解释。当在两步级联搜索中使用两种类型信息的组合时,数字显着增加。我们的数据还表明,可以通过组合使用两种类型的数据库来最大化元蛋白质组学数据集的功能注释。结合特定样本宏基因组数据库和公共数据库(如非冗余 NCBI 数据库和大量土壤基因目录)的两步策略允许在分配光谱的比率和功能衍生信息的检索方面最大化宏蛋白质组学解释。
科学指南针是互联网+科技服务平台,500多家检测机构,提供近5万种设备和服务项目,涵盖生物医药、智能硬件、化学化工等多个领域,由专业人员1对1跟踪服务,保证检测质量与效率。







您已经拒绝加入团体

