标记基因(标记基因筛选原理)
7月7日 霸王亭投稿 标记基因(标记基因筛选原理)
KYangYuLiu。(2021)。Challengesinbenchmarkingmetagenomicprofilers。NatureMethods,doi:https:doi。org10。1038s41592021011413
随着越来越多的研究揭示出微生物组与人体健康的密切关系,宏基因组测序尤其是全宏基因组鸟枪法测序(wholemetagenomesequencing,WMS)作为微生物组学最重要的研究手段之一被学术界、工业界广泛使用。为了解读高通量WMS数据,许多用于物种分类的生物信息学工具被开发出来,而这其中能够避免拼接等繁重计算任务的MetaPhlAn、Kraken、PathSeq等在大量宏基因组研究种被应用。但是目前在正确评价和使用这些生信工具以及解读相应的输出结果方面并没有引起足够的重视。比如,不同工具的输出结果之间具有很大的差异,研究人员往往将其归因于不同工具所用数据库的差别。但是我们发现,不同生信工具输出的丰度类型存在根本性的差别,是生信工具之间分析结果差异产生的本质原因之一。忽视和混淆这一丰度类型的差别,将改变生信工具性能评价的结果,并深刻影响对宏基因组测序数据的解读。另外,该问题也会严重阻碍荟萃研究,影响跨研究之间结果的可比性,并导致微生物组研究在临床医学转化上的困难。
2021年5月13日,哈佛大学医学院刘洋彧团队与加州大学圣地亚哥分校RobKnight团队在NatureMethods上发表了题为ChallengesinBenchmarkingMetagenomicProfilers的论文。该研究通过数据模拟,对宏基因组物种分类工具的输出结果进行了深度解读,创造性的提出了基于不同丰度类型(基于序列或基于物种分类相对丰度)的双重评价标准,为解决微生物组研究中如何选择宏基因组学物种分类工具的问题提供了重要依据,也对微生物组标准化研究提出了一系列建设性的意见。
模式图:基于物种分类(标记基因,如MetaPhlAn2)和基于序列方法(如Kraken2)对物种分类定量产生巨大差异,主要受微生物基因组大小影响。
在宏基因组测序分析中,序列(sequence)丰度和物种(taxonomic)丰度是两种截然不同的相对丰度类型。前者序列(sequence)丰度是计算属于某一物种经过测序后的DNA在整个菌群DNA中的百分比,而后者物种(taxonomic)丰度则代表某一物种的个体数量在菌群总个体数中的百分比。宏基因组学物种分类工具可根据其使用数据库的类型而分为三类:DNAtoDNA,DNAtoProtein,DNAtoMarker。通过设计一个简单的模拟菌群,我们发现不同类型工具输出的相对丰度类型并不统一,比如DNAtoDNA方法的(代表软件Kraken和Bracken)输出丰度类型为序列丰度,而DNAtoMarker方法的(代表软件MetaPhlAn和mOTUs)输出的丰度类型为物种丰度(如下图1所示)。
图1。三种物种定量方法的比较。a。模式图;b。两种基因组的模拟群落;c。不同软件定量的结果。
通过模拟数据,研究人员将序列丰度和物种丰度分别作为金标准,对不同的宏基因组学物种分类工具进行评价,结果发现,在以序列丰度为金标准时,DNAtoDNA方法的表现优于DNAtoMarker方法,而在以物种丰度为金标准时,结果则相反。因此,物种分类软件的表现与测评时作为金标准的相对丰度类型有很大关系。
混淆序列丰度与物种丰度会对宏基因组数据的解读产生四个方面的重要影响:
1。在解析物种构成方面:如果使用序列丰度作为解读标准,将高估大基因组物种并且低估小基因组物种在菌群中的真实数量。在复杂的菌群中,微生物基因组的大小存在很大的差别,只在细菌内部,理论上基因组的差别就可以达到100倍,而跨物种(如病毒和真菌)微生物基因组的差别更无法估量。理解序列丰度和物种丰度,对临床诊断病原菌过程中如何设置阈值十分关键。
2。在alpha多样性方面:与使用物种丰度相比较,如果使用序列丰度作为解读标准,将会整体上降低样本的alpha多样性(Shannon,SimpsonandPielou’sevennessindex),但这一改变并不是严格一致的,部分样本的alpha多样性反而会升高。在当前宏基因组研究受样本量局限的情况下,这将会导致微生物样本alpha多样性的排序混乱,进而影响到alpha多样性在个体和组间比较的一致性和可重复性。
3。在beta多样性方面:通过设计模拟菌群,我们基于不同beta多样性分析方法(BC,rJSD,L1,L2,rAD)比较了以两种不同相对丰度为基础的样本间关系,通过检验我们发现序列丰度所描述的样本间关系与物种丰度所描述的样本间关系存在差别,相关性为0。510。94。因此,以不同生信工具输出结果为下游分析起点,可能得到不同的样本间或组间关系。
4。在排列分析(ordinationanalysis)方面:排列分析是宏基因组常用的分析手段,通过将N维的物种构成数据降低到两维或者三维来比较和展示个体或组间的差异。对于同一批样本,基于序列丰度和基于物种丰度的排列分析所产生的结果相差很大,无论是NDMS,PCoA,tSNE或UMAP方法所产生的二维散点图,其经过一致性分析后,都表现出很大的差异性。也就是说,在基于不同生信工具所产生的下游分析中,有可能发生组间差异无法重复的情况。
本文通过严谨的论证分析,量化了宏基因组学物种分类工具所产生的两种相对丰度类型的差别,对于混淆两种丰度所产生的影响进行了全面系统地研究。由于存在大量未知微生物基因组和多倍体信息缺失等原因,将物种丰度与序列丰度之间进行转换存在现实难度,往往无法达到预期目标,因此选择合适的宏基因组学物种分类工具十分关键。目前无论是DNAtoDNA方法(以Kraken为代表,产生序列丰度)还是DNAtoMarker方法(以MetaPhlAn为代表,产生物种丰度),都是宏基因组研究中的重要工具,并且已经被应用于大量研究中。虽然在方法一致的前提下,丰度的差别不会影响到同一个实验中组间的比较,但这不可避免地影响了诸多已发表的微生物组相关研究结论的可解读性,也将为回顾性的荟萃分析带来极大的挑战。因此我们呼吁微生物领域研究人员审慎解读宏基因组测序结果,严格区分相对丰度类型,重新审视过往基于序列丰度的研究结论。鉴于物种丰度更具生物学和生态学意义,我们也建议大家开发更多基于DNAtoMarker方法的宏基因组学物种分类工具。
本文第一作者是哈佛大学医学院的孙政博士和加州大学圣地亚哥分校的黄适博士。RobKnight教授和刘洋彧教授为本文的通讯作者。
图2。对不同界的物种对序列和分类两种定量结果的相关分析
图3。使用Bracken、Kraken2、mOTUs2和MetaPhlAn2共4种软件对模拟群落不同估计方法定量结果的评测。
图4。基于序列和物种丰度计算Alpha多样性
图5。对两种定量方法结果在不同样本类型上的排序分析。
投诉 评论 电脑耗电量是多少(主机耗电量是多少)一台电脑正常情况下开机运行24小时大概用电在三四度至七八度电的范围内,根据使用环境和使用状态不同而浮动。前面有文章专门介绍过电脑具体功耗情况,这里只讲运行状态和使用环境的……
肖邦的简介(肖邦个人资料)肖邦的简介(肖邦个人资料)位于华沙西南方、距离华沙仅60公里的热拉佐瓦沃拉,是许多人前往波兰的必游之地。之所以要去这个名字非常拗口的地方,是因为肖邦于1810年在这里诞生……
标记基因(标记基因筛选原理)标记基因(标记基因筛选原理)KYangYuLiu。(2021)。Challengesinbenchmarkingmetagenomicprofilers……
双向dcdc变换器(大功率dcdc)双向dcdc变换器(大功率dcdc)古瑞瓦特发现,2021年储能市场异常火爆,包括山东、山西、新疆、内蒙古、安徽及西藏等十几个省份,相继出台相关文件要求光伏、风电等新能源……
ao什么意思(男人说的ao是什么意思)【文观察者网专栏作者王若愚】5月10日晚,香港特区行政长官林郑月娥接受央视《新闻11》节目访问,与主持人白岩松视频连线。被问及特区政府正与中国内地部门商讨加强香港公……
钢笔哪里有卖(重庆钢笔专卖店)马云远在美国也为员工结婚着想,钢笔匠人为客人着想之心,也是一样的。在上海静安区的东新民路上,有家你路过几乎一笔带过不会注意到的小店,可这家小店的店主可以说是上海市提起来没……
生态养殖鸡(生态放养鸡如何调教?)生态养殖鸡(生态放养鸡如何调教?)喂料饮水的调教喂料和饮水的调教应在育雏时开始。一般以一种特殊的声音作为信号,持续时间可长可短。生产中多用吹口哨和敲击金属物品。每次……
草莓酱可以放多久(草莓酱过期了还没开封能吃吗)草莓鲜美红嫩,果肉多汁、酸甜可口,果味浓郁,营养也是非常的丰富,属于色香味俱佳的果品。草莓是人体必需的纤维素、铁、钾、维生素C和黄酮类等成分的重要来源,这些营养素对生长发育有很……
直播在哪里找(怎么去直播间看直播间)天猫和淘宝一样,是阿里旗下的电商平台。而和淘宝不同的是,天猫主要面向的是中高端消费人群,更加注重品质。因此,天猫平台的入驻和其他环节都会更加严格。直播又是如今最为热门的内容营销……
奇骏和crv哪个好(开crv和奇骏哪个比较有档次)本田CRV和日产奇骏是本田和日产两个品牌全球战略车型,在其它国家市场,两款车也有着几乎一致的销售成绩。既然两款车都作为各自品牌的战略车型而备受期待,两款车到底谁主沉浮,该如何选……
木的字有哪些字(包含水木的有什么字)名字和我们的五行是密切相关的,那么五行缺水缺木的男孩起什么名字好呢?小编今日整理了一组水木组合的取名字男孩,一起来看看吧荣平五行属木的字(荣)五行属水的字(平)与之搭配意为:荣……
雪花为什么是六边形(为什么有的雪花五个角)小雪节气已至,近日,大家的社交软件是否都被北方大雪刷屏了呢?今天,让我们一起来探寻雪花的奥秘吧!郊行值雪诗庾信(南北朝)风云俱惨惨,原……
多少期付款(花呗3期是多少天)现在我们出门在外消费,扫码支付已经成了一种习惯性行为,对于经常使用支付宝的小伙伴们来说,用花呗支付更是成为了一种常态。支付宝发布的《年轻人消费生活报告》显示,中国近1。7……
腰部怎么锻炼(健身练腰9个动作图片)腰部肌肉,它位于下背部,底部有腰椎,向下与臀部肌肉衔接,它的强弱会直接影响背部的稳定性,还会影响个人体态。如果腰部力量太弱,会造成骨盆前倾,产生下背部酸痛以及腰椎损伤。那……
商标r和tm的区别(r标识和tm的标志区别)在我们的日常生活中,可以看到很多很多品牌的商标,通过商标我们可以区别出商品服务的来源。一些细心的朋友可能会发现,商标与商标之间存在小小的差别,比如有的商标会在右上角标注字……
什么叫营销(营销通俗点讲是什么意思)什么是故事营销?故事营销是这世界上最伟大最厉害的营销方法之一。所有的大企业、名人大咖都有己自的故事。《金刚经》《塔木德》《圣经》里面部全是故事,他们都在用使一个手法,就是……
2024年奥运会在哪个国家举办(冬奥会2022年在哪里举办)新京报讯(记者谢莲)东京时间7月23日20点(北京时间7月23日19点),2020年东京奥运会将在日本首都东京新国立竞技场正式开幕。东京奥运会主场馆新国立竞技场。ICph……
怎么回事(老是想睡觉,总觉得睡不够)在如今各种压力的不断影响下,很多人都出现了睡眠问题,其中嗜睡症的存在给患者的身心健康造成了极大危害。患者总是觉得自己睡不够,每天都在不断的补充睡眠,却没有多大效果,反而越睡越困……
找工作上什么网站(找工作网上哪个网站)央视315晚会点名曝光智联招聘、猎聘网求职者简历被售卖问题,引发社会。昨日,北京青年报记者从北京市人力资源和社会保障局获悉,该局已对两家涉事企业开展立案调查。昨日,人力资源和社……
说说吃鸡神器哪个好近日有关于吃鸡神器哪个好的问题受到了很多网友们的关注,大多数网友都想要知道网友们需要吃鸡神器哪个好问题的具体情况,那么关于到网友们需要吃鸡神器哪个好问题的相关信息,小编也是在网……
曹丕杀曹冲是哪一集(新三国曹冲是谁杀的)曹冲(196208年),名仓舒,东汉末年人物,东汉豫州(今亳州)刺史,曹操与环夫人之子,自幼聪明善良,与众不同。深受曹操喜爱。有一个典故是关于曹冲的形象。曹操几次向大臣夸赞他,……
小额贷款10万一年利息多少(银行贷款10万五年还)介绍下贷款的还款方式种类。我总结了下,目前主要主要就包括六种还款方式假设我们贷款10万元,年利率5。15,贷款期限五年,我们来介绍下这几种还款方式的计算方法。……
泉州师范学院怎么样(泉州师范学院诗山校区怎么样)学校坐落在全国首批历史文化名城、著名侨乡泉州。学校前身为创办于1958年的泉州大学师范学院。1998年泉州师专、泉州教育学院、泉州师范学校合并组建新泉州师专。2000年经教育部……
建议以家庭为单位发生育补贴每天都有不同的新闻上热搜,热搜也是大家了解当下各种热门新闻的一个途径的,这两天建议以家庭为单位发生育补贴的热度就非常高,也是受到了网友们的关注,那么小编今天自然也是到网上去收集……