置信区很重要。 无论是均数、中位数、率的置信区间,都应该在统计分析结果中强化。均数的置信区间一般的统计分析软件都可方便计算。比如SPSS软件,统计描述时会给出均数的95置信区间,t检验时会给出均数差值的95置信区间。率的置信区间,我们在之前一篇推文已经介绍过:小技巧!如何用SPSS计算率的置信区间 那么如果是偏态分布,采用中位数描述和非参数秩和检验,如何估计中位数差值的置信区间呢?答案是:HodgesLehmann估计法或bootstrap估计法。 SPSS能否操作呢?能!现在,本文结合一篇临床试验论文来探讨下如何利用SPSS和R语言基于HodgesLehmann法开展中位数差值的置信区间估计。 案例所采用的文章是2019年9月5日发表在《新英格兰医学杂志》的一篇临床试验论文。它大多数定量指标差值的置信区间采用HodgesLehmann法估计得到。 本临床试验介绍 肺泡蛋白沉积症是一种以肺泡中表面活性剂异常积聚为特征的疾病。大多数病例是自身免疫性的,并且与抗粒细胞巨噬细胞集落刺激因子(GMCSF)的自身抗体有关,该自身抗体可防止肺泡巨噬细胞清除肺表面活性物质。一项开放标签的2期研究显示吸入重组人GMCSF对严重肺泡蛋白沉积症患者有一定疗效;然而,轻度至中度疾病患者的疗效尚不清楚。 为此,研究人员进行了一项双盲、安慰剂对照试验。64例自身免疫性肺病患者肺泡蛋白沉积症每日吸入重组人GMCSF(sargramostim),剂量为125g,每日两次,共7天,隔周一次,共24周,或安慰剂治疗,这些患者当呼吸环境空气低于70毫米汞柱(或症状患者amp;lt;75毫米汞柱)时,记录了动脉氧分压(Pao2)。排除患有严重肺泡蛋白沉积症(Pao2amp;lt;50mmHg)的患者,以避免被指定接受安慰剂治疗的患者可能加剧该疾病。该研究的主要终点是基线和第25周之间的肺泡血氧梯度的变化。 一句话:RCT研究,患者共64例,随机分为两组,比较重组人GMCSF与安慰剂组肺泡血氧梯度的变化。 结果发现,GMCSF组(33例患者)的平均(SD)肺泡血氧梯度变化明显好于安慰剂组(30例)(平均从基线变化为4。509。03mmHgvs。0。1710。50mmHg;P0。02)。CT扫描肺野密度的基线和第25周之间的变化在GMCSF组中也更好(组间差异为36。0895置信区间为61。58至6。99,使用MannWhitneyU检验和HodgesLehmann估计伪中位数的置信区间)。GMCSF组6例患者和安慰剂组3例患者出现严重不良事件。 主要结局指标基本为正态分布 其中一个次要结局指标CT密度,偏态分布 该研究统计描述采用均数加减标准差,差异性比较采用两样本秩和检验,置信区间采用HodgesLehmann估计法估计 文章最后结论是:在这项随机对照试验中,吸入重组人GMCSF与动脉氧张力实验室结果改善相关,但未发现临床益处。 本案例的主要统计学方法 1。统计描述 Numericalresultsarepresentedasmeans(SD)ormedianswithinterquartileranges。 2。两组数据的比较 TheMannWhitneyUtestwasusedtoassessthedifferencebetween thetwogroups,andthesigntestwasusedtoassessthedifferencesfrombaselinetoweek25withineachgroup。 Forcategoricalendpoints,thedatawerecomparedwiththeuseofeitherthechisquaretestorFisher’sexacttest。Forcontinuousvariables,themedianswerecomparedwithaMannWhitneyUtest。 3。关于P值 ThePvaluewastwosidedandusedfortheprimaryendpointonly。APvalueoflessthan0。05wasconsideredtoindicatestatisticalsignificance。 郑老师:从统计分析来看,作者直接采用MannWhitneyUtest方法进行分析,这个方法即两样本秩和检验。有些人好奇了,那么正态分布的怎么办?结局指标既有正态分布,又有偏态分布,是不是要t检验和秩和检验结合呢?其实也大可不必,因为秩和检验即可以用于正态分布数据比较,也可以用于偏态分布数据比较,为了统一用一种方法,研究人员干脆就统一用了两样本秩和检验。 统计方法还采用了比如混合效应模型来提供支持性的数据,这里不再做介绍。方法里面未提及置信区间的估计,作者在结果的表和论文的摘要中提到了置信区间估计的方法apseudomediandifferencecalculatedwiththeuseoftheHodgesLehmannestimatebasedontheMannWhitneyUtest 利用SPSS计算中位数差值置信区间 SPSS如何进行中位数差值置信区间估计呢?我们以下案例为例,进行HodgesLehmann估计。该方法就镶嵌在两样本秩和检验的SPSS操作界面之中。 某研究者将小鼠随机分为两组,观察局部加热治疗小鼠移植肿瘤的疗效,以生存时间(日)作为观察指标,实验结果见下表,试检验两组小鼠生存日数有无差别? 局部加热组:10,12,15,15,15,16,20,2330,40 空白对照组:2,3,3,3,4,4,4,6,9,11,12,14 HodgesLehmann法的界面:它在SPSS的非参数检验方法中。 首先,非参数检验,在字段界面,设置检验变量(生产日期)和分组变量(分组) 然后,在设置界面中,定制检验,选择曼惠特尼(即两样本秩和检验),界面底部选择霍奇斯莱曼估算(即HodgesLehmann)计算置信区间。 最后得到,中位数差值的置信区间了!首先,展现给我们的是一个总表,,是秩和检验的P值。 接着,双击总表,得到下图后,选择下图左侧底部置信区间汇总视图,即可 最后,基于秩和检验的得到中位数差值置信区间估计值,95CI为7。0018。00。 利用R语言计算中位数差值置信区间 数据从SPSS导入 library(foreign)利用foreign直接将数据库从SPSS中导入 e3read。spss(rat。sav)读取数据集, e3amp;lt;as。data。frame(e3) str(e3)浏览变量 is。factor(e3group)group变量是因子吗? is。numeric(e3time)group变量是数值吗? 秩和检验和置信区间估计 wilcox。test(timegroup,datae3,mu0,exactF, pairedFALSE,conf。intT,conf。level0。95) 参考文献: RyushiTazawa,etal。InhaledGMCSFforPulmonaryAlveolarProteinosis。NEJM。2019。 另外有两篇中文的翻译,也探讨了中位数差别的置信区间,有兴趣可以看看 http:kuaibao。qq。coms20190902AZPJJ200 https:xw。qq。comcmsid20181213A0A7PL00 本文毕,更多基于论文的案例解读请点击下方统计技巧。 meta分析 R语言 真实世界研究 统计技巧