如何绘制各类箱式图(箱线图)?
山海路研
因为热爱,所以想奔赴山海
内容
箱式图是什么?
箱式图:箱式图(boxplot)是使用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和离群值。箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除离群值外的最小值和最大值,另外标记可能的离群值。显然箱子越长,数据变异程度越大。若中间横线在箱子中点,则表明分布对称,否则不对称。
箱式图用来干什么?
描述数据的分布
直观明了地识别批量数据中地异常值。箱式图提供了识别异常值的一个标准:异常值被定义为小于Q11。5IQR或大于Q31。5IQR。
箱式图什么时候用?
箱式图将数据经验分布的重要特征展示出来,给人们一个直观的印象,由于使用的是中位数和四分位数,因此比均数和标准差更为稳健,箱式图特别适合于多组数据分布的比较。
在R里如何实现?
数据如何整理(示例数据)
代码展示
getwd()rm(listls())清空环境library(ggplot2)library(readxl)newdatareadexcel(E:桌面箱式图数据。xls,sheet1)View(newdata)library(ggplot2)tiff(filenameRplot03d。bmp,width7,height10,unitscm,res300)newdataTypefactor(Type,levelsc(0,1,2),labelsc(净化,非净化,粉类))p1ggplot(newdata,aes(Type,Dust))statboxplot(geomerrorbar,width0。15)geomboxplot(width0。3,size0。8)p1dev。off()
图片展示
上面展示的是最简单的箱式图绘制方法,如果你想让你的相似图是这样的可以参考〔3〕
如果你希望你的图是下面这样的,你可以参考〔4〕
【1】颜艳,王彤,等。医学统计学〔M〕。第5版。北京:人民卫生出版社,2020:163。
【2〕】ZhangJ。BeautifulDataVisualizationwithR(《R语言数据可视化之美》)〔M〕。2019。
【3】https:mp。weixin。qq。comszcE9I5JikLLGdCZU9Nxwpg
〔4〕https:mp。weixin。qq。coms6QIVrprcrxiIcW528Qi3w
END