小提琴图定义:
小提琴图(Violin Plot),是一种集成了箱线图和核密度图特征的数据可视化图形,用于展示多组数据的分布情况和概率密度。不仅能够直接体现数据的分布形态,又能能够简单明了地展示异常值、四分位数、中位数等关键数据
小提琴图怎么看?
①表示不同分组
②箱体上沿为第三四分位数,表示75%的数据小于这个值
③中位数,表示数据的中间值
④箱体下沿为第一四分位数,表示25%的数据小于是这个值
⑤竖线为95%置信区间,竖线上端为数据最大值,竖线下端为数据最小值
⑥表示数据中超出95%置信区间的异常值
⑦小提琴的宽度表示数据分布密度
小提琴图的作用:
1.显示数据分布:小提琴图能够清晰地展示数据的分布情况,包括数据的中位数、四分位数、离群值等统计信息。通过小提琴形状的宽度和高度,可以直观地比较不同组或条件下数据的分布差异。
2.比较多组数据:将不同基因在不同组织中的表达水平用小提琴图展示,以便研究它们的表达模式是否有显著差异。
3.异常值检测:在小提琴图中,可以观察到小提琴外部的离散数据点,这些数据点往往表示数据中的异常值。可以通过观察离群点的出现情况来判断数据中是否存在异常值。
代码:
百度网盘链接:
https://pan.baidu.com/s/1WtVTFoJ4NZOvElu1ehvUSQ?pwd=hdpp
提取码: hdpp