小云最近分享了许多复现的内容,给小伙伴带来了许多的教程。这次小云将引领小伙伴迈入数据可视化的奇妙世界,追随着经典图表,我们要知道数据可视化不仅仅是对数字的展示,更是对信息的解读和理解,是从数据中提炼出价值的关键一环。
所以小云这次分享的内容,是实现高分文献中有关高密度数据的可视化方法,我们先来看一下是怎样的情况,这副图是来自NatureIF64.8高分文献中《Graph pangenome captures missing heritability and empowers tomato breeding》中的图3a和c,因为都是多数据,所以小云就一起分享给小伙伴,先来看一下图:
这个图a呢其实就是频率直方图,而图c就是两幅散点图组合而成的组合散点图。有的小伙伴可能不了解,我们这里简介一下
频率直方图,其实就是数据分布的拓扑图,透过高低起伏的柱状,展示数据的分布规律。它是对数据分布形态最直观的呈现方式,让我们一目了然地洞察数据的聚集点和分散趋势,
而组合散点图则是展现变量之间关系的画布,每一个点的位置不仅是数值的体现,更是变量之间联系的折射。通过点的布局和趋势,我们能够窥探出变量之间的相关性、规律性或者异常情况。这两幅图呢,我们可以将自己非常庞大的数据进行展示,
这次分享内容将,小云将教小伙伴学习数据处理的技巧,选择合适的图表工具。
下面我们就开始学习吧!我们首先绘制直方图,先加载我们实用的包
然后这里师妹实用示例的数据,小伙伴可以按照数据格式自行去设置、
这里就需要我们不同类型的数据, 文献中是三个类型的数据,
然后我们挑选一下颜色吧
这里小云作为演示随便选几个颜色,和文章中不相同,但是是一样使用方法
然后加载我们要使用的绘图包
接下来我们就可以绘制图了,小伙伴发现文献中的图注
前面h2这个标识,小伙伴有的数据可能是整数幂,或者log该如何,总不能用AI去P吧,这里师妹教给小伙伴如何再R中展示出注释,其实很简单,再数据文本框加上这样的注释符号
\textit{h}${^2},然后就可以了,这里小云就不一步一步的绘制了,代码的注释小云也进行了标记,我们使用scale_fill_manual函数进行颜色的标记,再直方图中,我们还使用一些自定义主题函数进行修改样式,小伙伴可以按照自己喜欢的去修改,下面我们就进行绘制图:
这样看其实除了颜色和文献不想同,其他都一样,图注的表示我们也复现出来,
小伙伴注意下代码中的for循环,如何小伙伴是多个分组不止是三个,那就改一下i in 1:3
这是对分组的一个循环,因为数据比较多,
下面呢,我们就绘制图3c,其实原理都很简单,我们进行散点图的绘制,然后将两个散点图进行组合一下,就行了,不过注意的是,散点图中的点是三角形,我们就需要再绘图函数中进行修改点的类型,
我们先看一下数据格式:
最后的分组也就两个组,小伙伴可以按照格式自行去修改
然后我们绘制上面的散点图
图注的介绍小云也进行了注释
然后就我们绘制下面的散点图
两个图的绘制方式差不多
然后我们将这两个图进行组合
是不是和文献中的一样了呢,好了,这次的复现我们就到此为止了,小伙伴要多多理解代码的意思,将自己的数据套用进去,这样就能绘制出自己想要的图形了!快去动手试试吧