作者:科研貓|飛飛
責(zé)編:科研貓|依米
今天教大家來畫一種非常知性優(yōu)雅(一眼萬年那種的~)的圖形:小提琴圖。
小提琴圖
定義:Violinplot,和Boxplot一樣,也是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計(jì)圖,其形狀類似小提琴。它主要用于反映原始數(shù)據(jù)分布的特征,還可以進(jìn)行多組數(shù)據(jù)分布特征的比較。
解讀:小提琴圖是【箱線圖】與【核密度圖】的結(jié)合,箱線圖展示了分位數(shù)的位置,核密度圖則展示了任意位置的密度,通過小提琴圖可以知道哪些位置的數(shù)據(jù)點(diǎn)聚集的較多,因其形似小提琴而得名。如下圖所示,其外圍的曲線寬度代表數(shù)據(jù)點(diǎn)分布的密度,中間的箱線圖則和普通箱線圖表征的意義是一樣的,代表著中位數(shù)、上下分位數(shù)、極差等。
繪制方法:使用ggplot2包的geom_violin()函數(shù)繪制小提琴圖,為了更好地表征數(shù)據(jù)分布,再用geom_boxplot()函數(shù)疊加一個箱線圖。
繪圖操作:使用科研貓?zhí)峁┑?strong>提琴圖·R代碼,只要提供幾個參數(shù)即可:
(1)設(shè)置用來繪圖的數(shù)據(jù)文件;
(2)設(shè)置小提琴的顏色,可以是red、blue、green等各種顏色,當(dāng)你想繪制多種顏色時,使用“random”;
(3)設(shè)置x軸的標(biāo)簽;
(4)設(shè)置y軸的標(biāo)簽
然后直接運(yùn)行代碼即可。
只需短短幾秒,你就會徹底愛上我們的代碼,我們的小提琴圖。超高顏值、時尚穿搭,editor都說愛了呢。
網(wǎng)站概覽
介紹完小提琴圖,給大家隆重介紹一下全網(wǎng)首個開源繪圖平臺-Hiplot。Hiplot是openbiox聯(lián)合科研貓鄭重推出的,免費(fèi)注冊,無需安裝,一站式繪圖的開源繪圖平臺,你還在等什么?
導(dǎo)言
數(shù)據(jù)可視化在科研工作中發(fā)揮著越來越重要的作用。基于可視化圖形,我們可以更好地展示科研數(shù)據(jù)中的主要特征和規(guī)律。以生物醫(yī)學(xué)為例,大多數(shù)臨床醫(yī)學(xué)學(xué)生和初級科研工作者一般需要花費(fèi)數(shù)十天乃至數(shù)月的時間去熟悉和掌握常用的數(shù)據(jù)可視化工具,如SPSS、Origin和Graphpad。之后才有可能去完成部分基礎(chǔ)的數(shù)據(jù)統(tǒng)計(jì)分析和可視化。如果是要專門從事數(shù)據(jù)分析和建模方向的相關(guān)人員則還需額外學(xué)習(xí)一門甚至數(shù)門編程語言(如MATLAB、R和Python)。而要達(dá)到能夠自由探索數(shù)據(jù)的水平則還需要額外花費(fèi)更多時間去深入學(xué)習(xí)和進(jìn)階。
近年來,隨著各類云計(jì)算平臺(如生物醫(yī)學(xué)領(lǐng)域的Galaxy和DNAnexus)、相關(guān)IT軟硬件基礎(chǔ)設(shè)施的發(fā)展(如分布式計(jì)算、容器技術(shù)、軟件包管理器、數(shù)據(jù)分析流程構(gòu)建框架等),初級科研工作者已經(jīng)可以相對比較輕松地獲取相關(guān)數(shù)據(jù)的上游分析結(jié)果。特別是當(dāng)常規(guī)組學(xué)數(shù)據(jù)的上游分析流程趨于穩(wěn)定和完善,數(shù)據(jù)上游分析流程的可自定義程度和可變程度已經(jīng)大大降低。而數(shù)據(jù)分析下游流程中的可視化和個性化深度解讀已經(jīng)成為當(dāng)前用戶面臨的最大挑戰(zhàn):
開源用戶社區(qū)開發(fā)的可視化軟件或方法大多還沒有很好的整合在一個統(tǒng)一的用戶接口之下;國內(nèi)缺少活躍的針對科研數(shù)據(jù)可視化的協(xié)作社區(qū),“**畫圖群”成為初級科研用戶為數(shù)不多的選擇;國內(nèi)缺少類似于Graphpad、MATLAB核心數(shù)據(jù)可視化軟件和平臺,在被美國禁用之后,只能花費(fèi)額外成本進(jìn)行流程遷移或重頭開始開發(fā);相關(guān)數(shù)據(jù)可視化工具仍然相對匱乏,雜志和用戶需求旺盛,已發(fā)布多年的Circos圓圈圖可視化,通過封裝一些便捷操作就可以發(fā)表文章:RascheH,HiltemannS.GalacticCircos:User-friendlyCircosplotswithintheGalaxyplatform.Gigascience.2020;9(6):giaa065.doi:10.1093/gigascience/giaa065;MarxH,CoonJJ.MS-Helios:aCircoswrappertovisualizemulti-omicdatasets.BMCBioinformatics.2019;20(1):21.Published2019Jan11.doi:10.1186/s12859-018-2564-9;YuY,OuyangY,YaoW.shinyCircos:anR/ShinyapplicationforinteractivecreationofCircosplot.Bioinformatics.2018;34(7):1229-1231.doi:10.1093/bioinformatics/btx763)國內(nèi)外開發(fā)的一些平臺和工具用戶體驗(yàn)一般:用戶界面不夠美觀;中英文支持的屈指可數(shù);上手仍然有一定難度;部分平臺的文件管理不太方便;用戶能夠主動參與平臺建設(shè)的少之又少。
Hiplot簡介
Hiplot是由openbiox社區(qū)于2019年10月發(fā)起,并在新冠疫情爆發(fā)后快速發(fā)展的一個社區(qū)開發(fā)項(xiàng)目:致力于建立一個快速迭代、支持中英文環(huán)境的科研數(shù)據(jù)可視化平臺和協(xié)作社區(qū)。目前該平臺建設(shè)已初具規(guī)模,已提供基于R語言的40余種基礎(chǔ)可視化的功能。
Hiplot項(xiàng)目發(fā)起的初衷就是為了解決廣大臨床醫(yī)學(xué)學(xué)生和科研工作者的基礎(chǔ)科研方面的可視化需求:
基礎(chǔ)可視化:覆蓋大多數(shù)基礎(chǔ)的科研可視化功能,參照SPSS、GraphPad、國內(nèi)外開發(fā)的相關(guān)可視化軟件和工具進(jìn)階可視化:包括Shiny在內(nèi)的復(fù)雜可視化圖形和應(yīng)用;文獻(xiàn)圖表的重現(xiàn)和再分析;新的可視化圖形展示插件:如基于Circos、circlize的二次開發(fā);openbiox社區(qū)貢獻(xiàn)的可視化應(yīng)用(如UCSCXenaShiny和bioshiny)其他任務(wù):低計(jì)算量的其他任務(wù)(如文獻(xiàn)數(shù)據(jù)資源下載、RESTfulAPIs訪問等)文件管理(支持上傳、下載、復(fù)制、移動、刪除、在線預(yù)覽和編輯等操作)
Hiplot用戶
交互界面展示(部分)
登錄
注冊
基礎(chǔ)繪圖卡片瀏覽與檢索
繪圖示例|相關(guān)性熱圖
繪圖示例|免疫浸潤分析
文件上傳窗口
文件瀏覽與管理
文件在線查看和編輯
(支持文本文件、XLSX、CSV、TXT等)
文件在線查看和編輯
(支持文本文件、XLSX、CSV、TXT等)
提交文獻(xiàn)原文和附錄下載任務(wù)
(基于openbiox社區(qū)貢獻(xiàn)的bget項(xiàng)目)
提交文獻(xiàn)原文和附錄下載任務(wù)
(基于openbiox社區(qū)貢獻(xiàn)的bget項(xiàng)目)
本期干貨
-小提琴圖繪制代碼-
領(lǐng)取方法
關(guān)注“科研貓”公眾號
公眾號主頁點(diǎn)擊“更多信息”-“聯(lián)系客服”領(lǐng)取干貨
更多科研新鮮資訊、文獻(xiàn)精讀和生物信息技能
請關(guān)注科研貓公眾號
科研貓?jiān)瓌?chuàng)出品,任何形式轉(zhuǎn)載,均需獲授權(quán)
若您是讀者,歡迎分享,無需授權(quán)
易法通律師事務(wù)所提供版權(quán)法律支持