兵貴神速:且看 R 軟體繪製高級論文圖
曼哈頓圖,學名 Manhattan plot,是全基因組關聯分析(Genome-Wide Association Study, GWAS)的標配,可以展示所有染色體上的不同位置的 SNP 的顯著水平,因酷似曼哈頓的海邊景色(高樓林立的)所以稱為曼哈頓圖。
本質上,曼哈頓圖是以 SNP 在基因組上的坐標/位置為 X 軸,以顯著水平(通常是-log(P))為 Y 軸的散點圖,所以理論上說所有能做散點圖的工具都能畫曼哈頓圖。
但是你想一想全基因組有多少 SNP,然後還要坐成能用來發表的酷炫的樣子,像 Excel 這種強(fei)大(jin)的工具還是算了吧(卡死電腦是必然的,然後調整染色體的標籤,標註不同的顏色等都很麻煩)……除了是 GWAS 的標配外,你做一個 EWAS 也可以畫曼哈頓圖,做一個表達分析也可以做一個曼哈頓圖,只要是你想要看基因組上不同的位置的都可以做。
由於二代測序技術的發展,測序的價格不斷下降,GWAS 研究越來越多得應用於各種疾病的研究中,而用於做曼哈頓圖的工具也開始有所增加,比如 Java 程序 Haploview, python 的 geneview 庫等。
今天要跟大家介紹的是 R 語言的 2017 年 3 月 20 號更新的 CMplot 包,優點如下:
操作簡單,一行代碼搞定曼哈頓圖;
形式多樣,長方形、環形,甚至可以做出 Circos 的效果;
可以比較多個不同性質的結果;
QQ 圖,density 圖一網打盡。
操作流程
1自行下載並安裝 CMplot 包在 R 中 輸入 install.packages(「CMplot」),然後選擇一個鏡像,一般選擇 China 開頭的,離你所在的城市近的就好啦
2載入 CMplot 包輸入 library(CMplot)
3準備/讀入數據
a<>
數據的格式為一個至少四列的數據表:
第一列是標記名如 SNP 編號,甲基化探針名等;
第二列是染色體編號,推薦使用純數字表示;
第三列是標記的基因組坐標;
第四列及以後各列是相關性 p 值,一種性狀的相關性 p 作為一列,可以有多列。如下圖所示:
4一行代碼搞定曼哈頓圖
CMplot(a)
結果如圖所示:
另外 CMplot 還給出了其他形式的圖:
環狀曼哈頓圖
QQ 圖
密度圖
5美化曼哈頓圖
(已經很美了 T-T)還是說自定義吧
CMplot 的參數及解釋 ↓
推薦閱讀:
※手把手教你寫教學論文
※代寫論文到底靠不靠譜?
※《博士論文》第23期 丁瑜:我的「小姐」研究歷程
※論文選題那些事兒
※論文資料008