兵貴神速:且看 R 軟體繪製高級論文圖

曼哈頓圖,學名 Manhattan plot,是全基因組關聯分析(Genome-Wide Association Study, GWAS)的標配,可以展示所有染色體上的不同位置的 SNP 的顯著水平,因酷似曼哈頓的海邊景色(高樓林立的)所以稱為曼哈頓圖。

本質上,曼哈頓圖是以 SNP 在基因組上的坐標/位置為 X 軸,以顯著水平(通常是-log(P))為 Y 軸的散點圖,所以理論上說所有能做散點圖的工具都能畫曼哈頓圖。

但是你想一想全基因組有多少 SNP,然後還要坐成能用來發表的酷炫的樣子,像 Excel 這種強(fei)大(jin)的工具還是算了吧(卡死電腦是必然的,然後調整染色體的標籤,標註不同的顏色等都很麻煩)……除了是 GWAS 的標配外,你做一個 EWAS 也可以畫曼哈頓圖,做一個表達分析也可以做一個曼哈頓圖,只要是你想要看基因組上不同的位置的都可以做。

由於二代測序技術的發展,測序的價格不斷下降,GWAS 研究越來越多得應用於各種疾病的研究中,而用於做曼哈頓圖的工具也開始有所增加,比如 Java 程序 Haploview, python 的 geneview 庫等。

今天要跟大家介紹的是 R 語言的 2017 年 3 月 20 號更新的 CMplot 包,優點如下:

  1. 操作簡單,一行代碼搞定曼哈頓圖;

  2. 形式多樣,長方形、環形,甚至可以做出 Circos 的效果;

  3. 可以比較多個不同性質的結果;

  4. QQ 圖,density 圖一網打盡。

操作流程

1自行下載並安裝 CMplot 包

在 R 中 輸入 install.packages(「CMplot」),然後選擇一個鏡像,一般選擇 China 開頭的,離你所在的城市近的就好啦

2載入 CMplot 包

輸入 library(CMplot)

3準備/讀入數據

a<>

數據的格式為一個至少四列的數據表:

  • 第一列是標記名如 SNP 編號,甲基化探針名等;

  • 第二列是染色體編號,推薦使用純數字表示;

  • 第三列是標記的基因組坐標;

  • 第四列及以後各列是相關性 p 值,一種性狀的相關性 p 作為一列,可以有多列。如下圖所示:

  • 4一行代碼搞定曼哈頓圖

    CMplot(a)

    結果如圖所示:

    另外 CMplot 還給出了其他形式的圖:

    環狀曼哈頓圖

    QQ 圖

    密度圖

    5美化曼哈頓圖

    (已經很美了 T-T)還是說自定義吧

    CMplot 的參數及解釋 ↓


    推薦閱讀:

    手把手教你寫教學論文
    代寫論文到底靠不靠譜?
    《博士論文》第23期 丁瑜:我的「小姐」研究歷程
    論文選題那些事兒
    論文資料008

    TAG:論文 | 軟體 | 文圖 |