標籤:

生物信息神奇網站系列(九):批量下載序列

編者按

在《手把手教你生信分析平台搭建專欄》中,我們介紹過利用Aspera快速下載生物數據,例如下載某個物種基因組數據。但是如果想下載來自多個物種的不同基因序列,例如給定一個基因列表list,如何下載到這些序列呢?這就需要用到Batchentrez

九:批量下載序列Batchentrez

ncbi.nlm.nih.gov/sites/

批量下載基因序列有多種方式,可以通過編程實現,也可以通過固定模塊例如bioperl,biopython等。如果不會編程,batchentrez就是最好的選擇了。Entrez是NCBI官方的數據檢索系統,Batch Entrez顯然就是批量檢索。越到這種問題,真的有人一條條序列下載,這樣不僅浪費時間,而且容易出錯。(我以前就是手工一條條序列下載)

1、首先登陸網站,首次使用請注意閱讀說明和注意事項。

2、網站的使用其實並不難,首先選擇要使用的資料庫,然後點擊選擇上傳ID文件,序列的ID可以是accession numbers或者identifiers。

3、這裡我們利用GI號,下載8個基因的序列,文件格式如圖所示。

4、資料庫需要選擇默認的,上傳文件,點擊Retrieve。

5、batchentrez會檢查文件中序列ID信息,並且會去除重複,返回檢索結果,這裡有5個檢索不到序列。

6、點擊圖中藍色鏈接,鏈接到新的頁面,選中要下載的序列,然後在Sent to中進行選擇,包括輸出文件內容和文件格式等。

7、點擊Create FIle,這樣序列就下載好了。

Tips:1,、注意輸入文件格式,ID只能使用accession numbers or identifiers。

2、選擇的資料庫要和輸入的序列ID相一致。

3、序列ID後面不要加空格,注意不同系統中換行符問題。


推薦閱讀:

從源頭動態監控疾病
基因檢測可以救人命!
【親身經歷】去香港做無創DNA產前檢測
聽力不好會遺傳么?什麼情況下需要做耳聾基因檢測?
青光眼該如何進行早期預防?

TAG:基因檢測 |