每個實驗室都需要一個自己的 Blast 網站

https://www.zhihu.com/video/946398899691294720

1. 有什麼用

假如你需要研究蘋果基因組中與果皮顏色相關的基因,而果皮顏色在梨中已經研究的很清楚。所以,我們需要以梨中控制果皮顏色的基因作為 query,以蘋果的整個基因集作為 Database,進行 blast 搜索。那麼,你要怎麼實現這個事情呢?

如果你研究的物種基因序列已經包含在了 NCBI 資料庫中,那麼可以直接使用 NCBI 的網頁版 blast。

如果NCBI 不包含你研究的物種數據,比如最新版的蘋果基因組,或者是自己拼接的基因組、轉錄組,這時候,你就可以自行搭建一個私有的 blast 網站。

目前,搭建blast 網站的軟體有兩款,

ViroBLAST Home Pageindra.mullins.microbiol.washington.edu

和 SequenceServer

SequenceServerwww.sequenceserver.com圖標

我們介紹下 ViroBLAST 的使用。

2. 安裝 ViroBLAST

# 安裝 blast+$ conda install blast# 安裝 apache2 服務$ sudo apt-get install apache2 # 安裝 PHPsudo apt-get install libapache2-mod-php php php-gd# 下載 viroblast$ wget http://indra.mullins.microbiol.washington.edu/viroblast/download.php?ID=viroblast.tar.gz$ mv download.php?ID=viroblast.tar.gz viroblast.tar.gz# 解壓$ tar -zxvpf viroblast.tar.gz# 移動到 /var/www/html 下$ mv viroblast /var/www/html/

網頁訪問:hostname/viroblast/viro

注意修改 hostname 為自己伺服器的IP。

3. 配置

構建 blast 資料庫

基因集作為 blast 資料庫放在 db 文件夾里。我們用蘋果的蛋白序列來測試。

$ cd db/protein$ wget wget https://iris.angers.inra.fr/gddh13/downloads/GDDH13_1-1_prot.fasta.bz2$ bunzip2 GDDH13_1-1_prot.fasta.bz2$ makeblastdb -in GDDH13_1-1_prot.fasta -out GDDH13 -dbtype prot

參考配置文件

配置文件為:viroblast.ini

# 配置 blast+ 路徑blast+: /home/genek/ncbi-blast-2.7.1+/bin# 配置資料庫blastn: test_na_db => Nucleotide test databaseblastp: test_aa_db => Protein test database, GDDH13 => Apple Protein Databaseblastx: test_aa_db => Protein test database, GDDH13 => Apple Protein Databasetblastn: test_na_db => Nucleotide test databasetblastx: test_na_db => Nucleotide test database

推薦閱讀:

TAG:生物信息學 | 基因組學 | DNA測序 |