標籤:

轉錄組入門1-環境配置與軟體安裝

fbb84b26.wiz03.com/shar

系統環境

CentOS 7.0

軟體安裝

anaconda的安裝請參考:

使用Bioconda管理Linux系統中的生物信息軟體 - 知乎專欄

Anaconda使用總結 - Python - 伯樂在線

需要安裝的軟體包括 sratoolkit,fastqc,hisats,samtools,htseq-count,R,Rstudio

sratoolkit

介紹: sratoolkit的主要用途還是把NCBI SRA(Sequence Read Archive)資料庫中的NGS序列數據從 sra 格式轉換到 fastq 格式,以便於後續的數據分析。

官網主頁:Software : Sequence Read Archive : NCBI/NLM/NIH

中文相關介紹一篇:sra-tools 的安裝與簡單使用

安裝與測試:

#直接用anaconda安裝 @沈夢園提供nconda install -c jfear sratoolkit n#或者手動安裝:ncd Downloadsnwget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2-1/sratoolkit.2.8.2-1-centos_linux64.tar.gzn#下載已經編譯好的適合CentOS 64位系統的版本ntar -zxvf sratoolkit.2.8.2-1-centos_linux64.tar.gz #解包解壓nmv sratoolkit.2.8.2-1-centos_linux64.tar.gz ~/biosoft #移動到專門安裝生物信息軟體的目錄下邊n# 加入環境變數necho PATH=$PATH:~/biosoft/sratoolkit.2.8.2-1-centos_linux64.tar.gz/bin >> ~/.bashrc nsource ~/.bashrcn# 測試nprefetch -vn# 下載測試文件SRR390728,默認存放在家目錄下的ncbi文件夾中nprefetch -c SRR390728n

fastqc

介紹:二代測序數據質量分析軟體

官網主頁:FastQC A Quality Control tool for High Throughput Sequence Data

中文相關介紹一篇:20160410 測序分析--使用 FastQC 做質控

安裝與測試:

conda install fastqcnfastqc #測試是否能正常打開該軟體n

hisat2

簡介:將測序結果比對到人類參考基因組上。HISAT2是TopHat2/Bowti2的繼任者,使用改進的BWT演算法,實現了更快的速度和更少的資源佔用。

官網主頁:HISAT2

中文相關介紹:Public Library of Bioinformatics

安裝與測試:

conda install hisat2nhisat2 -h #測試n

samtools

簡介:一種處理SAM、BAM文件的工具軟體。BAM格式文件是存放高通量測序中比對結果的標準格式文件。

官網主頁:舊主頁SAMtools 新主頁Samtools

中文相關介紹:samtools 的使用 - OA_maque - 博客園

安裝與測試:

conda install samtoolsnsamtools -helpn

htseq-count

簡介:htseq-count 是一款用於reads計數的軟體,他能對位於基因組上的一些單位的reads數進行統計,這裡所說的單位主要是指染色體上的一組位置區間(我們常見的就是gene exon)

官網主頁:Prequisites and installation

中文相關介紹:htseq-count的用法-Blueskys blog

HTSeq 的安裝 - OA_maque - 博客園

安裝與測試:

#anaconda 只能安裝0.7.2版沒有最新版nconda install -c bioconda htseq n#手動安裝ubuntunsudo apt-get install build-essential python2.7-dev python-numpy python-matplotlibn#Redhat系列 包括CentOSnsudo yum install python-devel numpy python-matplotlibn#下載HTSeqnwget https://pypi.python.org/packages/de/e4/5287587097a4c46b571babb074ce3ff91cf220bed26502b69dccd3a2fda3/HTSeq-0.8.0.tar.gzn#解壓ntar -zxvf HTSeq-0.8.0.tar.gzn#安裝nmv HTSeq-0.8.0 Biosoft #移動到Biosoft文件夾中ncd HTSeq-0.8.0 #進入該文件夾npython setup.py install –user #安裝n#測試 在非HTSeq-0.8.0文件夾下進行npythonn>>>import HTSeqn>>> #能夠在python中導入HTSeq這個包,說明安裝成功。n

R

簡介:一種常用語統計分析的編程語言,在生物信息分析中用於數據分析和繪圖

官網主頁:The R Project for Statistical Computing

中文相關介紹:R語言首頁、文檔和下載 - 編程語言 - 開源中國社區

安裝與測試:

sudo yum install epel-releasensudo yum install rnr #測試n

Rstudio

簡介:Rstudio是R的集成開發環境

官網主頁:Home

中文相關介紹:jingyan.baidu.com/artic

安裝與測試:

conda install rstudionrstudio #測試n

推薦閱讀:

R 學習筆記:R 色彩
R 學習筆記: 數據輸入輸出
人生苦短,我用Python

TAG:生物信息学 |