轉錄組入門1-環境配置與軟體安裝
系統環境
CentOS 7.0
軟體安裝
anaconda的安裝請參考:
使用Bioconda管理Linux系統中的生物信息軟體 - 知乎專欄Anaconda使用總結 - Python - 伯樂在線
需要安裝的軟體包括 sratoolkit,fastqc,hisats,samtools,htseq-count,R,Rstudiosratoolkit
介紹: sratoolkit的主要用途還是把NCBI SRA(Sequence Read Archive)資料庫中的NGS序列數據從 sra 格式轉換到 fastq 格式,以便於後續的數據分析。
官網主頁:Software : Sequence Read Archive : NCBI/NLM/NIH中文相關介紹一篇:sra-tools 的安裝與簡單使用
安裝與測試:#直接用anaconda安裝 @沈夢園提供nconda install -c jfear sratoolkit n#或者手動安裝:ncd Downloadsnwget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2-1/sratoolkit.2.8.2-1-centos_linux64.tar.gzn#下載已經編譯好的適合CentOS 64位系統的版本ntar -zxvf sratoolkit.2.8.2-1-centos_linux64.tar.gz #解包解壓nmv sratoolkit.2.8.2-1-centos_linux64.tar.gz ~/biosoft #移動到專門安裝生物信息軟體的目錄下邊n# 加入環境變數necho PATH=$PATH:~/biosoft/sratoolkit.2.8.2-1-centos_linux64.tar.gz/bin >> ~/.bashrc nsource ~/.bashrcn# 測試nprefetch -vn# 下載測試文件SRR390728,默認存放在家目錄下的ncbi文件夾中nprefetch -c SRR390728n
fastqc
介紹:二代測序數據質量分析軟體
官網主頁:FastQC A Quality Control tool for High Throughput Sequence Data 中文相關介紹一篇:20160410 測序分析--使用 FastQC 做質控安裝與測試:
conda install fastqcnfastqc #測試是否能正常打開該軟體n
hisat2
簡介:將測序結果比對到人類參考基因組上。HISAT2是TopHat2/Bowti2的繼任者,使用改進的BWT演算法,實現了更快的速度和更少的資源佔用。
官網主頁:HISAT2 中文相關介紹:Public Library of Bioinformatics 安裝與測試:conda install hisat2nhisat2 -h #測試n
samtools
簡介:一種處理SAM、BAM文件的工具軟體。BAM格式文件是存放高通量測序中比對結果的標準格式文件。
官網主頁:舊主頁SAMtools 新主頁Samtools 中文相關介紹:samtools 的使用 - OA_maque - 博客園安裝與測試:
conda install samtoolsnsamtools -helpn
htseq-count
簡介:htseq-count 是一款用於reads計數的軟體,他能對位於基因組上的一些單位的reads數進行統計,這裡所說的單位主要是指染色體上的一組位置區間(我們常見的就是gene exon)
官網主頁:Prequisites and installation 中文相關介紹:htseq-count的用法-Blueskys blog HTSeq 的安裝 - OA_maque - 博客園 安裝與測試:#anaconda 只能安裝0.7.2版沒有最新版nconda install -c bioconda htseq n#手動安裝ubuntunsudo apt-get install build-essential python2.7-dev python-numpy python-matplotlibn#Redhat系列 包括CentOSnsudo yum install python-devel numpy python-matplotlibn#下載HTSeqnwget https://pypi.python.org/packages/de/e4/5287587097a4c46b571babb074ce3ff91cf220bed26502b69dccd3a2fda3/HTSeq-0.8.0.tar.gzn#解壓ntar -zxvf HTSeq-0.8.0.tar.gzn#安裝nmv HTSeq-0.8.0 Biosoft #移動到Biosoft文件夾中ncd HTSeq-0.8.0 #進入該文件夾npython setup.py install –user #安裝n#測試 在非HTSeq-0.8.0文件夾下進行npythonn>>>import HTSeqn>>> #能夠在python中導入HTSeq這個包,說明安裝成功。n
R
簡介:一種常用語統計分析的編程語言,在生物信息分析中用於數據分析和繪圖
官網主頁:The R Project for Statistical Computing 中文相關介紹:R語言首頁、文檔和下載 - 編程語言 - 開源中國社區 安裝與測試:sudo yum install epel-releasensudo yum install rnr #測試n
Rstudio
簡介:Rstudio是R的集成開發環境
官網主頁:Home 中文相關介紹:http://jingyan.baidu.com/article/a17d52853343828098c8f21c.html 安裝與測試:conda install rstudionrstudio #測試n
推薦閱讀:
※R 學習筆記:R 色彩
※R 學習筆記: 數據輸入輸出
※人生苦短,我用Python
TAG:生物信息学 |