[转载]GTF格式的refGene如何在Ensembl及UCSC下载
已有 1811 次阅读 2013-8-18 00:46 |系统分类:科研笔记|关键词:如何GTF格式的refGene如何在Ensembl及UCSC下载
1. 从UCSC genome browser中下载GTF格式的refGene, 方法如下:
1) 进入http://genome.ucsc.edu/
2) clade选Mammal, genome选Human, assembly选择相应参考序列版本; group选mRNA and EST Tracks, track中选Human mRNAs; table选RefSeq Genes (refGene); output format选GTF-gene transfer format
3) output file输入文件名, refGene.gtf.gz
4) 点击get output
2. Ensembl GTF文件路径
在linux环境下直接通过ftp下载即可.
作为Tophat输入之前, 还需要进行如下处理:
gzip -dc Homo_sapiens.GRCh37.68.gtf.gz | awk '{
