Ⅰ tbtools無法提取cds序列
(⽇常記錄)使⽤TBtools批量提取基因組中的CDS、UTR、
exon等
在分析基因組數據時,我們有時候只需要基因組中某個部位的信息,⽐如涉及編碼蛋⽩功能就只需要CDS序列,研究miRNA與mRNA互作時,只需要3『UTR序列,那麼如何簡單快速的得到基因組中的⽬標序列呢?今天就要⽤⼀個好⽤的數據分析⼯具TBtools。
⼀、准備基因組注釋⽂件以及序列⽂件:1、可從NCBI、ENSEMBL、GENCODE等資料庫中下載,本⽂以ensembl為例,打開ensembl資料庫,進⼊Downloads,點擊Downloading with rsync, Ensembl FTP site 選擇發布的基因組版本,以最新版本99為例
2、選擇fasta和gff3,選擇物種,下載基因組序列⽂件和gff注釋⽂件。⽐如homo,在序列下載時選擇primary或top均可,不要選rm和soft,會降低⽐對率(下載⼯具就不多說啦)
⼆、TBtools序列提取
2、打開TBtools,進⼊sequence toolkit,GFF3/GTF Manipulate,GXF Sequences Extract
3、⾸先,分別導⼊GFF⽂件和FASTA序列⽂件,再點擊initialize,初始化⽂件。初始化完成後,會跳出⼀個幫助⽤戶選擇feature的框,可直接關掉跳過(不懂GFF注釋結構的童鞋可以看⼀下 哈哈),然後軟體的Feature Tag就會出現以下可供選擇的序列區域啦,包括
mRNA,Lnc_RNA,CDS、3』UTR等,可⾃⾏選擇提取。
注意:
注意:因為TBtools有特定的函數程序,所以提取之前需提前設定好輸出的⽂件名,也就是在set an output fasta file出,除了選擇輸出⽬錄外。還需⼿動添加需要輸出的⽂件名(.fa),最後,Start就可以啦,⼏分鍾之後就可以在輸出⽬錄下找到你的序列了。是不是特別簡單?^-^
¥
5
網路文庫VIP限時優惠現在開通,立享6億+VIP內容
立即獲取
(日常記錄)使用TBtools批量提取基因組中的CDS、UTR、exon等
(⽇常記錄)使⽤TBtools批量提取基因組中的CDS、UTR、
exon等
在分析基因組數據時,我們有時候只需要基因組中某個部位的信息,⽐如涉及編碼蛋⽩功能就只需要CDS序列,研究miRNA與mRNA互作時,只需要3『UTR序列,那麼如何簡單快速的得到基因組中的⽬標序列呢?今天就要⽤⼀個好⽤的數據分析⼯具TBtools。
⼀、准備基因組注釋⽂件以及序列⽂件:1、可從NCBI、ENSEMBL、GENCODE等資料庫中下載,本⽂以ensembl為例,打開ensembl資料庫,進⼊Downloads,點擊Downloading with rsync, Ensembl FTP site 選擇發布的基因組版本,以最新版本99為例
第 1 頁