Ⅰ geo資料庫的優點
免費且只要是目前已經發表的論文,論文中涉及到的基因表達檢測的數據都可以通過這個資料庫中找到。
GEO資料庫是一個儲存晶元、二代測序以及其他高通量測序數據的一個資料庫。利用這個資料庫,我們可以檢索到其他一些人上傳的一些實驗測序數據。
不涉及任何檢測原理的角度來說的話,所謂的高通量檢測,其實就是一次性檢測很多指標變化的技術。例如我們說的表達譜數據,就是來檢測基因表達水平。比如我們要對一個人來進行高通量檢測的話,就能知道這個人上萬個基因的表達水平了。
由於GEO資料庫和我們之前介紹的gene資料庫 [資料庫推薦]gene:基因相關信息查詢 以及我們常用來搜索文獻的pubmed都是一個機構的。使用這個資料庫,我們需要做的就是就是就是提供檢索式。檢索式可以是簡單的幾個關鍵詞,也可以是制定特殊的檢索式。
Ⅱ 高通量測序數據公共資料庫有哪些
我原來常用的:
NCBI:持有INSDC的節點。網站上有核酸、蛋白、基因名、基因組名等等的搜索工具,以及BLAST序列比對搜索工具,PUBMED文獻資料庫,Taxonomy數據,COG蛋白家族庫等等。FTP可以下到它全部的資料庫,BLAST的單機程序,以及各種工具程序。
EBI:和NCBI類似,歐洲搞的對等物。感覺EBI網站比NCBI要清楚簡潔。另外EBI網站整合了更多的工具,比如多序列比對。
Uniprot:全蛋白庫。NCBI和EBI的蛋白庫來源於此。目前包括兩部分:SwissProt是人工校對過的,TrEMBL是自動校對的。
Pfam:蛋白家族庫。可以使用配套的HMMER進行搜索。比BLAST能找到更遠緣的東西,而且找到的東西是結構域。
Rfam:RNA的,類似Pfam。
Ⅲ 高通量測序16srrna基因序列用什麼基因資料庫比對比較好
silva最好,其次greengene(很久沒更新了),rdp官網也提供資料庫;還有ncbi 提供了人工矯正過的16s database。