當前位置:首頁 » 數據倉庫 » ncbi資料庫下載
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

ncbi資料庫下載

發布時間: 2023-08-06 02:27:27

A. 如何從ncbi上下載database

因此NCBI 的分類學資料庫不是一個系統發育或分類學的「專家資料庫」(Wheeler et al., 2000)。 獲取序列所對應的分類學信息有兩種方法。 一種方法,從NCBI 網站下載gi與taxid 對應表,在Taxonomy 資料庫的FTP 地址下載。這個目錄下有多個壓縮文件,其中針對Windows 操作系統的兩個針對蛋白質序列和核苷酸序列的壓縮文件分別是gi_taxid_prot.dmp.gz 和gi_taxid_nucl.dmp.gz 文件。這兩個文件都只有兩列,左邊為gi 號,右邊為Taxid。由於這些文件非常大,因此用瀏覽器來打開這些文件幾乎是不可能的。隨著時間的推移,這兩個文件會越來越大,不過速度不會是指數增長的,並且在美國東部時間的每個星期一2:00 am NCBI 會對其進行更新。 對於Windows 用戶還有一個文件稱為taxmp.zip 文件。文件解壓縮後包括1 個*.prt 文件和6 個*.dmp 文件。Gencode.dmp 文件保存有不同的密碼子表,與同目錄的gc.prt 聯合使用;merged.dmp 是保存有合並的taxid 號的對應表;nodes.dmp 是結點信息;division.dmp 是較大的幾個分類;names.dmp 結點名稱信息,每個id 對應多行。這些數據被Phylogenie 軟體包中的blammer 程序用於構建進化樹。 利用ftp 地址的連接利用Http 或ftp 方式將文件下載到本地,通過本地程序或腳本搜索文本,來建立gi 號與Taxid 之間的聯系(圖)。這種方法比較適合於在線服務的Web 形式的程序,通過在本地不斷地及時更新程序就可以完成這項工作。 第二種方法是對Taxonomy 資料庫進行API 分析。

B. 如何在geo資料庫找想要的資料庫

1、首先GEO資料庫是個什麼鬼呢?
GEO資料庫全稱GENE EXPRESSION
OMNIBUS,是由美國國立生物技術信息中心NCBI創建並維護的基因表達資料庫。它創建於2000年,收錄了世界各國研究機構提交的高通量基因表達數據,也就是說只要是目前已經發表的論文,論文中涉及到的基因表達檢測的數據都可以通過這個資料庫中找到。
2、那GEO資料庫有哪些檢索入口呢?
最常用的有兩種方式,如果你知道GSE編號可以通過網址http://www.ncbi.nlm.nih.gov/geo直接進入,具體編號介紹文件下載方法見:https://www.omicsclass.com/article/1100
另外一種就是通過NCBI主頁的入口基因搜索下載。通常是不知道GEO編號,通過樣品類型,實驗處理,平台信息等搜索篩選想要的GEO數據:https://www.ncbi.nlm.nih.gov/,進入NCBI主頁,搜索數據選擇GEO DataSets,如果搜索某個基因表達量可選擇GEO Profiles。