當前位置:首頁 » 數據倉庫 » ncbi資料庫
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

ncbi資料庫

發布時間: 2022-02-04 01:04:49

A. 怎麼用ncbi資料庫查找基因序列編號

GI編號是NCBI網站的所有序列相關資料庫的流水編號,其最有用的特徵就是唯一性.對於每一條遞交給NCBI的序列,都會付給一個編號,而
且這個編號對應的序列不可更改.這個編號對應這個唯一的一條序列,類似與我們用的身份證號.因此,利用GI在NCBI中查詢時,你只要把資料庫(蛋白質/
核苷酸)選對,只要輸入這個號碼就可以把相應的序列調出來.
值得一提的是登錄號(Accession Number).每一個遞交的序列,除了獲得一個GI號,還會被賦予一個登錄號.遞交序列的作者利用登錄號對序列進行修改和完善.每一次修改的序列會獲得一個新的GI號,登錄號不變,但會追加一個流水的版本號.
因此,GI號和帶版本號的登錄號都唯一定位到唯一條序列.

B. NCBI選擇資料庫

原理很簡單後者是前者的子集。chromosome只包含所有已經測序的基因組數據。估計你的序列可能只是在高等生物中保守,所以才會出現選擇chromosome資料庫時相似數量下降非常多。

在做BLAST的時候,我們通常需要根據不同的目的選擇不同的資料庫。例如,要看一下測的序列是不是子集所期望的序列,以及,那nr資料庫是最好的選擇。至於以誰為准,因需要解決的問題而異。讀一下blast每個資料庫的定義,對於你選擇資料庫最有幫助。有一個基本原則是:nr資料庫可以滿足絕大多數的需求。少數特殊需求可以通過其他資料庫完成,例如最近30天內的更新序列,搜索新基因這是必查的;題目中的chromosome資料庫是只包含了全基因組或全染色體的數據。詳參NCBI Blast說明。

http://www.ncbi.nlm.nih.gov/BLAST/blastcgihelp.shtml#nucleotide_databases

C. ncbi資料庫怎麼查找基因序列

在NCBI主頁上方search欄左邊有一個database選擇框,點擊下拉三角形選擇nucleotide(如圖紅框)在search欄輸入基因名搜索即可.以人的orc1基因為例,在搜索結果中選擇mRNA和complete
cds序列的結果都可以,如下點擊進入序...

D. NCBI資料庫有多少完整的細菌基因組序列該如何查閱

如果是基因組信息的話,選擇框里先選擇:Nucleotide
然後,輸入序列號或者輸入你要找的基因的名稱
找到以後,點擊FASTA,可以下載,也可以直接復制。
一般都是存TXT格式,這樣用軟體分析才能載入

E. NCBI是什麼主要是做什麼

NCBI (National Center for Biotechnology Information )是指美國國立生物技術信息中心。


理解自然無聲但精妙的關於生命細胞的語言是現代分子生物學的要求。通過只有四個字母來代表DNA化學亞基的字母表,出現了生命過程的語法,其最復雜形式就是人類。


闡明和使用這些字母來組成新的"單詞和短語"是分子生物學領域的中心焦點。數目巨大的分子數據和這些數據的隱秘而精細的模式使得計算機化的資料庫和分析方法成為絕對的必須。挑戰在於發現新的手段去處理這些數據的容量和復雜性,並且為研究人員提供更好的便利來獲得分析和計算的工具,以便推動對我們遺傳之物和其在健康和疾病中角色的理解。



基本研究

它的使命包括四項任務:


建立關於分子生物學,生物化學,和遺傳學知識的存儲和分析的自動系統。

實行關於用於分析生物學重要分子和復合物的結構和功能的基於計算機的信息處理的,先進方法的研究。

加速生物技術研究者和醫葯治療人員對資料庫和軟體的使用。

全世界范圍內的生物技術信息收集的合作努力。


NCBI通過下面的計劃來實現它的四項目的:

NCBI有一個多學科的研究小組包括計算機科學家,分子生物學家,數學家,生物化學家,實驗物理學家,和結構生物學家,集中於計算分子生物學的基本的和應用的研究。這些研究者不僅僅在基礎科學上做出重要貢獻,而且往往成為應用研究活動產生新方法的源泉。


他們一起用數學和計算的方法研究在分子水平上的基本的生物醫學問題。


這些問題包括基因的組織,序列的分析,和結構的預測。目前研究計劃的一些代表是:檢測和分析基因組織,重復序列形式,蛋白domain和結構單元,建立人類基因組的基因圖譜,HIV感染的動力學數學模型,資料庫搜索中的序列錯誤影響的分析,開發新的資料庫搜索和多重序列對齊演算法,建立非冗餘序列資料庫,序列相似性的統計顯著性評估的數學模型和文本檢索的矢量模型。


另外,NCBI研究者還堅持推動與NIH內部其他研究所及許多科學院和政府的研究實驗室的合作。

F. 如何用NCBI資料庫查病毒全基因的背景信息

選擇NCBI genome資料庫,這個庫中收錄目前經過測序的所有物種的參考基因組。你只要輸入你需要的病毒名稱比如HIV,就可以看到這個病毒的全基因組序列。你還可以點擊某條序列,進入到詳細信息界面,就可以看到這個序列的來源。

G. NCBI有多少資料庫,分別有什麼作用

在生物醫學信息學領域,資料庫和服務的定義與計算機領域有很大的不同,如果要問NCBI過去,現在或將來會有多少資料庫,恐怕連NCBI自己都說不清楚。要是一個一個資料庫講下來,9999個字肯定不夠用。這里有一個列表供您參考http://www.ncbi.nlm.nih.gov/guide/all/。

NCBI的產生和發展是在美國和全球生物學高速發展,高通量數據急速產生,而缺乏有效的數據分析方法的背景下產生,起初它主要任務是數據的存儲和查詢。只不過其存儲的數據大多以高通量數據為主,例如基因測序,基因組,SNP, 基因晶元,小分子化合物和GWAS數據等。這些數據的共享,極大地促進了生物信息學發展。

按照數據->樣式->知識->智慧的發展模式,NCBI主要起到了一個為生物學家提供數據的角色。不過,NCBI目前也不斷地在調整自己的角色。例如,生物醫學文獻。NCBI在從NLM繼承過來的pubmed的基礎,提供以PMC資料庫為核心的全文文獻服務。PubMed資料庫應該是全球生物學家使用頻率最高的資料庫。NCBI最近對pubmed的改版,雖然沒有實質性的改變,但其按照用戶體驗進行的修改,足見其對該資料庫的重視。

另外,NCBI目前不斷地在引入高學歷生物學人才對其資料庫的質量進行控制。以dbSNP為例,其正在通過與領域專家的合作將突變數據與人類表型數據進行關聯。

總得來講,NCBI的發展是與生物學高通量數據產生密切相關,它以經不在局限於提供數據存儲與查詢,其未來的發展必將發展為一個大型的、綜合的知識庫。到那時NCBI會不會免費,就要另當別論了。很顯然沒有人會將自己的手稿拱手讓人。如果真有那麼一天,不知道從中會產生多少專利和知識產權。

H. 如何從ncbi上下載database

因此NCBI 的分類學資料庫不是一個系統發育或分類學的「專家資料庫」(Wheeler et al., 2000)。 獲取序列所對應的分類學信息有兩種方法。 一種方法,從NCBI 網站下載gi與taxid 對應表,在Taxonomy 資料庫的FTP 地址下載。這個目錄下有多個壓縮文件,其中針對Windows 操作系統的兩個針對蛋白質序列和核苷酸序列的壓縮文件分別是gi_taxid_prot.dmp.gz 和gi_taxid_nucl.dmp.gz 文件。這兩個文件都只有兩列,左邊為gi 號,右邊為Taxid。由於這些文件非常大,因此用瀏覽器來打開這些文件幾乎是不可能的。隨著時間的推移,這兩個文件會越來越大,不過速度不會是指數增長的,並且在美國東部時間的每個星期一2:00 am NCBI 會對其進行更新。 對於Windows 用戶還有一個文件稱為taxmp.zip 文件。文件解壓縮後包括1 個*.prt 文件和6 個*.dmp 文件。Gencode.dmp 文件保存有不同的密碼子表,與同目錄的gc.prt 聯合使用;merged.dmp 是保存有合並的taxid 號的對應表;nodes.dmp 是結點信息;division.dmp 是較大的幾個分類;names.dmp 結點名稱信息,每個id 對應多行。這些數據被Phylogenie 軟體包中的blammer 程序用於構建進化樹。 利用ftp 地址的連接利用Http 或ftp 方式將文件下載到本地,通過本地程序或腳本搜索文本,來建立gi 號與Taxid 之間的聯系(圖)。這種方法比較適合於在線服務的Web 形式的程序,通過在本地不斷地及時更新程序就可以完成這項工作。 第二種方法是對Taxonomy 資料庫進行API 分析。

I. ncbi embl和什麼並稱三大資料庫

<a href="http://www.ncbi.nlm.nih.gov/" target="_blank">http://www.ncbi.nlm.nih.gov/</a>,是一個基因庫,可以查詢已知序列,還可以查找文章,登記序列等等,不管是篩選細菌還是做分子實驗,都是很有用的網站

J. 誰知道怎樣在NCBI中找資料庫

NCBI 分類學資料庫(taxonomy database)不是分類學或系統發育信息的信息源(primary source),而且也沒有自己的一套完整的分類學系統,相反它只是努力整合各種各樣來源的系統發育和分類學的知識,包括發表的文獻、基於網路的資料庫、序列提交者的建議以及來自NCBI 外部的分類學專家。因此NCBI 的分類學資料庫不是一個系統發育或分類學的「專家資料庫」(Wheeler et al., 2000)。
獲取序列所對應的分類學信息有兩種方法。
一種方法,從NCBI 網站下載gi與taxid 對應表,在Taxonomy 資料庫的FTP 地址下載。這個目錄下有多個壓縮文件,其中針對Windows 操作系統的兩個針對蛋白質序列和核苷酸序列的壓縮文件分別是gi_taxid_prot.dmp.gz 和gi_taxid_nucl.dmp.gz 文件。這兩個文件都只有兩列,左邊為gi 號,右邊為Taxid。由於這些文件非常大,因此用瀏覽器來打開這些文件幾乎是不可能的。隨著時間的推移,這兩個文件會越來越大,不過速度不會是指數增長的,並且在美國東部時間的每個星期一2:00 am NCBI 會對其進行更新。
對於Windows 用戶還有一個文件稱為taxmp.zip 文件。文件解壓縮後包括1 個*.prt 文件和6 個*.dmp 文件。Gencode.dmp 文件保存有不同的密碼子表,與同目錄的gc.prt 聯合使用;merged.dmp 是保存有合並的taxid 號的對應表;nodes.dmp 是結點信息;division.dmp 是較大的幾個分類;names.dmp 結點名稱信息,每個id 對應多行。這些數據被Phylogenie 軟體包中的blammer 程序用於構建進化樹。
利用ftp 地址的連接利用Http 或ftp 方式將文件下載到本地,通過本地程序或腳本搜索文本,來建立gi 號與Taxid 之間的聯系(圖)。這種方法比較適合於在線服務的Web 形式的程序,通過在本地不斷地及時更新程序就可以完成這項工作。
第二種方法是對Taxonomy 資料庫進行API 分析。NCBI 用來保存Taxonomy信息的資料庫名稱為TAXON。