當前位置:首頁 » 數據倉庫 » 核苷酸序列資料庫是什麼
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

核苷酸序列資料庫是什麼

發布時間: 2022-05-04 04:38:37

A. 什麼是生物信息學中的二級資料庫

一、生物信息學資料庫的種類

分子生物信息資料庫種類繁多。歸納起來,大體可以分為4個大類:

基因組資料庫

核酸和蛋白質一級結構資料庫

生物大分子(主要是蛋白質)三維空間結構資料庫

由上述3類資料庫和文獻資料為基礎構建的二級資料庫

一級資料庫(一次資料庫) :基因組資料庫來自基因組作圖,序列資料庫來自序列測定,結構資料庫來自X射線衍射和核磁共振等結構測定。這些資料庫是分子生物學的基本數據資源,通常稱為基本資料庫、初始資料庫,也稱一次資料庫。

二級資料庫(二次資料庫) :是在一級資料庫、實驗數據、理論分析的基礎上,衍生整理而得。它是根據生命科學不同研究領域的實際需要,對基因組圖譜、核酸和蛋白質序列、蛋白質結構以及文獻等數據進行分析、整理、歸納、注釋,構建具有特殊生物學意義和專門用途的資料庫。
一般說來,一級資料庫的數據量大,更新速度快,用戶面廣,通常需要高性能的計算機伺服器、大容量的磁碟空間和專門的資料庫管理系統支撐。

二級資料庫的容量則小得多,更新速度也不像一次資料庫那樣快,也可以不用大型商業資料庫軟體支持,這類針對不同問題開發的二次資料庫的最大特點是使用方便,特別適用於計算機使用經驗不太豐富的生物學家。

序列資料庫是分子生物信息資料庫中最基本的資料庫,包括核酸和蛋白質兩類,以核苷酸鹼基順序或氨基酸殘基順序為基本內容,並附有注釋信息。

GenBank:由美國國家生物技術信息中心(National Center for Biotechnology Information, NCBI)建立(1979-1982)。該中心隸屬於美國國家醫學圖書館,位於美國家衛生研究院(NIH)內。

EMBL:由歐洲分子生物學實驗室(European Molecular Biology Laboratory, 其下有European Bioinformatics Centre)建立(1982),主要位於英國劍橋Cambridge和德國漢堡Hamburg。

DDBJ:日本DNA資料庫(DNA Data Bank of Japan)。由the National Institute of Genetics建立(1984-1987), NIG主管。

二級資料庫的形式:大多以web界面為基礎,具有文字信息、表格、圖形、圖表等方式顯示資料庫內容。

一級資料庫與二級資料庫之間並無明確的界限。(例如:GDB、AceDB、SCOP、CATH等都已經具有二級資料庫的特色)。

B. genbank如何使用

GenBank Overview 基本信息
• 什麼是GenBank?GenBank是一個有來自於70,000多種生物的核苷酸序列的資料庫。每條紀錄都有編碼區(CDS)特徵的注釋,還包括氨基酸的翻譯。GenBank屬於一個序列資料庫的國際合作組織,包括EMBL和DDBJ。
• 紀錄樣本 - 關於GenBank的各個欄位的詳細描述,以及同Entrez搜索欄位的交叉索引。
訪問GenBank - 通過Entrez Nucleotides來查詢。用accession number,作者姓名,物種,基因/蛋白名字,還有許多其他的文本術語來查詢。關於Entrez更多的信息請看下文。用BLAST來在GenBank和其他資料庫中進行序列相似搜索。用E-mail來訪問Entrez和BLAST可以通過Query和BLAST伺服器。另外一種選擇是可以用FTP下載整個的GenBank和更新數據。
• 增長統計 - 參見公布通知的2.2.6(每個分類的統計),2.2.7(每個物種的統計),2.2.8(GenBank增長)小節。
• 公布通知,最新 - 最近和即將有的變化,GenBank的分類,數據增長統計,GenBank的引用。 • 公布通知,舊 - 同上相同,是過去公布的統計。
• 遺傳密碼 - 15個遺傳密碼的概要。用來確保GenBank中紀錄的編碼序列被正確的翻譯。 (向)GenBank提交(數據)
• 關於提交序列數據,收到accession number,和對紀錄作更新的一般信息。
• BankIt - 用於一條或者少數條提交的基於WWW的提交工具軟體。(請在提交前用VecScreen去除載體) • Sequin - 提交軟體程序,用於一條或者很多條的提交,長序列,完整基因組,alignments,人群/種系/突變研究的提交。可以獨立使用,或者用基於TCP/IP的「network aware」模式,可以鏈接到其他NCBI的資源和軟體比如Entrez和PowerBLAST。(請在提交前用VecScreen去除載體)
• ESTs - 表達序列標簽,短的、單次(測序)閱讀的cDNA序列。也包括來自於差異顯示和RACE實驗的cDNA序列。
• GSSs - 基因組調查序列,短的、單次(測序)閱讀的cDNA序列,exon trap獲得的序列,cosmid/BAC/YAC末端,及其他。
• HTGs - 來自於大規模測序中心的高通量基因組序列,未完成的(階段0,1,2)和完成的(階段3)序列。(注意:完成的人類的HTG序列可以同時在GenBank和Human Genome Sequencing頁面上訪問。) • STSs - 序列標簽位點。短的在基因組上可以被唯一操作的序列,用於產生作圖位點。
• 註:SNPs - 人類的和其他物種的遺傳變異數據可以提交到NCBI資料庫的單核苷酸多態性庫中(dbSNP)。 國際核苷酸序列資料庫合作組織
• GenBank,DDBJ,EMBL - 合作計劃的概述,並鏈接到相應的主頁。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)資料庫共享的數據是每天都交換的,因此他們是相等的。數據紀錄的格式和搜索方式可能會不一樣,但是accession number,序列數據和註解都是一模一樣的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相應紀錄,得到的結果是完全一樣的序列數據,參考內容等等。
• DDBJ/EMBJ/GenBank特性表 — 特性表格式和標准被合作資料庫用在序列記錄的注釋上,使得數據共享成為可能,包括詳細的描述生物特性和特性限定語的附錄,以及IUPAC規定的核苷酸和氨基酸的代號。

C. 什麼是Genbank,它的主要用途是什麼

GenBank 概述

· 什麼是GenBank? GenBank 是一個有來自於70,000多種生物的核苷酸序列的資料庫。每條紀錄都有編碼區(CDS)特徵的注釋,還包括氨基酸的翻譯。GenBank屬於一個序列資料庫的國際合作組織,包括EMBL和DDBJ。

· 紀錄樣本 - 關於GenBank的各個欄位的詳細描述,以及同Entrez搜索欄位的交叉索引。

· 訪問GenBank - 通過 Entrez Nucleotides 來查詢。用 accession number,作者姓名,物種,基因/蛋白名字,還有許多其他的文本術語來查詢。關於 Entrez 更多的信息請看下文。用 BLAST 來在 GenBank 和其他資料庫中進行序列相似搜索。用E-mail來訪問Entrez 和 BLAST 可以通過 Query 和 BLAST 伺服器。另外一種選擇是可以用 FTP 下載整個的 GenBank 和更新數據。

· 增長統計 - 參見公布通知的2.2.6(每個分類的統計),2.2.7(每個物種的統計),2.2.8(GenBank增長)小節。

· 公布通知,最新 - 最近和即將有的變化,GenBank 的分類,數據增長統計,GenBank 的引用。

· 公布通知,舊 - 同上相同,是過去公布的統計。

· 遺傳密碼 - 15個遺傳密碼的概要。用來確保GenBank中紀錄的編碼序列被正確的翻譯。

向GenBank提交數據

· 關於提交序列數據,收到 accession number,和對紀錄作更新的一般信息。

· BankIt - 用於一條或者少數條提交的基於WWW的提交工具軟體。(請在提交前用 VecScreen 去除載體)

· Sequin - 提交軟體程序,用於一條或者很多條的提交,長序列,完整基因組,alignments,人群/種系/突變研究的提交。可以懶⑹褂茫�蛘哂沒�赥CP/IP的"network aware"模式,可以鏈接到其他NCBI的資源和軟體比如Entrez和PowerBLAST。(請在提交前用VecScreen去除載體)

· ESTs - 表達序列標簽,短的、單次(測序)閱讀的cDNA序列。也包括來自於差異顯示和 RACE 實驗的 cDNA 序列。

· GSSs - 基因組調查序列,短的、單次(測序)閱讀的cDNA序列,exon trap 獲得的序列,cosmid/BAC/YAC 末端,及其他。

· HTGs - 來自於大規模測序中心的高通量基因組序列,未完成的(階段0,1,2)和完成的(階段3)序列。(注意:完成的人類的HTG序列可以同時在 GenBank 和 Human Genome Sequencing 頁面上訪問。)

· STSs - 序列標簽位點。短的在基因組上可以被唯一操作的序列,用於產生作圖位點。

· 註:SNPs - 人類的和其他物種的遺傳變異數據可以提交到NCBI資料庫的單核苷酸多態性庫中(dbSNP)。

國際核苷酸序列資料庫合作組織

· GenBank,DDBJ,EMBL - 合作計劃的概述,並鏈接到相應的主頁。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)資料庫共享的數據是每天都交換的,因此他們是相等的。數據紀錄的格式和搜索方式可能會不一樣,但是accession number,序列數據和註解都是一模一樣的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相應紀錄,得到的結果是完全一樣的序列數據,參考內容等等。

· DDBJ/EMBJ/GenBank 特性表 - 特性表格式和標准被合作資料庫用在序列記錄的注釋上,使得數據共享成為可能,包括詳細的描述生物特性和特性限定語的附錄,以及IUPAC規定的核苷酸和氨基酸的代號。

FTP GenBank 及每日更新

· GenBank普通文件格式 - 參見GenBank記錄樣本和在GenBank公布通知中的詳細描述,下載大多數最近的完全公告和日常積累或非積累更新數據。

· ASN.1格式 - 摘要句法記號1,國際標准組織(ISO)數據表示格式,下載大多數最近的完全公告和日常積累或非積累更新數據。

· FASTA格式 - 定義行號後只跟隨序列數據(示例),參見描述資料庫的readme文件,包括nt.Z(每天更新的非冗餘BLAST核酸資料庫,包括GenBank+EMBL+DDBJ+PDB序列,但是不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗餘蛋白質),est.Z, gss.Z, htg.Z, sts.Z,和其它文件。

http://www.bioon.com/biology/Print.asp?ArticleID=1256

D. 基因資料庫 一般使用什麼資料庫

集合所有已知核酸的核苷酸序列,單核苷酸多態性、結構、性質以及相關描述,包括它們的科學命名、來源物種分類名稱、參考文獻等信息的資料庫。基因和基因組的資料也包含在DNA資料庫中。目前國際上比較重要的核酸(含蛋白質)一級資料庫有美國的GenBank、歐洲的EMBL和日本的DDBJ。三個資料庫信息共享,每日交換,故資料是一樣的,唯格式有所不同。

E. 什麼叫核苷酸序列

核苷酸序列就是指DNA或RNA中鹼基的排列順序.
這意味著DNA中A,T,G,C的排列循序,或者mRNA中A,U,G,C的排列循序,也包括rRNA,tRNA中鹼基的排列順序.
環核苷酸不存在核苷酸序列.

希望我的回答對您有幫助,滿意請採納,謝謝。

F. 核酸序列、結構資料庫有哪些

美國的核酸資料庫GenBank
http://www.ncbi.nlm.nih.gov
歐洲核酸序列資料庫EMBL
http://www.embl-heidelberg.de
日本核酸序列資料庫DDBJ
http://www.ddbj.nig.ac.jp

這是目前世界三大核酸資料庫.不本我們用的最多的還是NCBI,基本上是不用日本的!

G. 什麼是核苷酸序列

DNA(RNA)分子是由4種核苷酸(A,T,G,C)排列組成,DNA序列就是組成某一DNA分子的核苷酸的排列次序。 一類由嘌呤鹼或嘧啶鹼、核糖或脫氧核糖以及磷酸三種物質組成的化合物。又稱核甙酸。戊糖與有機鹼合成核苷,核苷與磷酸合成核苷酸,4種核苷酸組成核酸。核苷酸主要參與構成核酸,許多單核苷酸也具有多種重要的生物學功能,如與能量代謝有關的三磷酸腺苷(ATP)、脫氫輔酶等。某些核苷酸的類似物能幹擾核苷酸代謝,可作為抗癌葯物。根據糖的不同,核苷酸有核糖核苷酸及脫氧核苷酸兩類。根據鹼基的不同,又有腺嘌呤核苷酸(腺苷酸,AMP)、鳥嘌呤核苷酸(鳥苷酸,GMP)、胞嘧啶核苷酸(胞苷酸, CMP)、尿嘧啶核苷酸(尿苷酸,UMP)、胸腺嘧啶核苷酸(胸苷酸,TMP)及次黃嘌呤核苷酸(肌苷酸,IMP)等。核苷酸中的磷酸又有一分子、兩分子及三分子幾種形式。此外,核苷酸分子內部還可脫水縮合成為環核苷酸。

說白了就是 A,T,G,C的排列循序.建議你看看下面的地址.

H. GenBank資料庫的介紹

GenBank 是一個有來自於70,000多種生物的核苷酸序列的資料庫。每條紀錄都有編碼區(CDS)特徵的注釋,還包括氨基酸的翻譯。GenBank屬於一個序列資料庫的國際合作組織,包括EMBL和DDBJ。