① ncbi是什麼資料庫
NCBI是美國國家生物技術信息中心,建立於1988年。NCBI的初衷是為了給分子生物學家提供一個信息儲存和處理的系統,除了建有GenBank核酸序列資料庫之外,NCBI還可以提供眾多功能強大的數據檢索與分析工具。
NCBI是National Center for Biotechnology Information的縮寫,指美國國家生物技術信息中心,建立於1988年。NCBI的初衷是為了給分子生物學家提供一個信息儲存和處理的系統,除了建有GenBank核酸序列資料庫(該資料庫的數據資源來自全球幾大DNA資料庫,其中包括日本DNA資料庫DDBJ、歐洲分子生物學實驗室資料庫EMBL以及其它幾個知名科研機構)之外,NCBI還可以提供眾多功能強大的數據檢索與分析工具。
② 國際上三個大的生物信息中心有哪些
一 美國國家生物技術信息中心NCBI(National Center for
Biotechnology Information)
NCBI是一個極具人性化的網站,網站的主頁清晰的闡明了NCBI所做的工作及相關領域最新的熱點內容,新聞等。為了方便使用者更加熟練使用網站資源,NCBI在主頁清晰的標注了站點導航,非常便於初學者熟悉和掌握NCBI的站內資源。
另外,NCBI將其網站資源列於主頁左側,其中包括:SITE MAP, About NCBI, GenBank, Literature
databases, Molecular databases, Genomic biology, Tools, Research at
NCBI, Software engineering, Ecation, FTP site, Contact
information等等。
二EBI(European
Bioinformatics Institute)歐洲生物信息研究所The European
Bioinformatics Institute(EBI)是目前國際上幾個重要分子生物信息網站之一,位置座落於英國The Wellcome Trust
Genome Campus。EBI的任務就是確保分子生物與基因體的研究信息可以公開並且免費提供給科學社群,以促進科學進步。
EBI所提供的服務包括建立/維護資料庫、提供分子生物相關信息服務、執行分子生物與計算分子生物研究;所服務的對象與研究人員擴及各產業,包括分子生物、基因體、醫學與農業學術研究、農業、生物技術、化學與制葯工業。
三DDBJ(DNAData Bank of
Japan)日本核酸資料庫
DDBJ(DNA Data Bank of Japan)
設立在日本國家遺傳研究所(NIG),於1986年開始DNA資料庫的構建工作。從一開始,DDBJ就作為國際性DNA資料庫之一,發揮著重要的作用。它
首先反映的是日本國內資料庫的資源,並與NCBI,EBI進行頻繁的國際性合作。DNA序列中蘊含了大量的數據資源,比起其它生物學數據,它在闡述進化方面的作用更為直接。因此,探求DNA資料庫,不僅是在生命科學方面的研究,更是為人類的發展謀福利。
DDBJ是日本唯一的DNA資料庫,它從研究者那裡收集DNA 序列並且給數據提交者一個國際公認的編碼。DDBJ
主要從日本研究者那裡收集數據,當然,它也接受外國研究者的數據並給以編碼。
③ DNA資料庫的介紹
集合所有已知核酸的核苷酸序列,單核苷酸多態性、結構、性質以及相關描述,包括它們的科學命名、來源物種分類名稱、參考文獻等信息的資料庫。基因和基因組的資料也包含在DNA資料庫中。目前國際上比較重要的核酸(含蛋白質)一級資料庫有美國的GenBank、歐洲的EMBL和日本的DDBJ。三個資料庫信息共享,每日交換,故資料是一樣的,唯格式有所不同。
④ 什麼是生物信息學中的二級資料庫
一、生物信息學資料庫的種類
分子生物信息資料庫種類繁多。歸納起來,大體可以分為4個大類:
基因組資料庫
核酸和蛋白質一級結構資料庫
生物大分子(主要是蛋白質)三維空間結構資料庫
由上述3類資料庫和文獻資料為基礎構建的二級資料庫
一級資料庫(一次資料庫) :基因組資料庫來自基因組作圖,序列資料庫來自序列測定,結構資料庫來自X射線衍射和核磁共振等結構測定。這些資料庫是分子生物學的基本數據資源,通常稱為基本資料庫、初始資料庫,也稱一次資料庫。
二級資料庫(二次資料庫) :是在一級資料庫、實驗數據、理論分析的基礎上,衍生整理而得。它是根據生命科學不同研究領域的實際需要,對基因組圖譜、核酸和蛋白質序列、蛋白質結構以及文獻等數據進行分析、整理、歸納、注釋,構建具有特殊生物學意義和專門用途的資料庫。
一般說來,一級資料庫的數據量大,更新速度快,用戶面廣,通常需要高性能的計算機伺服器、大容量的磁碟空間和專門的資料庫管理系統支撐。
二級資料庫的容量則小得多,更新速度也不像一次資料庫那樣快,也可以不用大型商業資料庫軟體支持,這類針對不同問題開發的二次資料庫的最大特點是使用方便,特別適用於計算機使用經驗不太豐富的生物學家。
序列資料庫是分子生物信息資料庫中最基本的資料庫,包括核酸和蛋白質兩類,以核苷酸鹼基順序或氨基酸殘基順序為基本內容,並附有注釋信息。
GenBank:由美國國家生物技術信息中心(National Center for Biotechnology Information, NCBI)建立(1979-1982)。該中心隸屬於美國國家醫學圖書館,位於美國家衛生研究院(NIH)內。
EMBL:由歐洲分子生物學實驗室(European Molecular Biology Laboratory, 其下有European Bioinformatics Centre)建立(1982),主要位於英國劍橋Cambridge和德國漢堡Hamburg。
DDBJ:日本DNA資料庫(DNA Data Bank of Japan)。由the National Institute of Genetics建立(1984-1987), NIG主管。
二級資料庫的形式:大多以web界面為基礎,具有文字信息、表格、圖形、圖表等方式顯示資料庫內容。
一級資料庫與二級資料庫之間並無明確的界限。(例如:GDB、AceDB、SCOP、CATH等都已經具有二級資料庫的特色)。
⑤ ncbi,embl和什麼並稱三大資料庫
DDBJ:DNA Data Base of Japan 是日本人建立的核酸資料庫;
NCBI中的Genbank是美國建立的核酸資料庫;
EMBL是歐洲建里的核酸資料庫;
這三個資料庫是連通的,數據共享。
⑥ 什麼是Genbank,它的主要用途是什麼
GenBank 概述
· 什麼是GenBank? GenBank 是一個有來自於70,000多種生物的核苷酸序列的資料庫。每條紀錄都有編碼區(CDS)特徵的注釋,還包括氨基酸的翻譯。GenBank屬於一個序列資料庫的國際合作組織,包括EMBL和DDBJ。
· 紀錄樣本 - 關於GenBank的各個欄位的詳細描述,以及同Entrez搜索欄位的交叉索引。
· 訪問GenBank - 通過 Entrez Nucleotides 來查詢。用 accession number,作者姓名,物種,基因/蛋白名字,還有許多其他的文本術語來查詢。關於 Entrez 更多的信息請看下文。用 BLAST 來在 GenBank 和其他資料庫中進行序列相似搜索。用E-mail來訪問Entrez 和 BLAST 可以通過 Query 和 BLAST 伺服器。另外一種選擇是可以用 FTP 下載整個的 GenBank 和更新數據。
· 增長統計 - 參見公布通知的2.2.6(每個分類的統計),2.2.7(每個物種的統計),2.2.8(GenBank增長)小節。
· 公布通知,最新 - 最近和即將有的變化,GenBank 的分類,數據增長統計,GenBank 的引用。
· 公布通知,舊 - 同上相同,是過去公布的統計。
· 遺傳密碼 - 15個遺傳密碼的概要。用來確保GenBank中紀錄的編碼序列被正確的翻譯。
向GenBank提交數據
· 關於提交序列數據,收到 accession number,和對紀錄作更新的一般信息。
· BankIt - 用於一條或者少數條提交的基於WWW的提交工具軟體。(請在提交前用 VecScreen 去除載體)
· Sequin - 提交軟體程序,用於一條或者很多條的提交,長序列,完整基因組,alignments,人群/種系/突變研究的提交。可以懶⑹褂茫�蛘哂沒�赥CP/IP的"network aware"模式,可以鏈接到其他NCBI的資源和軟體比如Entrez和PowerBLAST。(請在提交前用VecScreen去除載體)
· ESTs - 表達序列標簽,短的、單次(測序)閱讀的cDNA序列。也包括來自於差異顯示和 RACE 實驗的 cDNA 序列。
· GSSs - 基因組調查序列,短的、單次(測序)閱讀的cDNA序列,exon trap 獲得的序列,cosmid/BAC/YAC 末端,及其他。
· HTGs - 來自於大規模測序中心的高通量基因組序列,未完成的(階段0,1,2)和完成的(階段3)序列。(注意:完成的人類的HTG序列可以同時在 GenBank 和 Human Genome Sequencing 頁面上訪問。)
· STSs - 序列標簽位點。短的在基因組上可以被唯一操作的序列,用於產生作圖位點。
· 註:SNPs - 人類的和其他物種的遺傳變異數據可以提交到NCBI資料庫的單核苷酸多態性庫中(dbSNP)。
國際核苷酸序列資料庫合作組織
· GenBank,DDBJ,EMBL - 合作計劃的概述,並鏈接到相應的主頁。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)資料庫共享的數據是每天都交換的,因此他們是相等的。數據紀錄的格式和搜索方式可能會不一樣,但是accession number,序列數據和註解都是一模一樣的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相應紀錄,得到的結果是完全一樣的序列數據,參考內容等等。
· DDBJ/EMBJ/GenBank 特性表 - 特性表格式和標准被合作資料庫用在序列記錄的注釋上,使得數據共享成為可能,包括詳細的描述生物特性和特性限定語的附錄,以及IUPAC規定的核苷酸和氨基酸的代號。
FTP GenBank 及每日更新
· GenBank普通文件格式 - 參見GenBank記錄樣本和在GenBank公布通知中的詳細描述,下載大多數最近的完全公告和日常積累或非積累更新數據。
· ASN.1格式 - 摘要句法記號1,國際標准組織(ISO)數據表示格式,下載大多數最近的完全公告和日常積累或非積累更新數據。
· FASTA格式 - 定義行號後只跟隨序列數據(示例),參見描述資料庫的readme文件,包括nt.Z(每天更新的非冗餘BLAST核酸資料庫,包括GenBank+EMBL+DDBJ+PDB序列,但是不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗餘蛋白質),est.Z, gss.Z, htg.Z, sts.Z,和其它文件。
http://www.bioon.com/biology/Print.asp?ArticleID=1256
⑦ 世界上主要的基因庫有哪幾個
uropean Molecular Biology Laboratory (EMBL) ,歐洲分子生物學實驗室.
Cambridge,UK.
· GenBank ,美國國家生物技術信息中心 (NCBI)所維護的供公眾自由讀取的、帶注釋的DNA序列的總資料庫.
· DNA Databank of Japan (DDBJ) ,日本核酸資料庫.
主要就這三個,當然還有一些其他的專門的基因資料庫.
⑧ 資料庫在植物檢疫中的作用是什麼
資料庫在植物檢疫中的作用越來越重要。各種類型的檢疫資料庫相繼建立,並應用於植物檢疫。EPPO建立了植物檢疫PQ資料庫。該資料庫包括了EPPO所有A1和A2名單中的有害生物的寄主范圍、地理分布及其他詳盡的目錄。同時,包括每種有害生物在一個國家中發生程度的細節如溫室、田間發生情況,傳入日期及撲滅情況的信息。EPPO還和CABI合作,為歐盟(EU)編制了植物檢疫資料單的資料庫,其目的是使歐盟的植物檢疫建立在統一的檢疫條款基礎之上。資料單使用標准化的標題,分別是有害生物(包括學名、異名、分類地位、俗名、命名和分類的說明)、寄主、地理分布、生物學、檢測和鑒定、傳播和擴散的方式、有害生物的重要性(包括經濟影響、防治和檢疫風險)和植物檢疫措施及參考文獻。目前不僅有電子版的資料庫,還出版了《歐洲檢疫性有害生物》的參考書。
FAO開發的全球檢疫信息系統亦是一個相類似的檢疫資料庫。該資料庫不僅提供同上述相似的數據,而且還能提供有關國家和地區植保組織的植物檢疫條例摘要、檢疫性有害生物名單及處理方法。另外,FAO/國際作物遺傳資源局IBPGR的種質資源安全運輸的技術指南、美國農業部反映檢疫截獲信息的植物檢疫截獲記錄資料庫、亞洲太平洋地區的植物檢疫中心和培訓研究所(PLANTI)的植物信息資料庫(PLANT1NFO)等都是有關植物檢疫的專業資料庫。另外,USDA-APHIS和USDA-ARS建立的國家農業病原信息系統(NAPIS)和世界植物病原資料庫(WPPD)及由澳大利亞AQIS建立的病蟲害信息庫亦是檢疫中很重要的資料庫。CABI在1998年推出了全球植物保護手冊(CPC)的光碟,可供各植檢單位使用。該光碟提供了大量的有害生物的生物學資料、信息和照片。
在中國,檢驗檢疫部門亦已經開發了一個《動植物檢驗檢疫文獻題錄資料庫》。該庫收錄了農業部1996年公布的97種進境動物的一二類傳染病、寄生蟲病和84種(類)進境植物檢疫為險性有害生物的文獻,包括自1971年至今的近11萬條有關動物疫情和植物有害生物的信息,並可查詢有關的寄主信息,是動植物檢驗檢疫部門開展科研工作進行文獻檢索的有力工具。
除以上資料庫外,還有其他類型的事實型資料庫,包括拜耳公司(BayerAG)的有害生物名稱和異名資料庫,有關防治方法特別是遺傳抗性和殺蟲劑信息的資料庫(Russell,1991年;Kidd,1991年)及關於標本和培養物的資料庫(Allsop等,1989年)等均大大便利了PRA工作的開展。特別值得一提的是,因為生物命名法的不斷變化,其連續性還不完善,而且生物數量巨大,因此生物名稱庫在提供獲取其他信息的途徑時,具有特別重要的意義。CABI國際農業生物中心索引庫CABIThesaurus就建立了與農業及相關學科有關的75000個詞庫,其中1/10的術語是昆蟲名稱。在其節肢動物名稱索引(ANI)中,約有10萬個昆蟲和其他節肢動物的名稱和異名,且這些異名在植物保護的文獻中經常遇到。其他還有澳大利亞國際農業研究中心編制的東南亞農業主要節肢動物及雜草名錄,FAO(1993年)編制的亞太地區主要作物重要有害生物名錄等,均是有價值的信息源。現代信息技術亦為了解各國的檢疫法規提供了便利,如歐盟建立的JUSTIS-CELEX資料庫系統。該系統包括歐共體1952年成立以來頒布的全部法規,如貿易、金融、海關和動植物檢驗檢疫法規等。在中國,亦已建立了《中外法律信息系統》,這些法規資料庫將為檢疫執法和決策提供有力的證據。
隨著分子遺傳學越來越廣泛地應用於植物保護,特別是有害生物的分類和鑒定中,其迅速擴大的核酸蛋白序列資料庫可為PRA工作提供有害生物在分子水平上的信息。目前已建立的核酸蛋白序列資料庫有歐洲分子生物學實驗室核酸序列資料庫EMBI(1988年)、基因銀行Genbank(1992年)、美國的核糖體資料庫RAP(RibosomalDatabaseProject,1993年)、日本的DNA資料庫DDBJ(DNADataBaseofJapan)和基因序列資料庫GS-DB等。可以預期,這些資料庫將在有害生物如病毒、類病毒、植原體(Phytoplasma)和細菌的分類和鑒定方面起越來越重要的作用,特別是在種下水平的變異識別上可能對檢疫決策具有重要意義。如中國的檢疫性有害生物香蕉細菌性枯萎病(Ralstomasolanacearum)就是該病原的小種2。