① 二十一世紀基因技術的幾個重大突破
1 生物多樣性
自然界蘊藏著巨大的微生物資州茄族源,但是人類至今對極端環境微生物(extremophiles)和未培養微生物(unculturable microorganisms)兩個資源寶庫涉足不深,所以研究開發潛力極大。
可以預期,人們能從嗜酸、嗜鹼、嗜冷、嗜熱、嗜鹽、嗜壓等等極端微生物中獲得許多有價值的酶、蛋白質以及其他活性物質。在過去幾年中,隨著重組酶生產技術的開發,使人們有可能從更廣泛的來源獲取更廉價的酶。近年在這方面取得的進展在一定程度上得益於極端微生物培養技術的進步,更得益於把極端微生物的基因轉移到常用受體微生物宿主能力的提高。如此一來,人們有理由相信:在溫和、便宜的生長條件下就可以生產出對極端環境具有耐受性能的生物催化劑來。
另外據知,能夠在實驗室培養的微生物的種類僅占自然界中微生物總數的不到1%!也就是說,還有99%的不可培養的微生物等待著我們用非常規手段加以研究。作為微生物資源研究和開發領域里的一個重大探索,可以採用最新的分子生物學方法,繞過菌種分離純化這一步驟,直接在自然界中尋找有開發價值的微生物基因。把來源於未經培養的微生物的DNA克隆到業經培養馴化的宿主生物體中,然後用高通量篩選技術從重組的克隆里篩選為新酶編碼的基因。
微生物世界展示給人類如此巨大的機會使我們興奮不已,一些有識之士指出:未知的微生物世界或許是地球上最大的未開發的自然資源,能充分利用這個微生物資源寶庫的國家必將取得發展的先機。
2.2 基因組測序
隨著DNA測序能力的提高,對序列的分析能力也得到加強,於是可以發現許多新的基因。通過同已知基因序列進行比較來推斷新基因表達產物的基本酶活性。當然目前的技術水平還不足以推斷出這些酶性質的許多細節。因此必須表達這些新發現的基因,以確定它們在一個特定的過程中是否確實有用。假定,從一種生物體來源的所有的酶在它的正常生長溫度下都有功能,那麼來自超級嗜熱微生物的DNA序列就能成為尋找在沸點附近仍然有功能的酶的合理起點納銷;同樣可以認為,嗜冷微生物的基因則可能成為在零度仍然具有功能的酶的可能來源。
網際網路最新資料表明:大約60種微生物的基因組序列已經完成,另外還有近200種微生物基因組預期很快就可以完成。測序工作的努力已經揭示了數萬個新基因,主要的是編碼酶的一些基因,其中大約三分之一可以被歸到「有功能」的家族裡,這是一個十分豐富、而且每天都在增加的新工業酶後選者的來源。相信隨著基因組時代的到來,將會有大量新的工業酶被人類發現。
2.3 定向性進化
在以發現工業酶為主要目標的所有技術中,定向進化(directed evolution簡稱DE)可能是最強有力的一種。DE是一種快速而廉價的發現各種新酶的方法。這類新酶在特定的條件下應該比天然酶工作得更好。DE模擬自然進化,這種進化取決於從多樣性群體中選擇合適「個體」,這里的「個體」就是酶。DE是定向的,意思是研究者通過一步步改進使選擇的各種酶要符合一定預期的標准。DE從克隆擬改進的酶的基因起始。分離到的基因通過體外突變使其多樣性得到加強。然後,克隆這些突變株的DNA,並且在通常的受體中表達,分析表達產物的酶活力,選擇最好的變異株克隆。它的基因又作為下一輪篩選的新起點。使用這一方法需要掌握兩項重要的支撐技術,即DNA重排(DNA shaffling)和高通量篩選技術。
2.4 噬菌體展示
該技術最初是用於鑒定和分離蛋白質的一些結構域,該結構域能夠牢固地結合到別的分子上。但是近年這個核心技術又經過進一步設計和發展,致使擬被改良的酶在理論上也可充當被鑒定和分離的靶子。噬菌體展示最簡單的形式涉及把小段靶子DNA,(該DNA應該是突變和篩選的靶子)插入噬菌體的基因組中,其冊弊插入位置要求其編碼的蛋白質結構域能夠出現在噬菌體顆粒的表面上。靶子基因的突變導致各種不同的結構域在表面上展示,如果各種不同的結構域的任何一個能足夠牢固地結合到一種固定化底物上,則編碼這個結構域的顆粒便粘到這一固定相上,藉以把它們從未結合的結構域分開。然後把結合的噬菌體從固定化的底物上洗脫下來,收集之,增殖之。重復這一過程則可以增加獲得具有優良品質酶的幾率。
3 兩個實例
以下結合本實驗室的研究工作舉兩個實例。一個是酶制劑L—天冬醯胺酶;另一個是氨基酸,L—天冬酸。這兩個例子在我們討論的生物技術第三個浪潮這個主題下有一定的代表性。
3.1 L-天冬醯胺酶
作為抗白血病首選葯物的L—天冬醯胺酶早就用大腸桿菌發酵的方法生產,但是生產和應用至少存在兩個問題。一個問題是細胞形成酶的能力很低;另一個問題是酶在體內半衰期短。這兩個問題的存在導致葯物生產成本過高,加大了患者的負擔。
本實驗室藉助基因工程技術提高了酶合成能力,首先從大腸桿菌獲得編碼該酶的基因,體外重組之後再轉化到大腸桿菌體內,不同的是強化了上游調控元件,便大大提高了酶合成能力40多倍!
本實驗室解決半衰期短和穩定性差的策略是制備L—天冬醯胺酶—抗體的融合蛋白。首先從噬菌體抗體庫中篩選得到L—天冬醯胺酶(ASNase)的保護性抗體scFv46,然後構建融合蛋白scFv-ASNase及ASNase—scFv。穩定性測定結果表明:這兩種融合蛋白比天然ASNase的抗蛋白酶降解的能力強,並將天然ASNase的體外半衰期由2小時分別提高到9小時和6小時,另外,二者對高溫及低pH條件都具有較強的抗性。通過計算機模擬技術,預測了融合蛋白ASNase—scFv及scFv—ASNase的三維結構,並與報道的天然ASNase的三維結構進行比較分析。通過結構分析並結合上述的實驗結果,提出scFv的保護機制是scFv的空間阻礙效應(如封閉蛋白酶作用位點)與改變酶分子靜電勢表面的綜合作用結果。
藉助完全基因組序列信息進一步提高L—天冬醯胺酶的穩定性的新嘗試。通過近年中國科學院一個科學家小組的不懈努力,完成了一種極端嗜熱微生物長達2689443 bp全部基因組的測序研究工作。為進一步提高L—天冬醯胺酶的穩定性並延長該葯的體內半衰期,我們在這方面作出了的新努力,即試圖藉助完全基因組序列信息,從一株極端嗜熱微生物中尋找穩定性更好的L—天冬醯胺酶。
本實驗室已經測知E.coli L—天冬醯胺酶的氨基酸序列及為其編碼的基因核苷酸序列。在上述極端嗜熱微生物的完全基因組序列資料庫中搜尋E.coli L—天冬醯胺酶的結構類似物,結果在No.967號基因編碼的蛋白質中,發現了一個一級結構與L—天冬醯胺酶十分相似的蛋白質。其中35%(115/323)的氨基酸完全一樣,另有52%(171/323)的氨基酸相似。因此,有理由相信在這株極端嗜熱微生物中很有可能存在一個與E.coli L—天冬醯胺酶有類似功能的蛋白質。又鑒於該基因來自極端嗜熱微生物,預期這個蛋白質還將會具有更好的熱穩定性。當然,一切結論將留待通過對該基因的克隆、表達、產物的分離和功能分析的結果予以最後的證實或澄清。
3.2 L—天冬酸
通常的生產方法是用富含L—天冬酸酶的微生物細胞,經過固定化處理後,將底物反丁烯二酸轉化為L—天冬酸。本實驗室早期也曾作過一些工作並且投入生產應用。在2000年柏林生物技術大會上得知,日本一個公司採取一系列改進措施,使生產工藝水平大大提升了一步。首先為解決酶合成能力低下問題,也是採用基因工程技術,提高合成能力50倍;固定化酶的通透性問題因採用離子交換性質的材料而得以解決;反應熱—反應器設計及降低反應溫度,從37℃降低到20℃;消除了污染環境的副產物硫酸銨,代之以能重復使用的反丁烯二酸銨;正在開辟L—天冬酸的新用途,用於製造多聚L—天冬酸酶。這個經過改進的新工藝既是先進的、高效的,又是綠色的、環保的。使這一產品的生產工藝幾乎達到盡善盡美的地步,代表了21世紀傳統產業改造的方向。
4 產業結構
我們正處在這樣一個時代:社會經濟發展所遇到的一些重大障礙有待工業生物技術去解決;科學技術的迅速發展形成了一批先進的技術平台;許許多多實例說明生物技術的第三個浪潮正在向我們走來。我們相信:在這第三個浪潮中,中國和世界工業生物技術產業結構將會發生巨大的變化。
上世紀工業生物技術產業格局大體上包括抗生素、維生素、氨基酸、有機酸、(醋酸、乳酸、檸檬酸、衣康酸、蘋果酸、葡萄糖酸等)、酶制劑、單細胞蛋白、溶劑(丙酮、丁醇)、乙醇、核酸、核苷酸等等。傳統產業的全面技術改造:向高產、優質、高效、資源節約、環境友好型過度,還肯定誕生一批新產業,包括生物材料產業、生物能源產業、生物化工產業及環境生物技術產業等等。
② NCBI資料庫有多少完整的細菌基因組序列該如何查閱
如果是基因組信息的話,選擇框里先選擇:Nucleotide
然後,輸入序列號或者輸入你要找的基因的名稱
找到以後,點擊FASTA,可以下載,也可以直接復制。
一般都是存TXT格式,這樣用軟體分析才能載入
③ 微生物基因組的介紹
本書是由微生物基因組學開創者們飢絕撰寫,重點介紹了10年來微生物學轉向全沒肢吵基因組序列研究的進展,包括微生物基因枯侍組學的歷史、作為基因組學工具的生物信息學、核心功能、微生物基因組的進化、微生物基因組的調查和基因組資料庫的應用共6個部分。
④ 微生物的基因組分析後會得到哪些重要信息
微生物全基因組測序中完成Gap closure的意義與方法
微生物是地球上種類最多、數量最大、分布最廣的生物群,與人類、動植物和環境有著密切的相互作用,同時也是工業生物技術的核心及重要的國際競爭戰略資源。隨著測序技術的不斷進步以及測序成本的不斷降低,越來越多的微生物基因組序列得到測定,其中包括一些重要的病原微生物、工業微生物、極端微生物以及生物學研究中有重要意義的一些模式微生物。
隨著新一代測序技術的商業化應用,使得測序成本不斷降低,測序通量不斷提高,越來越多的微生物基因組得到測定,極大地促進了微生物基因組學的發展。然而,由於測序讀長短、數據量大、基因組結構復雜以及測序過程中的偏向性等原因,使得已完成測序的一些物種的基因組中含有數目不等的空缺區域。據統計,自2008年以來GenBank釋放的5276個微生物基因組序列中僅有32% (1692)是完整序列。基因組空缺區域中可能存在重要的生物學信息,如果不能補齊所有的Gap,不僅無法獲得完整的基因組圖譜,還會給後續的基因組信息解讀(操縱子結構、基因調控、SNP分析以及比較基因組等)造成困難。因此,完整微生物基因組序列的獲得需要在完成測序之後對空缺區域進行填充,即將測序拼裝後生成的疊聯群(Contig)之間的Gap進行填充,然後按照一定的次序和方向拼裝生成一條完整的基因組序列(完成圖),這個過程稱之為基因組的Gap closure(或補洞)。
Gap closure的關鍵在於准確定位不同Contig之間的相對位置關系(Linkage關系),一旦位置關系確定,即可通過PCR擴增Gap區域序列或是文庫克隆步移測序的方式補齊Gap區域。然而,由於一些微生物基因組GC含量高、重復序列數目多且長度大(插入序列、rDNA操縱子、大片段重復等)以及NGS測序讀長較短等原因造成測序偏向性高、拼接後生成過多的Contig,從而增加了Gap closure的難度。此外,缺少基因組參考序列或是與參考序列比對同源性低等因素,使雹鬧得生成的Contig無法有效定位,也會導致Gap closure難度增加,因此Contig定位被認為是微生物基因組Gap closure過程中最困難和最耗時的階段。一些生物信息學軟體被開發用於微生物基因組的Gap closure,並取得了一定的效果;但對於基因組中的高度重復區域和低覆蓋率區域的干擾仍無法有效解決,必需藉助實驗手段獲得額外的序列信息才能最終完成基因組的Gap closure,因而應用的范圍和准確性受到一定限制。
提高測序覆蓋率在一定程度上可以有效減少基因組中的Gap,但成本相對較高,並且對於一些復雜的微生物基因組效果有限,如454二代測序覆蓋率為10×時,喜溫硫桿菌SM-1測序後生成的Gap數目為400個;測序覆蓋率提高至25×時,Gap數目減少至280個;但當測序覆蓋率繼續提高至38×時,Gap數目進入平台期(276個),相比25×測序覆蓋率時僅減少了4個,已經不能再單純通過提高覆蓋率來減少Gap數目。因此,對於復雜的微生物基因組,需要將基因組的Gap closure分為幾個階段,針對不同階段採用相應的策略進行:如果Gap數目大於200個,可以通過構建基因組文庫、Paired-End測序或者採用基因組光學圖譜技術的策略確定Contig之間的相對位置和順序,然後再依次關閉Contig之間的Gap區域;當Ga數目小於100個時,可以採用多引物PCR的策略尋找Linkage信息,關閉所有能夠關閉的Gap;如果最後還剩餘幾個Gap無法關閉,則可以採用基因組步移或文庫篩選的策略,如在對喜溫硫桿菌SM-1基因組Gap closure時,通過結合構建基因組文庫、Paired-End測序、多引物源爛罩PCR以及Fosimid文庫篩選等多種歷緩策略最終完成了SM-1基因組的Gap closure。
⑤ 求助,如何查找細菌的全基因組序列
可以在NCBI,genome資料庫。
從genome資料庫里找的燃衡話就比較麻煩,想用RACE,3'末端需要添加像真核物polyA尾巴,且要克隆全基序列,要做5'RACE.
RACE技術比較適合真核物.
要克隆者段鋒基保守,genbank查找些與菌親緣關系比較近菌種,看基已經提交,全基組更,通設計同源引物首晌,便基克隆.原核物基含內含,所基組擴增,原核物mRNA穩定.
7氨基酸序列用NCBI比找同源序列比較困難.縮范圍做比,比Burkholderia基或蛋白做比(參數選擇Choose Search SetOrganism限定物種).另外,用blastp找同源序列,妨用tblastnBurkholderia基組或者所細菌核酸序列比看看
.NCBI種Burkholderiagenome序列.外,關於Burkholderia脂肪酶基序列,設定關鍵詞查,蛋白序列都載做序列比較,至少同源性,及氨基酸序列跟同源性定啟示.
⑥ 怎樣將微生物菌落分析的宏基因組數據上傳到NCBI上
宏基因組學(Metagenomics)又叫微生物環境基因組學、元基因組學。它通過直接從環境樣品中提取全部微生物的DNA,構建宏基因組文庫,利用基因組學的研究策略研究環境樣品所包含的全部微生物的遺傳組成及其群落功能。它是在微生物基因組學的基礎上發展起來的一種研究微生物多樣性、開發新的生理活性物質(或獲得新基因)的新理念和新方法。其主要含義是: 對特定環境中全部微生物的總DNA(也稱宏基因組,metagenomic)進行克隆,並通過構建宏基因組文庫和篩選等手段獲得新的生理活性物質;或者根據rDNA資料庫設計引物,通過系統學分析獲得該環境中微生物的遺傳多樣性和分子生態學信息。
⑦ 如何作微生物基因組Blast
基因組注釋系統是MGAP的核心,整合了許多常用的基因識別和蛋白質功能預測軟體,包括GeneMarks、IPRsearch、BLASTPGP和FASTA3等,以及多個資料庫,如非冗餘蛋凱亂白質序列資料庫(Nonrendant,NR)、已盯悄檔知三維空間結構的蛋白質序列資料庫(PDBSeq)、國際蛋白質資源信息系統(InterPro)[6]和直系同源蛋白質家族資料庫(Clusteroforthologousgroups,COG)等運銀,編寫了相應的模塊進行自動操作,並把每一步注釋結果導入資料庫中。MGAP整合的一般模塊,可以被其他任何一種微生物基因組直接使用。不同實驗室可根據實際研究需要,增加相應模塊或數據,如藍細菌Anabaenasp.strainPCC7120的蛋白質序列庫等。
⑧ 微生物是基因組文庫
能不能說微生物就是基握蠢因文庫,絕皮物或是說由細菌、病毒、真菌以及一些小型的原生動物、顯微藻類等在內的一大類生物群體構成了基因文庫?或cDNA文庫?
不能。可以稱之為基因庫,但不能稱之為基因文庫或cDNA文庫。
基因庫:gene bank,只是一個基因的儲藏庫,找到特定的基因很困難。
基因文庫:gene library,基因圖書館並液,可以隨時方便地找到所需要的特定基因。
⑨ 進行歐蒙病原微生物宏基因組檢測的樣本放置了一個多月,還能用嗎
是否能用需要根據保存條件及送檢項目判斷,一般樣本採集後儲存於知蠢不含任何抗凝劑的無菌管或無菌可封閉的容器中並封口,並將樣本管放置於一次性手套中系緊保存。送檢DNA檢測保存溫度為2~8℃時,樣本不能超過8小搭物陪時,若不能及時螞頃送檢標本應立即置於-20℃以下冰箱暫存,-80℃可長期保存,避免反復凍融;送檢RNA檢測,標本應立即-80℃以下冰箱或乾冰中保存,禁止反復凍融。因此,若樣本保存在-80℃是可用的,否則建議重新采樣。