A. 國際著名的三大蛋白質資料庫
國際著名的三大蛋白質資料庫有UniProt資料庫、The Human Protein Atlas資料庫、PhosphoSitePlus資料庫。
1、UniProt資料庫
蛋白組學常用資料庫UniProt(全稱UniProt Protein Resource),建立於1986年,由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白質資料庫聯合成立的,其信息量豐富、資源廣泛,是目前公認的首選免費蛋白質資料庫。
2、The Human Protein Atlas資料庫
The Human Protein Atlas內含近30000種人類蛋白質的組織和細胞分布信息,並提供免費查詢。
瑞典Knut&Alice Wallenberg基金會利用免疫組化技術,檢查每一種蛋白質在人類48種正常組織,20種腫瘤組織,47個細胞系和12種血液細胞內的分布和表達,其結果用至少576張免疫組化染色圖表示,並經專業人員校對和標引,保證染色結果具有充分的代表性。
3、PhosphoSitePlus資料庫
PhosphoSitePlus資料庫是一個由CST和NIH聯合開發的免費資源資料庫,總結歸納了海量通過科學研究發現的蛋白修飾位點,包括磷酸化、甲基化、乙醯化、泛素化等,並且包括一些CST公司發現但未發表的蛋白修飾位點。
該資料庫是動態的、開放的、高度互動並持續更新的。它有助於研究PTMs在正常和病理細胞/組織中的作用,同時它也是發現新的疾病標志物和葯物靶點的有力工具。
性能及歷史
蛋白質資料庫(HPDB),建於2005年5月,動態展示生物大分子立體結構,滑鼠點擊放大分子結構、原子定位、測定原子之間距離,可用於教學或科研。服務對象是能夠熟練使用中文的生命科學、醫學、葯學、農學、林學等領域的大中專學生、教師及科技工作者。
分子結構特徵描述採用漢語,同時提供英文原文以供考證。對於善於使用英文的讀者,我們提倡直接訪問RCSB PDB,一來可以減少網路擁擠,二來可以減少由於HPDB的翻譯不妥帶來的不便。
蛋白質資料庫(HPDB)對每個蛋白質分子結構說明部分做了中文翻譯(最新加入資料庫的分子除外),內容包括分子結構定性描述、樣品的來源、表達載體、宿主、化學分析方法、分子結構組成成分等。這些信息並同蛋白質分子結構數據存儲於資料庫,因此HPDB支持中文查詢。
蛋白質資料庫(HPDB)雖然翻譯了「分子結構說明」部分,但為了保證數據的可靠性和准確性,HPDB對一級結構序列及大分子結構坐標數據等未做任何改動,資料庫保持RCSB PDB核實後的原始實驗數據文件,並保持PDB文件格式和蛋白質分子編號。
B. 有關蛋白質的綜述,大約4000
隨著分子生物學的飛速發展,最為世人矚目的人類基因組計劃即將提前完成。人類將向了解自己的生命奧秘這一目標邁進一大步。但是,由於基因是遺傳信息的攜帶者,而生命活動的執行者卻是蛋白質,即基因的表達產物。因此,即使得到人類全部基因序列,也只是解決了遺傳信息庫的問題。人類揭示整個生命活動的規律,就必須研究基因的物產——蛋白質。相對於基因組而言,後者稱為蛋白質組。
1 蛋白質組概述及其相關研究技術和方法
鑒於基因組研究的局限性,1994年澳大利亞Macquaie 大學的Wilkins和Williams等在義大利的一次科學會議上首次提出了蛋白質組(Proteome)這個概念。定義為「蛋白質組指的是一個基因組所表達的蛋白質」,即「PROTEOME」是由蛋白質的」PROTE」和基因組的「OME」字母拼接而成[1].這個新術語很快得到了國際生物學界的認可。目前對蛋白質組的分析工作大兩個方面。一方面,通過二維膠電泳等技術得到正常生理條件下的機體、組織或細胞的全部蛋白質的圖譜,相關數據將作為待測機體、組織或細胞的二維參考圖譜和資料庫。另一方面是比較分析在變化了生理條件下蛋白質組所發生的變化。目前蛋白質組研究技術常用以下手段:(1)用於蛋白質分離技術方面的如雙向凝膠電泳(2-DE)、雙向「高效」柱層析等。(2)用於蛋白質鑒定的技術如質譜技術、凝膠圖像分析、蛋白質和多肽的N端、C端測序及氨基酸組成分析等。(3)用於蛋白質相互作用及作用方式研究的雙雜交系統。(4)用於分析大量數據的生物工程信息學等[2].。
2 蛋白質組在醫學研究中的現狀和前景
自蛋白質組概念提出以來,已發表相關論文及論著數篇。並於是1997年舉行了第一屆國際性的「蛋白質組學」會議。同年出版式了第一部蛋白質組學的專著。目前蛋白質組在醫學方面的研究重點在於對人類疾病的發病機制、早期診斷及治療,對致病微生物的致病機理、耐葯性及發現新的抗生素為主。現將這兩方面的進展情況綜述如下。
2.1 人類疾病的蛋白質組研究
2.1.1 直腸癌 直腸癌的發生是因多個基因的突變,導致腫瘤抑制基因失能所致,但確切機制仍不清楚。為探討其發病機制,Sanchez等對15例結腸癌和13例正常人的結腸上皮進行2-DE,每個多肽模式用Melanie I12-DE分析軟體進行分析。據此建立了包括882和861個斑點的結腸癌及正常人結腸粘膜的標准膠圖。結果發現在分子量為13kD和pI值為5.6處的蛋白質僅出現在結腸癌的組織中。15例結腸癌患者中13/5.6蛋白有13例(87%)。此外,發現13/5.6蛋白不僅在中度、低度分化的結腸癌及有24年病史的潰瘍性結腸炎過度表達,而且出現在7例分化程度不同的腺瘤的癌前病灶。但對照組則極少出現。這表明該蛋白的出現對檢測早期直腸癌有很強提示。通過對該蛋白HPLC及測序等分析後,發現與鈣粒蛋白B(calgranulin B)及鈣衛蛋白(calprotectin)有很大關系[3]。
2.1.2 肝癌 醛糖還原酶(aldose rectase, E.C.1.1.1.21)是醛酮還原酶超家族中的一個成員。它催化葡萄糖還原為山梨醇,通過減少內源或外源性代謝產物而起到解毒作用。Peter R等在用N-甲基-N-亞基脲誘導(N-methly-N-nitrosourea-inced)的小鼠肝癌中,用2-DE及氨基酸微型測序可分辯出一種肝癌誘導的醛糖還原酶樣的蛋白質(35Kd/P17.4)。而在小鼠的晶狀體中,則發現一種醛糖還原的同工酶,該酶與已知的小鼠醛糖還原酶有98%的同源性,而與肝癌誘導的醛糖還原酶樣的蛋白質截然不同。這表明兩種蛋白質是由相關的兩條基因編碼,在小鼠不同的器官中表達不同。肝癌誘導的醛糖還原酶蛋白質優先表達在肝癌及胎肝中,它們均受到纖維細胞生長因子的刺激,但隨小鼠鼠器官的生理及病理環境而表現不同的形式。經免疫組化證實,肝癌誘導的醛糖還原酶樣的蛋白質在成人肝臟中不表達,但在小鼠的肝癌 中又重新表達。同時發現該蛋白在癌前病變及肝癌中表達強烈,而在肝臟周圍的正常組織不表達[4]。表明該蛋白可能與肝癌的發病有很大關系。
2.1.3 擴張型心肌病 擴張型心肌病是一種嚴重的可導致心衰的心臟病,大多數患者需行心臟移植術。目前其發病機理不明,推測可能為多種因素所致。1990年已有兩組人員進行該病的蛋白質組分析。其後不久心肌的2-DE資料庫建成,並進入國際互聯網路。Knecht等採用2-DE取得了3300個心肌蛋白條帶,通過氨基酸序列分析、Edman降解法及基質輔助的激光解吸離子化質譜(MALDI-MS)等分析了其中150條。經活檢及術後病理證實,有12條為擴張性心肌病特有的蛋白。但具體資料尚在進一步分析之中[5]。Arnott D等對新福林誘導的肥大心肌細胞進行蛋白質組分析,同對照相比亦發現有8種蛋白質的表達水平發現了變化[6]。
2.1.4 膀胱癌 IFN-γ除抗病毒外,還有一項重要的功能即抗腫瘤作用。目前其抗腫瘤作用機制不明。有資料表明,IFN-γ可能通過在相關細胞中增強或抑制有關基因而發揮抗腫瘤作用。重組IFN-γ和IL-2已開始應用於膀胱癌的治療中。為探明其作用機制,George等將四種分級程度不同的人膀胱癌新鮮活檢標本,用50U/ml IFN-γ作用20個小時後,採用2-DE、微型序列分析、等電聚集、蛋白質印跡等方法,對標本進行蛋白質組分析。結果表明有五種蛋白質(色按酸-tRNA合成酶、IFN-γ誘導的r3,超氧化物歧化酶及兩種分子量為35.8kD和11.2kD的未知蛋白)的表達量增加了75%,而醛糖還原酶表達量則下降。為研究IFN-γ對治療膀胱癌的作用機制提供了一種方法[7]。
此外,由於缺乏對膀胱鱗狀細胞癌客觀可靠的組織學分級標准,因而很其進行早期診斷。為此,Morten等對150例膀胱癌進行雙盲法2-DE,並結合了蛋白質印跡法、微型序列分析及質譜等技術,建立了新鮮膀胱癌標本的2-DE資料庫,且發現角蛋白10、14及銀屑病相關的脂肪酸結合蛋白(psoriasis-associated fatty acid-binding protein,PA-FABP)等可以作為膀胱癌不同分化程度的標記物[8]。為早期診斷提供了一種新的手段。
[ 本帖最後由 snow_white 於 2007-7-20 16:32 編輯 ]
查看完整版本請點擊這里:
蛋白質組學研究〔綜述〕05
我也來說兩句 查看全部回復
最新回復
snow_white (2007-7-20 16:31:50)
2.1.5 其它 目前人的各種組織、器官、細胞乃至各種細胞器已被廣泛研究。以期為疾病診治及了解發病機制提供新的手段。在一項利用蛋白質組研究技術進行的酒精對人體毒性的研究中發現,乙醇 會改變血清蛋白糖基化作用,導致許多糖蛋白的糖基缺乏,如轉鐵蛋白[9]。Jagathpala等對免疫所致的不孕症的男性精子蛋白質進行蛋白質組分析,發現了導致不孕症的6種自體及異體抗 精子抗體[10]。在對腎癌的研究中,發現有4種蛋白質存在於正常腎組織而在腎癌細胞中缺失。其中兩種分別是輔酶Q蛋白色素還原酶和線粒體乏醌氧化還原復合物I。這提示線粒體功能低下可能在腫瘤發生過程中起重要作用[11]。Ekkehard Brockstedt等利用2-DE、Edman微型序列法、MALDI-MS等對人BL60-2伯基特淋巴瘤細胞系進行了細胞凋亡機制的研究,結果發現RNA聚合酶轉錄因子3a(BTF3a)和/或BTF3b與抗IgM抗體介導(anti-IgM antibody-mediated)的細胞凋亡有很大關系[12]。
2.2 致病微生物的蛋白質組研究 近年來,WHO越來越重視感染性疾病對人類健康的影響。除結核、多重耐葯鏈球菌感染及機會致病菌外,出現了一些新的感染因素如HIV、博氏疏螺旋體及埃博拉病毒等。因此這些致病微生物的蛋白質組分析,對於了解其毒性因子、抗原及疫苗的制備非常重要,此外對疾病的診斷、治療和預防也同樣重要。現已獲得18種微生物的全部基因組序列,另有60餘種的基因序列正在研究之中。這些工作的開展為蛋白質組的研究提供了有利條件。
2.2.1 檢測博氏疏螺旋體與免疫有關的蛋白質 博氏疏螺旋體(Borrelia burgdorferi)是萊姆病的主要病因,表現為環形紅斑及流感樣症狀,大約有50%的未治患者發展為神經系統及關節系統疾病。該螺旋體可分為3種類型:B.burgdorferi sensu stricto,B.garinii, B.afzelii。其診斷需依靠血清學檢查,但存在敏感性及特異性變化的缺點。為獲得更可靠的血清學檢查,Peter等用2-DE從B.garinii得到217個銀染的蛋白斑點。從中國兔多克隆抗體鑒別出6個已知的譏原。將不同臨床表現萊姆病患者的血漿用b.garinii 2-DE圖雜交。用抗IgM及抗IgG作為第二抗體,在10例有遊走性紅斑的患者血漿中,檢測出60~80個抗原。同時發現在有關節炎的患者血漿中,包含有抗15種抗原的IgM抗體及抗76種不同抗原的IgG抗體。而晚期有神經系統症狀的患者血漿中,則包含有抗33種抗原的IgM抗體及抗76種抗原的IgG抗體。上述3種類型患者的血漿中均包含有抗6種已知抗原的抗體,且被SDSPAGE雜交所證實。這些抗原均是潛在的具有特異性診斷的標志物。
2.2.2 弓形體抗原的檢測 弓形體病是由鼠弓形體蟲引起的寄生蟲病。全球人口大約有30%是攜帶者,在歐洲是最常見的寄生蟲病。如果妊娠者感染,該蟲可通過胎盤引起胎兒的感染。且隨著妊娠時間的增加,感染的機會也增加。大約50%母體的感染可引起新生兒先天性疾病。因此診斷及治療越早越好。目前要依靠血清學及PCR,而單獨採用血清學如用IgG,IgM,或IgA抗體對疾病活動期敏感性不夠,尤其對於妊娠或有免疫抑制的患者。潛在感染常發生在有免疫抑制的患者中。對AIDS患者來說,鼠弓形體蟲是最主要的致命性腦損傷的病因。因此,能否早期診斷對治療來說尤為關鍵。Jungblut等將鼠弓形體蟲RH株在人羊膜細胞系FL521中傳代後,用2-DE得到300個銀染的斑點。再將其與以下3種患者的血漿進行免疫雜交:(1)患有急性弓形體病的妊娠女性(n=11); (2)患急性弓形體病的非妊娠者(n=6)(3)有潛在感染的患者(n=9)。結果有9個斑點對各階段的弓形體感染均反應,這9種斑點被用來當作弓形體感染的標記。其中7種標記可用作區別疾病的不同階段。但對區別急性期與潛在期仍需聯合應用多種抗原[4]。
2.2.3 白色念珠菌 芽管結構是白色念珠菌向菌絲體轉變的早期階段,該結構能增強白色念珠菌對宿主細胞的粘附力、穿透力及破壞性。目前通過蛋白質組分析方法如2-DE、質譜等已檢測出在芽管結構所表達的一組特異蛋白如DNA結合蛋白等,為致病提高了一些參考指標[13]。Monkt等發現,在conA反應後的SDS-PAGE圖中,在芽管結構的膜上,分子量為80kD復合糖處,出現很淡的考馬斯亮藍染色,而在孢子時則未出現。提示膜的整合、出現未與ConA結合的80kD復合糖可能與芽管結構的發生及生長有關。粘附素(adhesin)是白色念珠菌表面的組成部分,介導其與宿主的結合,是侵入宿主所需的重要蛋白,包含多種成分如白色念珠菌胞壁上的疏水蛋白等,通過增強菌株的粘附性而在其致病機制中發揮一定作用。但由於這些蛋白有很大同源性、多種糖基化作用及與胞壁或胞漿膜上其它成分形成共價結合,故提純及分析很難。現通過等電聚集、2-DE及洗脫電泳等方法,可使這些蛋白得到很好的純化、分離及分析[14]。
抗真菌葯通過改變真菌胞壁組分的生物合成和重組胞壁相關酶的結合位置而發揮作用。抗真菌葯遠少於抗細菌葯就在於對真菌細胞壁蛋白分析了解太少。現在臨床上用於抗真菌的葯物多為咪唑類(咪康唑、酮康唑)及三唑類(氟康唑、伊曲康唑),但有很多患者出現耐葯現象。在白色念珠菌中,目前發現至少有8種CDR家族的基因可產生耐葯株的表現型。且有55種基因分別表達ABC及MFS蛋白(菌內葯物輸出泵)[15.16]。但這些基因、蛋白與耐葯之間的關系仍未清楚。應用2-DE、免疫檢測蛋白質等技術,對這些蛋白在菌內的表達量進行分析,發現Cdrlp及CaMdrlp蛋白在耐咪唑類菌株中過量表達。在對咪唑類每感及去除CDR1基因的白色念珠菌株CA114中,提取並檢測耐氟康唑突變子(FL3)的表達。結果發現FL3對氟康唑的耐是去除CDR1的基因的白色念珠菌株CA114的500倍 ,是CA114的250倍。且CDR1 mRNA在FL3的量是Ca114的8倍[17]。同時,對敏感性及耐葯株蛋白質的2-DE圖分析發現,在耐中有25種蛋白質增加,有76種蛋白質減少。推測白色念株菌是通過改變染色體數目或染色體重組來調節基因的表達量,進而產生耐葯性[18]。隨著蛋白質組技術成熟完善,將對真菌壁及耐葯基因分泌的各種蛋白組成分析帶來重大突破,並對抗真菌的研製提供重要資料。
雖然蛋白質組學還處在一個初期發展研段,但我們相信隨著其不斷地深入發展,蛋白質組(學)研究在提示諸如生長、發育和代謝調控等生命活動的規律上將會有所突破,對探討重大疾病的機理、疾病診斷、疾病防治和新葯開發將提供重要的理論基礎。
[ 本帖最後由 snow_white 於 2007-7-20 16:33 編輯 ]
snow_white (2007-7-20 16:34:25)
二、蛋白質組學的研究進展
蛋白質組學強調的是針對蛋白質的一個整體思路。從整體的角度看,蛋白質組研究大致可分為兩種類型:一種是針對細胞或組織的全部蛋白質,也就是著眼點是整個蛋白質組;而另一種是以與一個特定的生物學機制或機制相關的全部蛋白質為著眼點,在這里整體是局部性的。針對細胞蛋白質組的完整分析的工作已經比較全面地展開,不僅如大腸桿菌、酵母等低等模式生物的蛋白質組資料庫在建立之中,高等生物如水稻和小鼠等的蛋白質研究也已開展,人類一些正常和病變細胞的蛋白質資料庫也已在建立之中。與此同時,更多的蛋白質組研究工作則是將著眼點放在蛋白質組的變化或差異上,也就是通過對蛋白質組的比較分析。首先發現並去鑒定在不同生理條件下或不同外界條件下蛋白質組中有差異的蛋白質組分。限於篇幅,本文不對這方面的工作做進一步論述。
本文接下來重點介紹近期發表的關於蛋白質組學的幾個工作,從中可以看到蛋白質組學的思想方法在蛋白質整體(或局部整體)水平上是如何解決生理學的一些重要問題的。
1999年11月《Nature》雜志發表了一篇用蛋白質組學方法研究蛋白質折疊的研究論文[10]。在這篇文章中,Houry等報道了在大腸桿菌胞質中的2500種新生多肽鏈種只有近300種以GroEL作為分子伴侶來幫助其折疊成正確構象。在以往的相關研究中,通常只是針對某個或某些特定的蛋白質,觀察它(們)在折疊過程中是否需要諸如GroEL等分子伴侶的幫助。而在這個工作中,研究是從一個整體的思路出發,首先通過免疫共沉澱的方法獲得所有與GroEL結合的肽鏈,再通過二維電泳和資料庫比較等蛋白質研究的手段對這些肽鏈進行分析鑒定,從而實現了對大腸桿菌近2500條新生多肽鏈與分子伴侶GroEL的關系的全面分析。在這個工作中,研究者還通過對其中50種與GroEL作用的肽鏈的鑒定,進一步揭示了決定這些蛋白質能與GroEL相互作用的關鍵結構特徵。應該說,這個工作很好地體現了蛋白質組學的思想方法和技術手段的運用。
過去在細胞生物學領域還沒有得到過一個主要亞細胞結構的完整的分子圖。核孔復合體是一個巨大的跨核膜的八角形結構,是控制大分子在胞質和核質間運輸的通道。多年來,很多方法被用來分析這一復合體的組成成分。雖然這些工作取得了很大的進展,但究竟在多大程度上反映了這一復合體的分子原貌仍然是一個未知數。最近通過使用蛋白質組學的手段,Rout等[11]鑒定了完整的酵母核孔復合體所有能檢測到的多肽,並系統地對每種可能的蛋白質組分在細胞中定位,結合免疫電鏡的方法將各組分在復合體內定位並定量,從而揭示了酵母核孔復合體的完整分子構造,並在此基礎上揭示了其工作原理。這個工作可以說是蛋白質組學解決構造生物學問題的一個典範,為揭示其他巨大分子機器的"構造"和工作原理指出了一條新路[12]。
通過分析一個蛋白質是否跟功能已知的蛋白質相互作用可得到揭示其功能的線索。因為經驗告訴我們,如果兩個蛋白質相互作用,那麼它們一般參與相同或相關的細胞活動[13]。從近期國際上蛋白質組學研究的發展動向可以看出,揭示蛋白質之間的相互作用關系,建立相互作用關系的網路圖,已成為揭示蛋白質組復雜體系與蛋白質功能模式的先導,業已成為蛋白質組學領域的研究熱點。2000年初,《Science》登載了一篇應用蛋白質組學的大規模雙雜交技術研究線蟲生殖器發育的文章[14]。在這個工作中,Walhout等以線蟲的生殖發育過程作為研究對象,從已知的27個與線蟲發育的蛋白質出發,構造了一個大規模的酵母雙雜交系統,得到了100多個相互作用的結果,初步建立了與線蟲生殖發育相關的蛋白質相互作用圖譜,從而為深入研究和揭示線蟲發育的機制等提供了豐富的線索。這個工作不同於一般的應用酵母雙雜交進行研究的地方在於,它出於對一個生物學問題的整體思考,盡可能地從所有已知的蛋白質而不只是個別的蛋白質為出發點。這一個工作為以前專注於信號轉導過程中單個蛋白質作用的科學家們提供了一個新的思路,即將整個途徑的相關蛋白質一起考慮。
那麼,能否通過酵母雙雜交系統來分析一種細胞或特定組織的所有可能的蛋白質之間的相互作用呢?在今年初,《Nature》發表了一篇通過大規模雙雜交技術研究酵母近6000個蛋白質之間相互作用的論文[15]。啤酒酵母基因組DNA的全序列業已測定,這為通過雙雜交技術來鑒定酵母基因組編碼的全部6000種左右的蛋白質間的可能相互作用提供了非常有利的條件。在這個工作中,研究人員採用了兩種不同的策略對酵母的蛋白質間的相互作用作了全面分析。一是所謂的列陣篩選法(array screening)。在此方法中,6000株表達不同"獵物"蛋白的酵母單克隆分別加在微滴定板上,帶有不同的"誘餌"蛋白的酵母株與前面6000株細胞一一接合形成二倍體細胞,"獵物"蛋白與"誘餌"蛋白的相互作用通過報道基因的表達而被鑒定。這篇文章中報道了192種不同的"誘餌"蛋白與近6000種"獵物"蛋白的相互作用的結果。另一種方法是文庫篩選法。該方法與前一種方法的區別是,將表達6000種不同"獵物"蛋白的酵母細胞混在一起構成文庫,再將這個文庫分別與6000株表達不同"誘餌"蛋白的酵母細胞接合,再進一步篩選鑒定陽性克隆,即"誘餌"與"獵物"發生相互作用的克隆。根據這篇報告,上述兩種策略得到了不同的結果,相比之下陣列篩選法更為有效,而文庫篩選法的長處是通量大。這一工作的重要意義在於我們已經看到,在基因組序列被了解的基礎上,可以利用大規模雙雜交技術全面地,當然也是初步地,分析其物種或其細胞、組織的所有蛋白質之間的相互作用關系。相信類似的工作將很快針對其他物種開展,特別是基因組序列已被揭示的物種。
由此可見,蛋白質組學已經開始從建立資料庫走向解決生命科學的重大問題,成為研究生物學問題或機制的強有力手段。
snow_white (2007-7-20 16:37:32)
三、蛋白質組學研究進展與趨勢
曾 嶸 夏其昌
(中國科學院上海生命科學研究院生物化學與細胞生物學研究所蛋白質組學研究分析中心 上海 200031)
如果在五年前提到蛋白質組學(Proteomics),恐怕知之者甚少,而在略知一二者中,部分人還抱有懷疑態度。但是,2001年的Science雜志已把蛋白質組學列為六大研究熱點之一,其「熱度」僅次於幹細胞研究,名列第二。蛋白質組學的受關注程度如今已令人刮目相看。
1.蛋白質組學研究的研究意義和背景
隨著人類基因組計劃的實施和推進,生命科學研究已進入了後基因組時代。在這個時代,生命科學的主要研究對象是功能基因組學,包括結構基因組研究和蛋白質組研究等。盡管現在已有多個物種的基因組被測序,但在這些基因組中通常有一半以上基因的功能是未知的。目前功能基因組中所採用的策略,如基因晶元、基因表達序列分析(Serial analysis of gene expression, SAGE)等,都是從細胞中mRNA的角度來考慮的,其前提是細胞中mRNA的水平反映了蛋白質表達的水平。但事實並不完全如此,從DNA mRNA 蛋白質,存在三個層次的調控,即轉錄水平調控(Transcriptional control ),翻譯水平調控(Translational control),翻譯後水平調控(Post-translational control )。從mRNA角度考慮,實際上僅包括了轉錄水平調控,並不能全面代表蛋白質表達水平。實驗也證明,組織中mRNA豐度與蛋白質豐度的相關性並不好,尤其對於低豐度蛋白質來說,相關性更差。更重要的是,蛋白質復雜的翻譯後修飾、蛋白質的亞細胞定位或遷移、蛋白質-蛋白質相互作用等則幾乎無法從mRNA水平來判斷。毋庸置疑,蛋白質是生理功能的執行者,是生命現象的直接體現者,對蛋白質結構和功能的研究將直接闡明生命在生理或病理條件下的變化機制。蛋白質本身的存在形式和活動規律,如翻譯後修飾、蛋白質間相互作用以及蛋白質構象等問題,仍依賴於直接對蛋白質的研究來解決。雖然蛋白質的可變性和多樣性等特殊性質導致了蛋白質研究技術遠遠比核酸技術要復雜和困難得多,但正是這些特性參與和影響著整個生命過程。
傳統的對單個蛋白質進行研究的方式已無法滿足後基因組時代的要求。這是因為:(1) 生命現象的發生往往是多因素影響的,必然涉及到多個蛋白質。(2) 多個蛋白質的參與是交織成網路的,或平行發生,或呈級聯因果。(3) 在執行生理功能時蛋白質的表現是多樣的、動態的,並不象基因組那樣基本固定不變。因此要對生命的復雜活動有全面和深入的認識,必然要在整體、動態、網路的水平上對蛋白質進行研究。因此在上世紀90年代中期,國際上產生了一門新興學科-蛋白質組學(Proteomics),它是以細胞內全部蛋白質的存在及其活動方式為研究對象。可以說蛋白質組研究的開展不僅是生命科學研究進入後基因組時代的里程碑,也是後基因組時代生命科學研究的核心內容之一。
雖然第一次提出蛋白質組概念是在1994年,但相關研究可以追溯到上世紀90年代中期甚至更早,尤其是80年代初,在基因組計劃提出之前,就有人提出過類似的蛋白質組計劃,當時稱為Human Protein Index計劃,旨在分析細胞內的所有蛋白質。但由於種種原因,這一計劃被擱淺。90年代初期,各種技術已比較成熟,在這樣的背景下,經過各國科學家的討論,才提出蛋白質組這一概念。
國際上蛋白質組研究進展十分迅速,不論基礎理論還是技術方法,都在不斷進步和完善。相當多種細胞的蛋白質組資料庫已經建立,相應的國際互聯網站也層出不窮。1996年,澳大利亞建立了世界上第一個蛋白質組研究中心:Australia Proteome Analysis Facility ( APAF )。丹麥、加拿大、日本也先後成立了蛋白質組研究中心。在美國,各大葯廠和公司在巨大財力的支持下,也紛紛加入蛋白質組的研究陣容。去年在瑞士成立的GeneProt公司,是由以蛋白質組資料庫「SWISSPROT」 著稱的蛋白質組研究人員成立的,以應用蛋白質組技術開發新葯物靶標為目的,建立了配備有上百台質譜儀的高通量技術平台。而當年提出Human Protein Index 的美國科學家Normsn G. Anderson也成立了類似的蛋白質組學公司,繼續其多年未實現的夢想。2001年4月,在美國成立了國際人類蛋白質組研究組織(Human Proteome Organization, HUPO),隨後歐洲、亞太地區都成立了區域性蛋白質組研究組織,試圖通過合作的方式,融合各方面的力量,完成人類蛋白質組計劃(Human Proteome Project)。
snow_white (2007-7-20 16:37:49)
2.蛋白質組學研究的策略和范圍
蛋白質組學一經出現,就有兩種研究策略。一種可稱為「竭澤法」,即採用高通量的蛋白質組研究技術分析生物體內盡可能多乃至接近所有的蛋白質,這種觀點從大規模、系統性的角度來看待蛋白質組學,也更符合蛋白質組學的本質。但是,由於蛋白質表達隨空間和時間不斷變化,要分析生物體內所有的蛋白質是一個難以實現的目標。另一種策略可稱為「功能法」,即研究不同時期細胞蛋白質組成的變化,如蛋白質在不同環境下的差異表達,以發現有差異的蛋白質種類為主要目標。這種觀點更傾向於把蛋白質組學作為研究生命現象的手段和方法。
早期蛋白質組學的研究范圍主要是指蛋白質的表達模式(Expression profile), 隨著學科的發展,蛋白質組學的研究范圍也在不斷完善和擴充。蛋白質翻譯後修飾研究已成為蛋白質組研究中的重要部分和巨大挑戰。蛋白質-蛋白質相互作用的研究也已被納入蛋白質組學的研究范疇。而蛋白質高級結構的解析即傳統的結構生物學,雖也有人試圖將其納入蛋白質組學研究范圍,但目前仍獨樹一幟。