當前位置:首頁 » 服務存儲 » dna將成為數據存儲工具
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

dna將成為數據存儲工具

發布時間: 2023-08-22 23:00:46

① DNA存儲,拯救人類數據危機的良方

開一個腦洞:如果地球正在面臨一場馬上到來的毀滅性星際災害,人類又想盡可能地保存地球的生命和文明,在現有條件下,該怎麼辦?

像大劉一樣讓地球停止自轉然後逃離太陽系,這恐怕來不及了。而如果像諾亞方舟一樣,一股腦把人類、動植物和人類的知識搬運到飛船上,現有的火箭運載能力,恐怕也裝不下這些物質的億萬分之一。

如果想盡可能多、盡可能長久地保存地球的生物,我們只需要把所有物種的DNA序列信息收集打包,在飛船的低溫環境下便可以保存長達數十萬年;而人類文明的信息呢?我們知道這些信息最高效的形式就是數據,而這些數據主要存儲在硬碟和光碟當中的。

想想這些硬碟儲存器的重量和數據密度,我們不得不再一次氣餒。更何況,可能飛船還沒逃出太陽系,這些數據就會因為硬碟或光碟的壽終正寢而丟失。

那麼DNA能不能當做硬碟來存儲數據信息呢?答案是,可以的。

DNA絕對是這個星球上最古老的生命信息存儲工具,同樣也可以作為數據信息的存儲介質,且存儲密度和使用壽命要遠遠超出現有的磁碟式的存儲方案。因此,DNA存儲,正在被人類視為數據存儲的未來,成為拯救人類數據存儲危機的最好的替代方案。

DNA存儲具體是怎麼做到的呢?現在發展到那一階段?商用的話還有哪些阻礙?這需要我們一一解答。

在了解DNA存儲是如何工作的之前,我們簡單了解下磁存儲和光存儲這兩種現有的解決方案的原理。

磁存儲的原理就是在金屬材料上塗上磁性介質,在通電的情況下形成電磁效應,可以進行存儲和表達0101的二進制信息。磁存儲的硬碟的優點是錄入和讀取的速度快,缺點是與體積重量相比,數據密度較低。經過60年發展,大概可以在3.5英寸大小的硬碟驅動上存儲3TB數據。

光存儲的原理是將數字編碼的視頻和音頻儲刻錄在光碟表面的凹槽中,再通過激光將這些凹槽中的數據讀取出來,進行轉存或播放。當前,光存儲也正在經歷存儲的極限。因為想要存下更多的數據,凹槽就必須越小、越緊湊,要求激光的精度也越高。目前,單層藍光光碟能夠保存 25GB 以上的信息,另一種紫外線激光如果研製成功,其光碟容量可以達到500GB的容量。

相對於磁存儲和光存儲而言,DNA存儲有哪些優勢?

首先,就是節約空間。但這些單層平鋪式的存儲方式,比起DNA的雙螺旋立體結構來說,其存儲量就有了多個數量級的差距。DAN本身的物理體積極小且又是立體結構,單位空間的數據密度非常高。舉個簡單的例子,1克DNA不到指尖上一滴露珠大小,卻能夠儲存700TB的數據,相當於1.4萬張50GB容量的藍光光碟,或233個3TB的硬碟(差不多151KG重)。

再則,非常節能。現有存儲方式,比如說一個數據中心,要消耗大量的單晶硅,還要消耗大量的電。而DNA物質只需保存在陰涼、乾燥的地方就可以,基本不需要額外的人工維護。就算需要把DNA冷凍起來,消耗的資源和能源也幾乎可以忽略不計。

此外,最重要的一點就是,保存時間非常久。現在高密度的存儲器都會隨著時間推移而衰減,能存儲時間最長的工具是磁帶,其壽命也就50年,其他的存儲器壽命更短。比較而言,DNA則保質期就以百年計算了,如果將其冷凍起來,能保存幾千甚至上萬年。

看來人類文明的拯救方案有了,但DNA存儲到底是如何做到的呢?

眾所周知,DNA由四種含氮鹼基——A、T、C和G互補配對構成,科學家將腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)分別賦予二進制值(A和C=0 ,G和T=1),隨後通過微流體晶元對基因序列進行合成,從而使該序列的位置與相關數據集相匹配。這樣就把這些鹼基對編碼成1和0的組合,就可以用DNA的序列信息來表達二進制的語言了。

當每次將二進制語言寫進DNA序列當中,就可以把「DNA硬碟」放到低溫環境中進行保存。而需要讀取數據的時候,只用對目標DNA進行測序,將鹼基對還原成二進制編碼,再完成解碼,就可以還原為我們常見的數據了。

原理是非常簡單,但科學家是如何做到的呢?這就要簡單回顧下DNA存儲技術的發展史了。

最先想到這一方法的是一位藝術家Joe Davis,他在1988年與哈佛研究人員合作,把一個取名為Microvenus(小維納斯)的7*5像素矩陣的照片,轉化成35個鹼基的DNA序列,插入到大腸桿菌里,第一次把不屬於自然演化的信息寫進了在DNA當中。

(Microvenus代表女性和地球)

2010年,美國合成生物學家克雷格•文特爾((Craig Venter)帶領研究團隊化學合成了整個支原體基因組DNA,取名為「辛西婭(Synthia)」,並以「自娛自樂」的方式將課題研究者的名字、研究所網址和愛爾蘭詩人詹姆斯的詩句等信息編碼進新合成的DNA中。

2011年,哈佛大學的合成生物學家喬治·丘奇(George Church)和加州大學的瑟里·庫蘇里(Sriram Kosuri)領導的團隊以及約翰•霍普金斯大學的基因組專家高原(Yuan Gao)首次進行了概念證明性實驗。團隊使用短DNA片段編碼了一本丘奇的659KB數據的書。

2013年,歐洲生物信息研究所(EBI)的尼克•高德曼(Nick Goldman)和他的研究團隊也成功地將包括莎士比亞十四行詩和馬丁•路德•金「我有一個夢想」的演講片段、一篇沃森和克里克DNA雙螺旋論文副本等5個文件編寫進了DNA片段里當中。739KB數據成為當時最大的DNA存儲文件。

2016年,微軟和華盛頓大學又利用DNA存儲技術完成了約200MB數據的存儲,成為DNA信息存儲技術的一個飛躍。

2017年7月,《自然》雜志發表了哈佛大學醫學院的賽斯•希普曼(Seth Shipman)和喬治·丘奇合作的一項活體DNA存儲的研究。他們把一部130年前的黑白電影《奔跑中的馬》存在了大腸桿菌的DNA上。雖然大腸桿菌體內有一段「奇怪的DNA」,不僅能夠正常生存,還可以正常遺傳,每次繁衍都是一次數據復制。而且存儲在基因組中的電影,在每一代大腸桿菌中也都完整無缺地保存下來了。

但因為細胞的復制、分裂以及死亡,會造成信息出錯的風險,未來數據安全,大多數情況下存儲信息的DNA都是以DNA乾粉的形式存在,活體細胞存儲的研究轉向合成DNA存儲。

同一年,哥倫比亞大學和紐約基因組中心在《科學》雜志發表了一項稱為「DNA噴泉」演算法高效的DNA存儲策略。這項技術展示了最大化利用DNA的存儲潛力,成功將海量信息壓縮至DNA的四個鹼基,即為每個DNA編碼1.6比特(bits)的數據,比之前多存儲了60%的信息,逼近理論極限(1.8比特)。該方法能夠將215PB數據存儲在一克DNA中,相當於2.2億部電影。

2018年,愛爾蘭沃特福德理工學院(WIT)研究人員開發出一種新型DNA存儲方法,可在1克大腸桿菌DNA中存儲1ZB的數據。

2019年,丘奇團隊又在《科學》期刊上發表了一項實驗結果。他們將丘奇的一本大約5.34萬個單詞《再生:合成生物學將如何改變未來的自然和自己》的書,以及11張圖片和一段Java程序,編碼進不到億萬分之一克的DNA微晶元,再成功利用 DNA 測序來閱讀這本書。

這些科研的快速發展也意味著DNA合成技術(數據寫入)和DNA測序技術(數據讀取)正走向成熟。但同時,DNA編碼過程仍然存在著存儲/讀取速度和成本等問題,DNA存儲離商業化還在路上。

在實驗室里,看起來DNA存儲並不復雜,但是在商業化上面,仍然還面臨著一些問題。

首先,存儲和讀取的速度都很慢。DNA存儲設備的訪問速度很慢,存取也很費時間。相比較磁碟存儲的電磁信號,DNA合成卻要依賴於一系列化學反應。用磁碟寫入200MB數據,不用1秒,用DNA合成差不多得需要3周的時間。

其次,DNA介質不能覆蓋和重寫。在DNA里,一旦把信息存進去,一般來說不能修改。想讀取這個文檔,需要把全部信息完全測序出來再轉碼。

第三,數據存儲的准確性有待提高。目前DNA測序時的重復讀取導致讀錯概率較大。

第四,隨機讀寫困難。目前DNA合成技術無法一次性產生較長的DNA分子,只能合成眾多的短片段。這使得在眾多DNA小片段組成的混合物當中,快速調取特定數據存在困難。

最後,也是最重要的,DNA存儲成本太高了。比如目前DNA存儲200MB數據,需要耗資80萬美元,而用電子設備,成本連1美元都不到。

但正如上面所說,如果放到更長的時間尺度上和數據存儲空間壓力下,DNA具有的大存儲密度、高節能環保、超長穩定性的獨特優勢就顯現出來了。只要隨著存儲和讀取技術的發展,DNA編碼和測序的效率提升,成本大幅下降,DNA存儲離商業化應用也就不遠了。

那麼,現在在商業化上有哪些進展呢?

在2015年,微軟公司和華盛頓大學合作發表了一個成果,採用定點讀取信息,也就是給一個長長的DNA鏈里加入一些追蹤標記。這些類似索引機制的標記,可以不用每次等測序完整DNA長鏈,就能選取合適的標記進行讀取。

2018年,讀取技術又實現突破,微軟研發了「納米孔」讀取技術,讓 DNA 介質列能擠過一個很小的納米孔而讀取其中每個 DNA 鹼基。這一技術讓大大縮小了讀取設備的空間開支,一個手掌大小的 USB 設備就能進行讀取,但讀取速度在每秒幾KB左右,可以說仍然相當慢。

2019年3月,微軟團隊在《自然》雜志發表一項新的進展,他們開發了世界上第一個自動DNA存儲介質。相比較於手動操作進行DNA的合成和測序,能夠自動化方式進行DNA編解碼才是未來商業化的出路。

另外,關於DNA存儲和讀取時長以及成本的問題,一家2016年成立的美國初創公司Catalog也正試圖嘗試解決。

去年,Catalog將一共16G的維基網路英文版文本存儲在了一個DNA分子上。他們使用了一台DNA書寫器設備,以4Mbps的速度在DNA中記錄這些數據。這意味著在一天內可以記錄125GB,大約相當於高端手機可以存儲的容量。這一速度已經是之前研究所存儲速度的三倍。

目前,Catalog使用了由20到30個鹼基對長預制合成DNA鏈,通過酶嵌套在一起,可以存儲更多的數據。這些片段的排列就像英語使用26個字母一樣,理論上可以創造出無數的組合。據Catalog估計,未來進行1MB數據DNA存儲成本將不到0.001美分。

當然,如果未來這家創業公司真的能夠將成本大幅降下來,那麼確實有可能為DNA數據存儲的商業化鋪平道路。

在2019年,《科學美國人》與世界經濟論壇聯合發布的當年全球十大新興技術中, DNA數據儲存技術名列其中。

可以預見,磁存儲和光存儲方式在未來一段時間仍將占據數據存儲方式的主流。不過,即使我們不會出現地球末日這種極端情況,因為近幾年數據激增,人類也正面臨數據存儲空間不足的嚴峻問題。同時,數據存儲需求激增,帶來的是硅晶片使用量的激增,以及由此引發的環境污染問題、水資源和能源消耗等問題。

DNA存儲技術的實現,一定程度將緩解傳統存儲的容量問題,並大幅減少電子元件和能源的消耗。

② DNA存儲什麼時候能被人類實現呢

首先在這里要告訴大家一個好消息,那就是DNA儲存其實早已經被我們人類實現,早在2010年的時候,美國生物學家本來是一個自娛自樂的實驗,但是最後卻實現了將信息儲存在DNA當中。當時這些科學家為了能夠簡單的測試一下將自己的課題名字和名稱,以及自己研究所的網址。還有一些詩句的信息都儲存在自己編程的DNA當中。這個舉動未經證明了,我們的地應該其實是可以攜帶外來信息的。

不過到目前為止,我們在DNA里邊兒儲存的信息還是有限的,這個主要是因為我們的基因工程其實起步比較晚,再加上人類對於自身的探索也是處於摸索階段。想要掌握DNA的准確用法還需要很長一段時間。

③ DNA存儲什麼時候可以普及

DNA存儲現在還處在科學研究階段,有很大的不確定性,距離實用還有很大的距離,在可預見的未來,是無法普及的。

④ 人的DNA有何神奇之處人的基因是如何保存的

對大多數人來說,DNA數據存儲是一項非常神奇的技術。自然界數億年來,各種生物利用DNA攜帶的遺傳信息來保證物種的繁殖。在20世紀60年代初期,科學家們提出了利用DNA存儲信息的想法。目前生命科學大數據整體話題已經火了很久,編著也一直關注這方面的動態。今年年初宣布將16G的維基網路儲存在DNA分子中,不久前大使分子也表示可以儲存數據,甚至有人建議使用光譜。科學技術需要超前的想像力,但科學也要正視任何現實和它帶來的所有影響和結果。」

我是無知的。nature和science報道了類似的研究,但以前存儲的數據都很小。也就是說,沒有超過1Mb。這次研究存儲了超過200mb的數據。做這個真的很貴,很貴,很貴。這個研究是微軟做的。據推測,將投資數千萬、數億或美元。所以我們只是想了一會兒「快點,提取我的血液,分離特異性的T淋巴細胞,找出起始序列是多少DNA序列,快點破譯。所有敵國的信息都在裡面。」孩子們不需要讀書,直接將數學、語言、英語、所有代碼轉換成DNA,自然無敵。

⑤ DNA存儲技術的優點

DNA存儲技術作為數字存儲媒介的顯著優點之一是容量大。DNA分子是一種令人難以置信的密集存儲介質,1克DNA能夠存儲大約2拍位元組,相當於大約300萬張CD。
用DNA存儲數據保存時間可能長達數千年。與硬碟、磁帶等存儲介質不同的是,DNA不需要經常維護。就讀取方式而言,DNA存儲不涉及兼容問題。

⑥ 天津大學DNA存儲新演算法可使信息保存千年萬年,會對哪些行業帶來利好

天津大學DNA存儲新演算法可使信息保存千年萬年,這會對DNA編輯以及信息存儲行業帶來非常大的利好,甚至會深遠的改變這兩個行業的格局 。

天津大學DNA存儲新演算法可使信息保存千年萬年,你覺得這會對哪些行業帶來利好?歡迎留言討論。

⑦ 東南大學師生將校訓存入DNA序列,這項技術有多厲害

東南大學師生團隊成功將該校校訓「止於至善」存入一段 DNA 序列,實現了 DNA 存儲技術的新突破。相關成果發表在國際學術期刊《科學・進展》上。據東南大學生物電子學國家重點實驗室劉宏教授介紹,DNA 存儲技術就是將生物 DNA 分子進行編碼,從而在 DNA 序列上存儲信息。

隨著大數據時代的到來,全球數據產生量正以指數形式激增,而以 DNA 分子為基礎的數據存儲系統被認為是解決未來「數據危機」的一個可行方案。

此外,劉宏團隊還探索了現有體系向高通量自動化系統發展的潛力。研究人員利用微流控滑動晶元技術設計了單片四電極系統,通過滑動晶元向電極高效地輸送反應試劑,成功實現了四電極上的數據存儲(「DNA stores Future World」),為之後高通量集成化自動化 DNA 存儲系統的開發打下基礎。

⑧ DNA存儲技術的原理

英國的歐洲生物信息研究所研究小組利用DNA存儲數據的關鍵是DNA鹼基。DNA這種雙螺旋結構上有4個化學基團,即核鹼基,它們按照特定順序排列,組成遺傳信息,指導生物體生長發育。
研究人員開發的DNA數字存儲系統同樣利用這4個鹼基「字母」,開發定製代碼,完全區別於生物體所用「語言」。當復制一份計算機文件時,DNA數字存儲系統首先把硬碟信息中的二進制數翻譯成定製代碼,然後藉助標准DNA合成機器製造出相應的鹼基序列。這一序列並非一個長分子,而是多個重復片段,每一個片段攜帶一些索引細節,明確各自在整體序列中所處位置。這樣的系統雖然顯得冗餘,優點是即便某些片段遭損毀,數據不會丟失。分子生物學實驗室用來讀取生物體DNA的標准設備可以讀取信息,當即呈現在電腦屏幕上。