微軟今日宣布利用DNA存儲技術將約200MB數據寫入了DNA中,其中包括《戰爭與和平》,以及99部經典文學作品。
此前已有研究人員證明,可以用DNA來保存數據。不過微軟表示,此前并沒有任何研究者能一次性向DNA寫入如此多數據。2012年,哈佛大學分子生物學家George Church將一本5萬個單詞、數據量不到1MB的書寫入了DNA中,其后將其印刷在比花粉粒還小的玻璃芯片上。今年,Church的報告稱,他已成功將22MB數據寫入DNA中。微軟此次則宣布,已成功向數百萬DNA寫入了10倍于此前的數據量。
微軟DNA存儲項目首席研究員Karin Strauss表示,DNA是一種出色的存儲介質。和傳統的存儲技術相比,DNA存儲能帶來更高的存儲密度。微軟不是孤軍作戰,華盛頓大學也參與到這一研究項目中來。雖然目前,這項技術成本昂貴、操作復雜。不過,微軟希望借力生物科技行業的研究成果,來降低成本。隨著生物技術的進步,最近DNA讀寫工具的成本正在下降。
磁盤是目前用于長期存儲的標準介質,而DNA被認為是磁帶的繼任者。除了存儲密度高,DNA的耐久性也很好,尤其是在干燥寒冷的情況下。今年3月,有研究人員宣布已部分重建了古人類基因。這些古人類的骨骼保存在西班牙一處洞穴里已超過40萬年。相反,磁帶保存數據只有幾十年時間,隨后就會老化。
Strauss表示:“微軟希望我們能開發出基于DNA的端到端系統來保存信息,該系統將是自動化的,并且能造福于企業數據存儲。”她表示,微軟開展這一項目的原因在于,當前的電子存儲設備發展速度趕不上數據量的增長速度。“如果你關注當前的項目,你就可以看到,我們無法在目前的成本內保存所有信息。”Strauss說。
IDC(互聯網數據中心)預計,明年全世界范圍內保存的數字化數據將達到16萬億GB,其中大部分位于大型數據中心。Strauss估計,一個鞋盒之多的DNA就能夠保存100個大型數據中心的數據。
管底粉紅色物質為DNA
微軟并未披露此次DNA數據存儲項目所花費的成本。將數據保存在DNA之中需要將0和1數據轉換為4種核苷酸,即堿基組成的序列。負責合成這些DNA的Twist Bioscience通常每堿基價格為10美分。商用合成技術的成本最低可以達到每堿基0.04美分,讀取100萬堿基的成本約為1美分,該項目用到了約15億個堿基。
加州大學伯克利分校博士后研究員Reinhard Heckel也在研究利用DNA來存儲數據。他表示,微軟的成功令人佩服。不過,阻礙DNA存儲技術大規模使用的主要障礙是成本,因為制作訂制的DNA分子成本太高昂。“如果希望人們接受這一技術,那你需要這項技術的成本降低到磁帶的成本水平,以目前的技術很難做到。”
Strauss相信,讀寫DNA的成本在未來幾年將會大幅下降。她表示,已有證據表明,這一成本的下降比過去50年中晶體管制造成本降低的降速更快,而晶體管成本的下降是計算技術創新的動力。2007年,對人類基因組的測序耗資約1000萬美元,但到2015年這一成本僅為1000美元。也就是說讀寫DNA的技術在未來將飛速發展。