从原始社会的结绳记事,到之后的竹简纸张,近代时人们用磁带和光盘,而现在最为常见的还有闪存和硬盘……生活在被数据包围的世界,人类从未停止追求高效便捷的信息存储方式。
早前物联传媒对全球存储领导企业西部数据进行采访,了解到业界正预测到2021年,全球联网设备将达到300亿个,全球每年产生的数据量将从33ZB增长到2025年的175ZB。海量设备、天量数据,这样的现实推动人类寻找更大的存储空间。
除了对硅制程工艺作出迭代以外,存储生物遗传密码的介质——DNA开始进入众多科技公司和研究机构的视野。
原理上是可行的
数据存储的本质,实际上就是用一连串的1和0来编码信息。对应到DNA存储,则是将原本用0和1来表示的内容,换成用碱基A、C、G、T来表示,数据编码就是合成序列,解码就是进行DNA测序解读。
再加上碱基有四个,相比于原本的0和1,能够表达的状态更多,比如用A代表00,C代表01,G代表10,T代表11。
此外,一个碱基只有几个原子大小,且碱基之间的密度更大,因此DNA作为存储介质整体的体积较于传统的硬盘将更小,现有技术也可以支持DNA存储的稳定性。
加速推进DNA存储的研发
关于DNA存储技术的探索在好几年前就开始了。
2015年,在哈佛大学实验室,研究人员把一幅“奔跑的骏马”的动图放进了活大肠杆菌的DNA中,并以90%的准确度测序解码了出来。
2016年,华盛顿大学和微软研究院在顶级期刊《Nature biotechnology》上发表DNA存储的研究成果,表示成功用技术将莎士比亚的十四行诗、马丁路德金的演讲原声、医学论文等资料编码成DNA序列并存储起来。
2017年,国外还出现文章,表示如果采用DNA存储技术,只需要1公斤DNA物质就可以把当时全世界高达30ZB的数据全部存储下来,一时掀起诸多争论。
到2019年,来自欧洲的研究团队发文,宣布首次将DNA作为信息存储工具,注入到了一只3D打印的兔子中。并且,切下兔子身体的任何一部分,就能创建另一只相同的兔子。这项技术的革新在于,无生命特征的兔子也拥有了DNA,拥有了3.7亿份描述它轮廓的数据文件。
2020年,关于DNA存储的讨论和研究还在继续,这项技术在实际生活中究竟能派上多大用场?商用路上最大的困难——成本高和效率低的问题该如何解决?如何避免DNA受到外部环境影响而变质?每个研究者和参与公司在这条路上付出了无数的努力。
当然,即便一项超前的技术开始到来,其并不能快速将既有成熟有效的技术取代,甚至它们将有机会在未来共同存在。
正确的存储方案对从数据中获取最大价值至关重要
DNA存储的优点,在于体积小,数据存储的容量大,数据保存的耐久性;
但DNA存储的不足,在于其多用于“冷”数据的归档保存,替代磁带存储的可能性更大一些,实际在一些时延要求较高的场景,比如车联网,智慧工厂、视频监控,并不是可选用的存储方案。
在这之中,闪存正是各项存储介质中最受到关注的一大领域,其从擅长的消费市场中萌芽,正在往更多的物联网细分场景覆盖蔓延。
而具体如何为存储方案做好选型,获取隐藏在数据中的宝贵价值,这是所有企业客户的期许,也是存储厂商长久努力的方向。