数据,代表着人类活动的历史纪录,是马云口中的“DT时代”的“石油”。数据的存储其实有许多需求没有被满足,无论是存储的时间跨度、存储的安全性、隐私性、可访问性速度等,都还有较大的局限性,而一种全新的数据存储即将到来,改变当前数据存储问题。
数据存储的需求
虽然现代社会,我们拥有了海量的磁盘空间存储信息,但是,我们远远低估了数据存储的需求,数据的存储,绝不仅仅只应该是存放了而已。有多少数据,我们只是放在了那里,但是有一天它会消失。
我们应该从更远的历史看,从远古时代起,古人发明了文字和绘画,即使只是将这些信息留下来,也为我们提供了非常大的考古和文化价值,而且,远古的开创者,发明文字的仓颉,被人们奉为神灵。我们知道了我们的文字从何而来,我们通过石刻、甲骨文、竹简、书卷窥得了历史的模样,这还只是部分流传的情况。如果没有这些数据,那么我们应该会变成Know Nothing。
除了存储,我们其实还有很多额外的需求:
1、储存的时间长度,能否真正做到永久存储
2、储存的安全性,该数据是否能够不丢失、且能按照意愿保护隐私安全
3、数据的可访问性,数据能否快速访问
在当前的互联网以上三种需求,都是数据的某个维度最大化的推理,做到绝对的永久存储、安全、随时快速访问,是不可能的,而做到满足人们需求,还是可以的。
个人数据
拿个人数据来说,我们对于数据的存储,其实是有很多潜在需求的,但是目前,这些潜在的需求都被压抑了,比如说:人们甚至连自己的相册都没有地方统一存储和管理,无论是网盘、QQ空间还是Google的相册,都无法做到永久保存我们珍藏的照片,这样导致我们不可能在一个地方存储所有的照片,它们会变得分散。即使有一些管理工具,也没有办法快速地从所有照片中找到我们想要的照片。这些照片,它们的价值,对于拍了很多照片的我们来说,可能其中的一张,价值并不大,但如果它是你最喜欢的一张,或者你想看到曾经的生活的模样,你却看不到,只能任凭它在记忆中消逝,那是多么可惜。
时间不可倒流,对于偌长的时间洪流来说,你的一张照片把真实发生的一瞬间给定格住了。然而,你留不住它,总有一些被你遗失了,留下来的很只是一部分。也许对于我们来说,生存比较重要,历史不太重要,但是我们死去的时间更久,我们可以活在历史中。
企业数据
此外,对于企业来说,数据更是举足轻重。但是数据的存储,却又痛点繁多。一方面,数据存储较为散乱,有的数据是以纸面方式记载,有的数据录入了数据库,然而却随着程序的迭代更新,逐渐不兼容,老数据留在历史的灰尘堆里。这里有两个主要矛盾:
数据载体不一致
不同的数据格式,也给数据的管理和访问带来问题,公司往往没有过多的精力做数据的迁移,也没有精力去兼容老的数据协议,故而久而久之,往往只有现在正在用的软件系统,保留了大部分新数据。储户存折的钱不翼而飞,银行丢失了用户存款数据的新闻,每年都在发生。银行尚且如此,更不用说,其它中小企业了。
然而历史的洪流,裹挟了这些中小企业,如果他们收集数据的能力不强,收集的数据再不进行有效的组织和利用,则必将被时代所淘汰。正如马云所说,以后是一个DT(Data Technology)的时代,一切的生产都是围绕数据进行的,数据代表着用户,数据代表着业务。有数据,没有加以利用,那么等于没有数据。
你掌握的数据与知识的差别,就在于,知识是你自己的东西,想要用的时候,能够随时调取,但数据,不一定。这不仅对人很重要,对于机器来说,一样重要,因为它们更需要知识。
数据存储的发展
数据存储,因载体和结构不同,分为许多种类型。
按照载体划分,从古至今有:
石刻、铜刻
甲骨文
竹简
丝帛
纸张
纸带
磁带
晶体管
磁盘、光盘
硬盘、固态硬盘
基因存储...
载体的变化,使得信息的记载变得更加自由方便,以前得费劲去刻,现在键盘敲两下就好了;而且存储的容量在渐渐增大,以前写一部《史记》得用几个车子装,非常难永久完整保存下来,而现在一个SD卡可以装几万部史记;访问的便利性也逐渐增大,以前得在档案馆里找,现在,联网一搜就有了。
数据都是有一个结构的,从一开始手写的文字,延续了几千年到现在,发展到有各种各样的文件类型:
文本文字
图片
音频
视频
应用程序文件(严格来说,上面四种皆属于这一种)
数据需要被正确地解析,就需要有一定的格式约定,电脑上的数据都是以二进制的方式,按照程序规定的格式存储。存储下来以后,还要进行方便的管理,数据库的诞生,为人们存储和组织数据提供了非常大的便利,直至现在,人们到处都在使用数据库,无论是你手机App里的SQLite,还是服务器运行的Redis、MySQL、Oracle、LevelDB、MongoDB,还是Google等企业的大型分布式数据库。都在发挥着存储海量信息,并让快速查找信息的作用。数据库的核心作用,是将这些数据文件按照一定的方式索引,让访问变得快速而容易。
然而,这还不够,一个人的电脑,始终有限,一个公司的计算机系统存储,始终有限。
IPFS横空出世
诸如以上所述,如果集合全人类的存储,相互共享,这个是可以是无限的。故而分布式存储、点对点传输等方式逐渐成为未来,于是IPFS(星际文件系统)诞生了。IPFS具有低成本、更高效、更安全、永久性、更高隐私性的优势,被认为最有可能取代当今的互联网HTTP协议,成为Web3.0互联网分布式存储时代的基石。这样的东西诞生:
存储时间;从一段时间变成永久
存储内容;从一个文件变成海量数据
存储访问;从难以获取变成弹指可读