一、数据中心是全球协作的特定设备网络,用来在Internet网络基础设施上传递、加速、展示、计算、存储数据信息。它不仅包括计算机系统和其它与之配套的设备,还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置。
二、而云计算是什么?一般说来,它是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云计算是一种按使用量付费的IT服务模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。那么云计算的定义中有一个最重要的关键词:按需。云计算提供商是根据用户需求,按需提供计算资源的,另外就是云计算架构具有很大的弹性,和扩展性,因为所有的实际物理资源都被虚拟化(抽象化),可配置和可管理。
云计算技术包括分布式文件系统、分布式计算、分布式数据存储等。基于云计算架构,可以实现高并发处理系统来处理海量请求,也可以搭建存储海量数据的云存储系统,也可以搭建分布式计算系统来对数据进行挖掘。生活化一点,包括我们所熟知的搜索引擎、网络视频、电子商务、电子邮件、地图导航等都属于云计算的范畴。
三、大数据是什么?在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中提出:大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。
那么究竟多大的数据算是大数据,这个其实并没有明确的定义。不过IBM提出了大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。这也是目前大家比较公认的大数据的特征。
这个5V的特点,反映了大数据数据量大、产生的速度快且多样,同时大数据具有低价值密度的特点,同时大数据也可能会夹杂一些干扰,影响数据的真实性。因此需要一些技术手段能够快速处理海量数据,并且能够从大数据中挖掘有价值的信息。