今年10月21日就正式拉开电商“双十一”狂欢购物节序幕。
数据中心如何保障购物平台高速运转和交互的数据,成为数据中心运维部巨大的挑战。为了防止在双11出现访问问题,数据中心需提前做好应对措施。
首先,面对访问流量洪峰的到来,数据中心能否承压住,避免造成客户平台瘫痪,需首先与客户平台进行提前预测和详细的评估。是否需要数据中心提前进行加固,如增加网络访问宽带、优化网络、增加服务器、提供更多的访问链接等等。可以根据以往电商购物节流量洪峰进行预判,并结合今年双11提前做的促销力度,进行综合评估。根据这些量化的数据,然后再对现有数据中心进行扩容。为了尽量减少软硬加的投入,可以将用于容灾备份的系统,测试系统等数据中心设备加进来共同保障双11顺利进行。
其次,在双11前进行对整个网站的能力进行压力测试预演。通过模拟访问流量提高整个数据中心的处理能力,减少访问客户平台的响应时间、无法访问以及卡顿现象等。除压力测试,还需对数据中心的冗余备份进行演练,比如模拟某网络设备故障或者服务器故障,此种故障下,业务需无感知地切换到其它数据中心集群上,并对设备链路进行故障模拟,考验整个数据中心的稳定性、冗余性。
第三,为防患于未然,关键节点上要做好冗余备份,数据中心和各种设备的备份。根据访问流量情况,如果部分省市数据中心流量过重,影响到访问体验,在各个数据中心之间,可以通过变更路由,随时将流量切换到其他数据中心进行分担,动态调整。在重要的数据中心里,尤其是网络核心设备,要有一比一配置的设备在旁边运行,万一发生故障,立即将所有的网线换到备用设备上,保障业务受到影响最小。还有数据中心里服务器的数量是非常庞大的,每天都可能有故障坏的,发现这样的服务器直接将故障服务器剔出集群,确保业务正常。
最后,各大厂商有必要到现场进行值守,一旦出现问题可以及时解决,深圳规避问题。因为仅仅依靠网站本身的维护力量是薄弱的,毕竟数据中心里的设备类型和厂商很多,一旦出现特殊问题,靠网站的技术人员力量是无法短时间解决的。
双11还有更多的细节保障工作,当出现问题时,必须要有当机立断、随机应变的能力,以最快速的办法解决问题,确保客户平台的正常运行,为客户决战双11保驾护航。