【首期政府CIO论坛】杨凌宇:易经与大数据

互联网
佚名
随着以电子政务为核心的城市信息化进程的加快,对政府信息资源共享的需求日益强烈。如何实现政府信息资源最大程度的共享,成了人们关心的热点话题。2017年3月11日下午,由中国新一代IT产业推进联盟指导、CIO时代...

随着以电子政务为核心的城市信息化进程的加快,对政府信息资源共享的需求日益强烈。如何实现政府信息资源最大程度的共享,成了人们关心的热点话题。2017年3月11日下午,由中国新一代IT产业推进联盟指导、CIO时代学院主办、CIO时代APP承办的“2017首期政府CIO论坛”在河南郑州成功举办。政府CIO班学员、政府信息化负责人等聚集于此,进行了深度探讨与交流。郑州住房公积金管理中心信息处处长、第六届北大政府CIO班学员杨凌宇在活动上发表了题为《易经与大数据》的主题演讲。以下为演讲实录:

                 \

         郑州住房公积金管理中心信息处处长、第六届北大政府CIO班学员  杨凌宇
  大家好!今天给大家分享一下易经和大数据。这个题目可能有点远,易经很古老,至少是几千年前的事,一直延伸到现在。大数据是新提出来的信息技术领域概念。其实易经从未离开过数据,根据我学习这么多年的一些经验,我认为易经和大数据之间有着天然的联系。

  一、易经的来源

  易经的来源,可以说是来源于数据。谈到易经要说两个方面,一个是八卦图,一个是八卦和64卦的内容。八卦图起源于6500年前伏羲时代,是农耕文明的产物。实际上我们对伏羲这个概念是很熟悉的,河南淮阳有太昊陵,伏羲在那里被称为人根祖,传说中认为伏羲是人类起源最早的祖先,但这都有待于考证。通过考古论证,伏羲不是一个人,而是一个部落的首领,经专家论证,伏羲部落兴盛一千多年,共有76代伏羲,从第一代一直到第76代,列表都已经论证出来了,因此这是可信的。在6500年前的旧石器时代和新石器时代,生产力是很低下的,当时解决吃饭问题是当务之急。部落首领伏羲(刚才的画像也是从网上找的)为了掌握农业生产技术,提高生产力,便要掌握冷热交替、寒暑变化的规律,他就测日影,然后就出来一张图,称之为四时八节图,再细化就变成了24节气。

                                                        \

 四时八节图

\
  二十四节气图

  直到现在我们农耕生产还在用这张图,因此这张图的起源就在6500年以前。伏羲时代绘制的四时八节图,“四时”就是春夏秋冬,“八节”就是24节气中的八个节气:立春、立夏、立秋、立冬、冬至、夏至、春分、秋分。四时八节图是经历伏羲时代1000多年76代人精确的测量测绘计算出来的,因此我们说这张图是来源于数据或大数据。

  一般的说法是,八卦是由伏羲发明的,64卦才是周文王续写的。这是一种理解上的错误,现经考证这种说法已不成立,说伏羲画八卦,太玄幻太神化是不可信的。比如,有一种说法是黄河里出来一匹马,马背着一张图,被说成是“河图”,该图刚好被伏羲看到,然后依此创造了八卦。

  伏羲“八卦”和文王64卦都是从数据中来的。周文王是在伏羲四时八节图的基础上,根据占卜的需要设计了先天八卦图、后天八卦图,并确立了八卦和六十四卦的内容,把占卜核心进行了系统化处理,这确实是文王的功劳。因为在商周时期,占卜术是很盛行的,包括朝廷也有专门的编制、机构、人员对重大事项进行预测。当然当时的方法是龟占,即用乌龟壳进行问卦,这是一种比较落后的预测方式。文王创立八卦和64卦后,他做的一个最大贡献便是从原来的由象起卦变为由数起卦,象可以是物象、意象、想象,是人们看到听到想到的一切现象,不确定性强,而数具有了唯一性特点。把由象成卦变为由数来成卦,这是一个很大的进步。

  文王画出八卦图后就定义了卦象、卦名及卦的含义,八卦就是乾兑离震巽坎艮坤,以现在的思维理解,就是他定义了、或者说将自然界各种物质定义了八种属性。但这些还不足以支撑卦的体系,那么他就把八卦两两相错变成64卦,每一卦有6爻,64×6就是384爻,从而也就有了384条爻辞,再加上64卦自身的卦辞,卦词和爻辞,总共是450条。这些卦辞和爻辞来自官方的档案馆,也可以理解为商朝占筮的档案库。因为在当时,他们每一次占卜都有档案,也就是把占筮结果刻在龟甲上,即如今我们看到的甲骨文中很多的卦辞和爻辞。商朝和周朝加在一起也是一千多年。从这一千多年的占卜档案中挑来挑去,最后将精华挑出来装到64卦、384爻里。所以,我们说这些内容的数据量可想而知。从档案馆中来、一千多年的数据,其量之大可想而知。因此不论是八卦图还是六十四卦的卦辞爻辞,均来源于数据或说来源于一千多年跨度的数据,从某种层面上我们可以理解为是大数据。因此,我们说易经是源于数据。

  我们知道国学中有一个重要的概念叫做太极。有一串大家都很熟悉话叫做“无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦定吉凶,吉凶生大业。”两仪即阴阳,阴阳被文王和伏羲用了两个符号表示。我们看到的符号一个是中间有裂缝的(--),一个是没有裂缝的(—),叫阴爻和阳爻。这是两个表示阴阳的基本元素。八卦每一卦是三条线,二的三次方只能出来八个卦符。64卦是每一卦6爻,二的六次方可生成64种卦图。后来人们发现,如果用0和1来表示阴和阳两种符号,以此来替代八卦、六十四卦中的阴爻阳爻,其顺序与德国的哲学家数学家莱布尼茨发明的二进制很吻合。有很多人以此讲计算机是我们老祖先根据易经发明的,当然这肯定有误解。

  阴爻(“--”)以“0”表示,阳爻(“—”)以“1”表示;或者阳爻(“—”)以“0”表示,阴爻(“--”)以“1”表示,二者所表示出来的八卦符号的阴阳顺序与用二进制表示十进制的0~7八个数字的“0、1”顺序是一致的。同样,六十四卦先天卦序用十进制的0~63表示,其阴爻阳爻顺序与二进制的“0、1”顺序是一样的。先天卦序是古代占筮家发明的,只用于占筮不用于计数,历史上从没有将卦象对应于十进制计数的情形,更无用二进制计数的可能。所以,先天卦序与二进制有相似的构成和排序规律,不代表卦序本身就是二进制。

  二、传统预测、大数据和易经的关系

  易经源于数据,但它有预测的作用,它源于卦、扬于道、又传于卦。大数据的核心价值也是预测。这里有三重关系,预测成就易经、易经指导预测、预测成就大数据的核心价值。大数据肯定是用于分析的,但最终的目标是要预测一些走势、未知的一些结果。大数据预测在国外也已被认为是一种职业,一种成熟的商业方式。

  象和数实际上在几千年前,东方与西方也在交互。我们刚才说到算卦,即占卜术,由象而数,从象占卜到数占卜,从龟甲裂缝的走势起卦到揲算起卦,是跨了一大步。我们宋朝有个人叫邵雍,他说万物皆有数。无论是什么现象,都可以用数来表示,有数就有卦,有卦便可以分析。在公元前500多年,古希腊一个数学家毕达哥拉斯也说过万物皆数。那时提出来任何东西均可用数字来表示不很不可思议的。那么我们现在这些信息数据实际上全部是数字化。

                           \

  这个图是传统预测过程示意图,从问卦到成卦到解卦这么一个过程,这个过程算是一种预测模型。图中的“由数起卦”,即蓍卜,是用50根草卜卦,变成由数起卦了。在此之前是“由象起卦”,即龟占,将乌龟杀掉后,对乌龟壳进行加工,问卦时用火在龟甲上灼出裂缝,根据这个裂缝,占卜师讲出这个卦的意思,这太随意了。变成数字化后,其规范程度就高了。

  从宋朝邵雍开始,起卦的过程就变的很简单、很规范了。从起卦到成卦到解卦,我们说成卦是入手大数据,成卦是圈定大数据,解卦是分析大数据。起卦最早是通过象到成卦,后来就变了,直接由数到成卦,包括数字、时间、方位、文字等都可以成卦。起卦后就成卦,把用到的数据圈定起来。易经所包含数据大到无外小至无内,根据需来圈定解卦时所用到的数据,然后再根据五行、阴阳、天干、地支、四季、八方来解卦,这是一个很规范的三段式解卦过程。

  以八字命理为例,其命理分析的最终落脚点在五行生克方面。有时候找人问命理,卦师会说一串儿顺品溜,什么白马怕青牛、猪猴不到头之类的,这顺口溜很长,实际上就是讲了五行生克的关系,也是最经典的最常见的预测模型。还有一种预测方式为纳甲筮法,也是最常用的一种算卦方法,但其整个预测过程也是这么一种模型,五行生克模型。还有一种占卜方法叫梅花易数,也是基于五行生克的预测模型,就是我们刚才提到的宋朝邵雍发明的预测方式,他也是将卦理变成一个模型来处理的,很规范。自文王以后,他定义的八卦、64卦,后人在此基础上又衍生出来很多预测模型,其实所有预测模型万变不离其宗,包括风水,我们都知道一个顺口溜,前朱雀后玄武左青龙右白虎,也是基于五行生克的预测模型。最玄幻的是奇门遁甲,很多人把它说成是帝王之学,其实它是将天文、历法、九宫、阴阳、三奇六仪等要素,分别做成模型,这些模型相互交叉推演出预测结果。现在有现成的盘用于推演奇门遁甲,这个盘也是一种综合预测模型。

  三、传统预测和大数据预测

  《大数据时代:生活、工作与思维的大变革》一书中有一个观点,大数据的核心便是预测。大多数据的作用是显而易见的,但是,对发展结果预测、对发展趋势分析才真正体现大数据的价值。《大数据预测:告诉你谁会点击、购买、死去或撒谎》一书也是把预测作为一个数据的核心来处理,这本书也是美国人写的,他在大数据预测领域中集成了自己很多的想法,而且也做了很多软件模型。他写成这本书作为一种分享。我拿这两本书出来,我很认同他们将大数据和预测作用体现出来。实际在大数据预测方面IBM行动较早,成立了专门的部门,并且现在做一些机器人、大数据预测的产品的推广,也很成熟。

  百度中对预测的描述,所有的预测基于数据,包括传统的预测方式——算卦,包括大数据预测。实际上我们一说到预测,大家首先想到诸葛亮然后又到刘伯温,再想前至500年后至500年。认为预测很神秘,能解决一切问题。其实不是这样。它有一点点趋势能够展现出来已能体现其价值。美国有一个电影,有个人有预测能力,他能够预知下一个30秒内要发生的事。这个警察就带着他,看哪个人是小偷。30秒就够了。因此,预测的力量是由小及大乃至无穷的。

  1.为什么要进行大数据预测

  1)大数据预测有益于社会的发展

  如广告投放,企业中的精准广告投放是需要预测的。实际上现在这个理念已经很成熟了,我们点开网页时,在淘宝中点击过什么书、商品,马上便会推送出来,这便是一种精准的广告投放。

  2)大数据预测可以指导企业生产和经营

  如惠普公司,全球30几万员工,通过离职风险预测,如果某个员工可能要离职,提前会有个预测,他们便会采取一些措施。他们这个部门,原来很保密的,现在不保密了,这在企业生产经营中的作用也是无限大的。大数据预测可以使企业脱胎换骨,形成全新的竞争力。对于企业而言,大数据预测可以降低客户流失风险,降低人才流失风险,降低成本浪费风险,提升市场占有率和经营利润。因此,很多企业都在不遗余力地提升预测能力。

 3)通过量化的方法预测人们的行为

  如商场、医院、银行、保险,特别是银行和保险。如美国有个大通银行,他用大数据预测是比较早的,曾经建立了贷款风险预测模型,把风险高的贷款卖给其他银行。有些小银行业绩上不去,大量的存款放不出去,买贷款节省的是贷款成本,支付的是正常的利息。大通银行通过大数据预测的方式将贷款卖到其他银行,在金融危机爆发时,其损失很小,因为他将风险转嫁了。

 4)四是通过大数据预测的规划设计,可以促使预测目标的规范化建设

  这里也是涉及到企业、部门及管理层的方方面面。预测目标的规范化建设是一项系统工程,通过规划设计,将促使相关的数据更加规范、信息系统更加规范、信息技术更加规范、业务模式和管理更加规范,同时,对管理部门、工作人员的具体分工也提出了新的要求。

  2.传统预测对大数据预测的借鉴意义

  在没有大数据预测理念前我们要分析贷款的风险,入手是很困难的。那么大的数据量,怎么能说这个人会产生风险,那个人不会产生风险?传统预测对大数据预测借鉴意义在于如下几个方面:

  数据处理条理化。传统预测,面对大至无外小到无内这么一个数据量,首先对数据进行定性,要么是阴性要么是阳性,然后按五行八卦分类便可以对数据进行处理,也包括天干地支。将大量的看不见摸不着的数据化简为繁、变大为小。实际上,不论是传统预测还是大数据预测,不管其数据有多大,最后真正能够起作用的数据是小而又小的。

 数据取舍模式化。传统预测中关于数据的取舍,是按照五行生克法则“就近”取舍,即生我者、我生者、克我者、我克者、同我者五类数据。其他无关数据一概不用。

  大数据预测面临海量数据,可以参照传统预测“就近”取舍数据的原则进行数据优化,厘清与预测目标最为接近、有直接影响的数据尤为重要。

  以贷款业务为例,如果要预防骗贷,加强贷款风险防控,主要用回归分析法,圈定所需数据,建立预测模型。

  按照传统预测的取数理念,首先找出关系数据:

  “我”为预测目标:是不是骗贷业务。

  “我克者”的数据为:真伪识别?可疑材料库特征识别。

  “我生者”的数据为:谁来贷款?特征、可疑记录比对。

  “克我者”的数据为:政策红线?重点关注指标比对。

  “生我者”的数据为:操作员?时间地点可疑特征比对。

 预测目标标准化。传统预测确定了基本的预测答案,如《周易》的元、亨、利、贞、吉、凶、悔、吝、咎、厉、孚、眚等。在此基础上,还有一些组合变化,如小亨、无不利、可贞、小吝、终吝、有厉、悔亡、无咎、终凶等等。当然,在解卦时,分析师也会根据具体情况再行发挥补充。这样的规定可以起到万流归海的效果,致使预测的结果相对规范和统一。

  当前的大数据预测,其预测的目的性以及所要预测的目标非常复杂,所要求预测结果的精准度较高,这不难理解,但不太现实。大数据分析层面可以对分析结果要求高度精确,但如果对预测结果过份要求精度,则不太符合预测的规律性。这种大信息框架下的预测要求,难免会纷繁复杂,同时增加了预测的难度。如果能够像传统预测那样把所要预测的目的要求标准化,可能会出现事半功倍的效果。

 预测模型格式化。传统预测的方法多种多样,每一种比较成熟的预测方法都经过了长期的实践、应用、完善和不断发展,逐步形成了其稳定的预测模型。与此相比,大数据预测方法、模型的多变性,尽管灵活、针对性强,然而却显露出了预测模型、预测目标不好把控的一面。以八字命理、纳甲筮法、梅花易数、堪舆术为例,这些比较经典的传统预测方法,它们的预测模型非常相似,都是基于五行生克制化的数据关系。那么,我们不妨以此为蓝本设计大数据预测的基本数据关系框架。

  大数据预测毕竟起步时日尚短,在预测模型的建立方面,还需要多方面进行探索。国外的先进做法值得借鉴,我国传统预测的经验也值得学习。

 预测模式多元化。在具体应用中,传统预测并不是单一方法的使用,而是多种预测模式同时使用、相互渗透、相互印证、相互补充。

  比如,某人因财运不通而求占,预测时可以通过八字命理进行运程分析,通过查看、了解其家居环境、工作环境的风水进行分析,也可以通过起卦的方式对卦象进行分析,更多情况下,是多种预测方式同时并用进行预测分析,效果更为显著。同样,大数据预测的规则确定、算法制定、模型建立也不是单一性的,而是多措并举。

  这是我与大家分享的易经和大数据,主要是从传统预测和大数据预测两个方面进行交互处理。时间太短,有需要交流的问题我们下来再慢慢探讨。
THEEND