11月6日,由京东金融与红杉资本联合主办的首届“JDD-2017京东金融全球数据探索者大会”正式在北京拉开大幕。
国际人工智能联合会理事会主席杨强谈到,金融业闭环路径短、交易频度高、复合迭代快,是最适合AI应用的场景。
国际人工智能联合会理事会主席、香港科技大学计算机科学及工程学系主任杨强教授
以下为演讲实录:
刚才我们听到了几位从不同方面给我们解读了人工智能、金融、数大局方面的前景。今天,我的主题是从另外一个方面来看这个问题。
首先我是一个做学术的,同时我对商业也有着浓厚的兴趣,所以我想探讨一下从学术的角度来看商业的问题,我们会得到哪些新的发现。
首先来看一下ALPHAGO的成功,首先ALPHAGO能够引起很大的振动,我们从中能学到什么,对我们的商业方向有哪些指导呢?
首先我们看一下AlphaGo本身是几个算法的结合,深度学习,还有一个算法叫做强化学习,就是中间这个图所表达的,算法和环境有一个有机的连接,那么环境不断给算法提供反馈,深度学习就像右边这个图所表达的,它既能告诉你你当前的状态,又能为你未来的行为提供一个指导。
这样一个算法是不是可以应用在我们实际当中去呢?我们看一下,从当中我们可以获得不同的解读,这个是我的一个想法。
首先,是这个闭环的路径要短。商业路径也好、算法路径也好,它的中间最好不要有过多的环节,比方说从用户到得到反馈,到反馈到AI的算法得到补充,最后再返回到应用,这个闭环要足够短。
第二,这个反馈一定要足够高频、高通量的反馈,不断得到反馈,系统得到刺激,这样它的智能才能够成长。
第三个,也是大家过去比较忽略的,它的反馈效果一定要起到一个复合的作用,我们在经济上经常讲复合收益,在人工智能上的成功这一点也是非常重要的,像这个图所表达的,也就是说这一轮的反馈对系统的增益要持续进行,就会有一个指数型的收益上升。
我们再看看周边实际遇到的问题,是不是有很多类似的场景满足这样的需求呢。我们回顾一下人工智能的里程碑。
九七年,我们有深蓝。然后一一年的时候我们有IBM watson,最近我们又有了AlphaGo,无人车,包括最近有了德州扑克,这些都是我们引以为豪的人工智能。
在这些里程碑的成功背后是不是路径闭环足够短,反馈足够频繁。另外,复合作用是非常明显,系统在不断改进自己,智能在提升。
再看一下周边的工作,所以我就有一个想法。人工智能在现阶段的应用并不是在所有领域都会取得成功,我们一定要非常仔细挑选在哪些领域人工智能比较容易得到成功,在哪些领域还要等一等。
所以,下面就要来看一下技术和商业这两方面到底哪些是我们现在可以得到效益的风口。
首先来看一下技术风口。人类的知识获得70%以上都是通过视觉的,也一点都不奇怪,深度学习的发展肯定对人工智能的应用、对人工智能的技术一定是持续发展的。比方左边列的这些技术方向,包括用更好的深度学习、可解释的深度学习,包括理解物体之间的关系,包括通过一个视频可以理解里面的一些人类能理解的摘要,把它给取出来,为人类和计算机的模型进行沟通。
自然语言紧随其后,包括文本的阅读、理解、产生、问答、分析等等,现在深度学习都带来了非常大的提高。但是,这个提高还是要随着算法的提升有待更加地提高,在使用当中能够产生更大的效益。
另外一个,智能推荐。在电商、在往上购物等等都有这个推荐。但是推荐的一个重大的问题就是我们很容易陷入一个所谓的深坑,就是在机器学习技术上所说的过拟合。当我们点击了一个在手机上的新闻,我们会得到好多这样的新闻,系统不会顾及到我们对其他的兴趣。
怎么样解决这些问题呢?这个就是技术上的革新所期待的,我们在这方面也在不断做新的研究。
还有一个就是我个人的研究,迁移学习。比方说人类很自然就会使用迁移学习,我们在一个领域很专业,怎么把这个知识迁移到另外一个领域,能不能让计算机也有这个能力。有很多的专家认为这就是人工智能机器学习下一个的热点。
迁移学习也会带来很多技术革新。比方,我们可以在一些小数据上面应用大数据得到的结果,在一个领域得到一个非常好的模型,可以把它迁移到周边一些小数据的模型,这个也是人类学习的一个有效的模式。
另外一个,迁移学习可以使得模型的可靠性得到加强,一个模型产生了,我们可以让它在不同的场合都适用,这个模型就更加可靠。
再有,越来越多的个性化的需求,在场景当中经常听到这样的名词,千人千面,这样一个场景可以用迁移学习实现。比如右边这个图表现,如果在云端得到一个通用的模型,可以把它适配到各个终端,使它在不同的终端就有不同模型的体现,这样就实现一个个性化。
它带来的另外一个好处就是迁移学习可以解决隐私问题,每一个终端用户都不必把他的个性化的数据上传到云端,就可以得到它的结果。
所以,我们很期待这样一个技术的革新。
这里是迁移学习的一个实例,右边这个图表示迁移学习不一定是一步到位,从一个模型迁移到一个场景,我们可以通过一系列的场景把一个模型迁移到不同的更广泛的范围,比方说一个手段就是中间这个图所示的用深度学习来做迁移学习,这也是我最近一个研究方向。
最右边这个图就表现了一个实际的应用。最近斯坦福大学和联合国共同做了一个应用,利用卫星图片分析非洲大陆不同地区的贫困程度。利用这种所谓传递式的迁移学习,就大量节省了人力。过去是要派一些观察员到本地去做各种积累、各种调查,现在不用了,现在就用卫星图片把白天和晚上的地球图象加以比对,最后训练出一个模型,大大节省了人力。
这里我们看到这些技术可能的革新,这些技术革新和商业应用方向有哪些是最契合的。这里我要特别提金融方向。我们之前提过,一个是闭环的路径要短,一个是沟通要高频,最后要有复合效应产生,很快让模型能够变得壮大。那么金融就是这样一个领域。
我不用多说大家也明白,在金融里面有各种各样的场景,比方和用户沟通的场景,金融的安全、活体识别、识别用户本人,用人脸识别、用声音识别、用行为识别。在后端,可以对用户整个风险进行分析,是不是应该借贷。做一笔投资,在这笔投资之前要进行风险分析,现在基于大数据和人工智能可以自动产生这样的分析,像个人和企业的征信。
另外运营方面、投顾方面,我们都可以借助于人工智能大量加强提高效益。经济本身就是一个提高效益的不断的过程。现在人工智能又为经济效益的提升提供了一个强大的动力。
比方刚刚讲的风险管理这里面又分监控、识别、评估和干预,每一个方面都可以有大量的人工智能的参与。
这里一个很有趣的例子是从京东金融本身的实践得来的,就是人工智能可以帮助养鸡,是一个非常有趣的应用。比如过去一个养殖户用12块钱养一只鸡,需要提前贷款,贷一笔很大的款放在那儿,这个时候就产生了很大利息支出,这个对养鸡户是一笔很大的费用。但是鸡的成长,小鸡的时候不需要吃那么多的饲料,只有长大的时候才吃。不同的鸡对不同饲料的需求也不一样。当我们能够掌握这个过程的时候,我们就可以把把放贷变得因地制宜,在一开始养鸡户不需要借这么多钱,过去逐次增加。所以如果我们能够做到按日计息就可以做到这一点,就能够大大提升效率。
到现在京东金融可以做到6分钱就养一只鸡,用人工智能的算法来做分析。
同时我刚刚提到推荐系统,大规模的机器学习系统,当前共有的一个问题是过拟合。就像刚才说的,在手机的一些新闻的APP上,当我们点了一类的新闻以后,后面20个都是那一类的新闻,这是为什么呢?这是因为在技术上,它没有照顾到两个需求,一个是准确性的需求,一个是多样性的需求。
现在我们在研究上,我们在研究一个强化学习的模型,能够把两个需求全部照顾到,就是右边这个名词叫迁移的匪徒模型。用这个模型既照顾到准确率,又召开到多样性,就把过拟合的问题彻底解决。
最后,我要说一下JDD背后是一个大赛,同时在中美两边进行。说起JDD,我要特别提KDD,即数据挖掘和知识发现,在学术界大家都听说过KDD,这样的大会已经有过20年的历史,而且每一年都有一个大赛,就是由工业出题,也变成了我们发现一些优秀团队的一个方式。
今年的JDD也是采用了这样一个在金融方面的非常大的机会,今年的机会来自四个方面,都是紧贴着金融应用的。一个是登陆的行为识别,要发现有没有可能是欺诈的行为,这里面需要深度学习,需要了解一些金融的知识,所以需要两方面的知识,这也是JDD大赛的一个特点,我们不仅要技术上的革新,同时也需要这些参赛队伍能够写出一个商业计划,能够把商业场景想清楚。
第二,金融界非常关键的一个需求,就是信贷需求的预测,还有店铺销量的预测。
最后一个非常有趣的识别叫做猪脸识别,而不是人脸识别。猪脸识别是需要做什么呢?首先我们可以获取到大量数据,而不用担心隐私问题,我们想猪可能不太关心隐私。同时又是一个活体识别的问题。同时确确实实背后有一个商业场景的问题,我们可以设想一下,假如有学生参加这个比赛,一个场景就是它可以帮助养猪户鉴别不同的猪只在养殖过程中的各种活动,这个猪是不是活跃,它是不是散养的,它还是一只非常不爱动的猪,对健康就可以作决策,对保险就可以作预测。另外消费者可能也会有挑选,有人可能喜欢不同的猪肉,可能对整个的历史还有猪的鉴别就有个别个性化的需求。所以既有深度学习的应用,又有商业的应用,所以这是非常有趣的一个题目。
我们就很期待这样一个学术界和金融界的结合,就是从JDD大赛开始。