人工智能和机器学习是全球关注的新趋势,也是当前最火爆最流行的话题,尤其是目前,国际科技巨头正在加速人工智能产业化布局,人工智能时代随之到来。利用人工智能和机器学习的技术,加上海量数据挖掘,这一技术未来可以有无限想象空间,也将会应用到更多领域。
美图公司于3月25日举办的互联网技术沙龙,正是围绕“人工智能和机器学习”这一话题展开。互联网技术沙龙是由美图公司主办的线下技术交流系列活动,邀请技术大咖围绕着最热门的技术话题进行交流和分享,为中高级技术人员打造高质量的技术交流圈。
此次活动是美图举办的第四期沙龙,美图公司高级技术经理吕金松以及百度公司资深数据科学家祝恒书受邀进行主题演讲,近百位来自各行业的中高级研发工程师和架构师参与交流。
美拍:社区文本的挖掘与实践
美图作为全球覆盖超过11亿台移动设备的领先移动互联网公司,其技术团队始终在实践中探索,如何通过人工智能和机器学习技术,将海量数据转变为有价值的信息,并为用户提供更优质的用户体验。
作为美图旗下知名短视频与直播社区,美拍每天会产生百万级数据,随之而来的是大量文本数据的积累。吕金松分别从文本反垃圾与反作弊、文本的挖掘与探索、美拍视频搜索的演进构建等构建三个模块阐述了关于美拍社区文本的挖掘与实践。
美图公司高级技术经理吕金松分享
面对可能出现的垃圾文本的批量攻击,技术团队采用LCS和LRU的序列方式,经过决策出识别判断产出,并进行更体系化的文本反垃圾构建,引入异常检测和层次化处理框架。通过体系化的构建,采用机器学习的方式,技术团队现已基本能够召回和分析垃圾作弊内容,将用户垃圾和异常行为对平台影响降低到一定水平之下。
为了完善文本处理,技术团队也进行了一系列的开发和探索。如,针对于美拍的场景开发了一套热点识别的模型;为了优化推荐体验,对美拍的评论进行了情感分类,显性地分析用户对视频情感的极性;对分词开发新词发现进行了优化等等。
吕金松还重点分享了美拍站内搜索演进与构建,并分享了美拍的社区化搜索情况。美拍的搜索模型,就是从早期建立的战略搜索模型开始,逐渐进行搜索模型的演进,再到比较高转换的模型,最后演化为具备个性化特征以及环境社群特征的比较完善的站内搜索模型,也即社区化的搜索。
百度:机器学习技术在商业智能领域的实践
基于机器学习的智能化工具能够通过自动化整合、挖掘、学习不同应用场景下的多源异构数据,为人们提供科学化、客观化的决策支持。随着人工智能、大数据相关技术的高速发展,各领域都在尝试通过基于机器学习的数据分析手段来实现智能化的商业决策支持。
百度公司资深数据科学家祝恒书首先介绍人工智能时代下商业智能数据挖掘研究的背景和机遇,再结合自身研究经验和具体应用案例,分享了其在移动互联网用户画像、房地产、体育、企业管理等重要商业领域的研究成果。
百度公司资深数据科学家祝恒书分享
祝恒书将商业智能划分为三个阶段,从七八十年代的人工数据分析阶段,到类似于IDM开发的商业报表软件阶段,再到用真正人工智能技术和大数据、云计算技术实现商业智能的阶段。现阶段的主要目标就是通过最新人工智能技术,来发掘隐藏在大数据中潜在的有价值的信息,来帮助人们进行更好的商业决策。
此外,祝恒书还介绍了他目前的主要研究方向,即用人工智能技术+技术去实现真正智能化的企业管理和人力资源管理。目前已经发表部分研究成果,用机器学习的方法自动化对各个公司招聘的状态、招聘的需求以及招聘的主题进行分析,自动化学习出招聘的状态。
美图互联网技术沙龙 高质量技术交流圈品牌已形成
美图互联网技术沙龙是由美图公司主办的线下技术交流系列活动,目前每季度举办一次。邀请技术大咖莅临现场,围绕最热门的技术话题进行交流和分享,为中高级技术人员打造一个高质量的技术交流圈。
美图公司表示,每期沙龙都会提前在微信公众号“美图互联网技术沙龙”上预告,并且向大众开放报名,每期技术沙龙也会在美拍帐号“MTC”(美图培训中心)上进行全程视频直播,让更多对此感兴趣但是无法到现场的技术同仁可以分享到美图为大家准备的技术盛宴。