人工智能曾经过两次繁荣,现在是它的第三次繁荣,主要原因有:一是以深度学习技术为代表的技术的迅速发展,尤其是在图象领域取得了重大的突破;二是有强大的计算能力;三是数据越来越多。正因为有了数据计算能力和算法,可以在更多的方面解决更多商业问题。当今在视觉智能实践的探索体现在如下四个方面。
1、电商搜索
目前电商搜索是一个比较成熟的产品,现在已经开始大规模的部署。目标是希望在电商搜索上,提供除了文字的另外一种搜索,如探索视频广告和视觉诊断。因为有深度学习快速的发展,电商环境下的图象搜索已经取得了重大的突破,几乎实现了所见即所得的效果,网上已经能够搜到相关的资料。
2、城市之眼
城市之眼的目标是希望对城市里面大量摄像头的分析,为我们的交通、安全提供更好的智能决策。从计算上来说,对整个城市上万个摄像头进行分析,计算量非常大。但由于有当今云、大批量计算平台的支持,通过对视频数据结构化,可以实现对全网视频数据大范围搜索。如通过车辆的属性和车牌,在视频数据中进行搜索,可以追查肇事车辆的逃逸。
3、视频广告
第一个方面的探索就是希望能够在视频中找到一个合适的位置,把广告无缝嵌入进去,并且不影响大家的观看体验。
第二个方面希望通过对视频内容的分析,嵌入合适的符合这个场景的广告。
第三个方面是智能广告设计,通过机器学习的手段使得广告海报的生成更加便捷。用户能够通过简单的画直线和方框,生成一幅跟人工几乎可以相媲美的广告海报。
4.视觉诊断
视觉诊断包含两个部分,一个是诊断机器,一个诊断生物。
传统的工业诊断方法是人拿工具到现场检查,诊断机器的目标是通过视觉分析的手段能够代替人工对机器的检查。通过现场拍摄录像,通过视觉分析的手段,能够自动的诊断出机器的故障;诊断生物则是医学影象智能诊断。