什么是暗网?
如果互联网是一座冰山,那么我们普通人能接触到的,只是作为冰山一角的表层网络。而隐藏在水下的,标准搜索引擎无法进入的部分,被称为深网和暗网。
据一些非正式数据统计,暗网的数量是明网的400-500倍,占全部网络信息的90%以上。
「深网」与「暗网」和互联网冰山
传说,作为互联网的阴暗面,在暗网上可以买到想买的一切。色情片、开房信息、人肉搜索、违禁药品等等,这些都在暗网公开售卖。你甚至可以买到枪支,更有极端传言,暗网可以雇凶杀人。
总之,暗网就像互联网的黑市一般,只要通过特殊的浏览器就能进入其中只要你付得起钱,就能买到想要的一切。正是由于暗网具有难追查的特性,使其成为网络不法交易的“天堂”。
暗网被部署于匿名网络之中,访问者和被访问者都被隐藏起来。而匿名网络由全球的动态网络节点组成,跨越不同国家与地区,加之通信加密,难以实施监听与定位。
人工智能作为一项技术本无善恶之分,但是正如互联网除了我们日常可以接触到的表面,还存在一个“暗网”一样,人工智能也可能被心怀不轨的人利用,作为一个犯罪工具。
用AI在暗网再造一个“你”
今年2月,卡巴斯基实验室的欺诈侦查小组捣毁了一个名为“创世纪”(Genesis)的暗网市场。该市场出售“数字身份”(互联网用户的电子身份信息),每条信息起价5美元,最高可达200美元。黑客们通常会用恶意软件攻击他人电脑,并且找到并复制这些个人数据以及其他个人身份识别信息。
“在这一点上,黑客们已经能够收集、管理和维护他们所侵入的用户的大量数据,”一家基于机器学习的技术公司的产品经理ImranMalek说,“这意味着,如果你的笔记本电脑被黑客入侵,黑客的战利品不一定是被入侵的电脑,而是你电脑上的所有数据,包括所有的身份识别信息。”
有了这些信息,通过特定浏览器和代理服务器来模仿真实用户的活动。再加上盗取的互联网用户的帐户信息,攻击者就可以自由地以该用户的名义进行新的、可信的交易——包括使用信用卡消费。
暗网上某交易市场
用AI对抗AI
在打击“暗网”犯罪的过程中,人工智能正成为一把利器。
消失速度极快是“暗网”犯罪的一大特征,因为它们可能遭到其他黑客攻击、安全部门突击搜查,或者本身就是被设计成一个“退出骗局”——顾客为未完成的订单付费后,该网站会故意关闭。
卖家和买家在网络的多个层面(从表面到黑暗)以及在黑暗网络论坛上进行联系。“这种网站之间的不断切换现在已经成为暗网市场运作方式的既定组成部分。”
针对这一情况,林肯实验室(MIT Lincoln Laboratory)正在开发新的人工智能软件工具来分析表面和暗网数据,他们训练机器学习算法来计算不同论坛上用户之间的相似度,自动形成人物角色链接。
黑客利用AI进行对抗性训练
安全部门及相关公司利用机器学习打击“暗网”犯罪的同时,黑客也开始利用机器学习进行对抗和犯罪。
黑客能利用“数字孪生”作为数字面具模仿真实的用户,并选择网络安全技术来通过欺诈检测协议。如果一边是机器学习,那么另一边也是机器学习,现在,黑客正在实施他们自己的方案,作为一种对抗性的机器学习训练。
网络攻击难以防范,AI该如何应对呢?
网络安全防御确实存在难度。防御是一个面,攻击是一个点,攻击方与防御方不对等,攻击方只需要找到一个突破点即可宣告攻击成功,而防御者需要做好方方面面的防御工作。
其次,网络攻击溯源难。网络攻击的攻击路径可能跨越多个国家,很容易涉及跨司法管辖区域的问题,这在一定程度上限制了溯源范围。另外,现有的网络攻击溯源方法离不开网络基础设施的辅助,而目前网络基础设施建设仍存不足。”
维护网络安全也并非毫无办法。
近年来,网络安全威胁情报研究兴起, 即利用共享威胁情报提前部署防御计划。网络安全专家指出,“威胁情报及AI人工智能技术不仅能为攻击溯源提供更多的数据支撑,还可能追踪到实施攻击的个人或组织。
就取证而言,针对庞大的暗网,一方面可以研发出更有针对性的爬虫技术,以便获取后台数据库;另一方面可与暗网网站合作,促进信息对接,这两种方法对暗网溯源都能起到一定作用。”
另外,曾有国际网络安全专家推出了一个新的智能采集系统,它能在暗网(dark web)和深网(deep net)中使用机器学习来研究黑客论坛以及他们的交易市场。该系统能搜寻潜在漏洞的线索。
他们使用机器学习算法来检测相关站点上的讨论的物品和主题信息。他们使用的机器学习原理是通过手工标记约25%的数据,表明哪些相关、哪些无关,然后该机器学习算法通过自主学习剩下的相关数据并进行判断。
对于人类来说需要一分钟来标记五个交易市场或者相关论坛上的两个主题,但是让机器学习算法来干的话这个时间可以大大缩小。
利用机器学习查找暗网、深网中信息示意图
人工智能技术的兴起为网络攻防双方提供了新工具。道高一尺,魔高一丈。在网络安全上这最终还是会否变成一个猫鼠游戏?
我们不禁思考,当黑客们意识到他们会被机器学习算法这样监测之后肯定会改变他们的活动方式,到那时机器学习算法是否还能高精度的进行监控识别呢?在不久的将来,网络攻防之间的对抗或许会演变成人工智能技术之间的对抗。