卡巴茨尼克和他的银行客户代表成为了一个高端骗局的目标,这一骗局吸引了网络安全专家的注意:利用人工智能(AI)生成“深伪”音频,即模仿真人声音的音频。
深伪攻击势头猛
这还是个新问题,尚没有关于其发生频率的全面计算。但是,负责监控美国多家大银行音频通信、为美国十大银行中的八家审查自动语音验证系统的“静默”公司的一位专家说,他看到今年“深伪”音频大幅增多——语音诈骗骗局的精巧程度也大幅提升。另一家语音验证服务提供商纽安斯公司则早在去年年底就首次成功地对一家金融服务客户进行了深度伪造攻击。
遭黑客窃取的银行账户信息等客户数据——在黑市上可广泛获取——有助于骗子发起这类攻击。富裕阶层客户的数据变得更加容易获取,包括其演讲在内的公开露面信息在互联网上唾手可得。寻找寻常客户的音频样本也轻而易举,只需在TikTok和Instagram等社交媒体应用程序上进行搜索,输入骗子已经获得其银行账户信息的人士的名字即可。
“静默”公司首席执行官兼创始人维贾伊·巴拉苏布拉马尼扬说:“网上有大量音频内容。”
“合成语音”可识别
过去10年来,“静默”公司审查了超过50亿通电话录音。这些电话是其所服务的金融公司运营的呼叫中心接到的。这些呼叫中心负责处理银行账户、信用卡和大型零售银行提供的其他服务。所有呼叫中心都会接到诈骗分子的电话,每年一般在1000通到10000通不等。巴拉苏布拉马尼扬说,每周有20通电话是骗子打进来的,这很常见。
“静默”公司见到的大多数伪造音频攻击是打给信用卡服务呼叫中心的。在这些中心,人工客服代表会接待需要信用卡服务的客户。
巴拉苏布拉马尼扬为记者播放了一段匿名录制的、于今年3月记录的此类通话。尽管这是一个非常初级的例子——这个案例中的声音听起来很像机器人,更像是电子书阅读器而非真人——但这通电话说明了,随着AI使模仿人类声音这件事情变得更容易,骗局可能会如何发生。
银行工作人员再次询问客户姓名。随后一阵沉默,其间可以听到微弱的键盘敲击声。据巴拉苏布拉马尼扬介绍,键盘敲击的次数与客户姓名中字母的个数一样。骗子正在将单词输入一个程序,然后该程序读出了这些单词。
像他所分享的、利用文本输入技术的通话是比较容易防范的一类攻击:呼叫中心可以利用筛查软件来获取技术线索,截获由机器生成的语音。
避免骗局不容易
巴拉苏布拉马尼扬指出,一种生成式AI系统——微软公司的VALL-E系统——可以制造“深伪”音频,即只需3秒钟的音频样本就可以说出用户想说的任何话。
托巴克说,这次袭击只花了5分钟就完成了。她所使用的工具今年1月就可以买到了。
微软公司2021年收购的语音技术供应商纽安斯公司负责安全和生物识别技术事务的总经理布雷特·贝拉尼克说,尽管可怕的深伪技术演示是安全会议的主要内容,但现实生活中的攻击仍然极其罕见。纽安斯公司的客户唯一被攻破的案例是在去年10月,当时攻击者进行了十几次攻击才成功。
贝拉尼克最担心的不是对呼叫中心以及多家银行已经采用的语音生物识别系统等自动化系统的攻击。他担心的是来电者直接联系到个人的骗局。
卡巴茨尼克说,这名工作人员称攻击者“就像我在和她说话,但说的话不着边际”。
安全威胁难消除
卡巴茨尼克说,在很快又接连两次接到这样的电话后,这名银行工作人员向美国银行的安全团队报告了此事。由于担心卡巴茨尼克的银行账户安全,她不再接听他的电话,也不回复他的电子邮件——甚至是卡巴茨尼克本人发送的邮件。他们两人大约花了10天时间才重新建立联系——是卡巴茨尼克去了她的办公室见她。
美国银行发言人威廉·哈尔丁说:“我们定期训练我们的团队发现和识别骗局,帮助我们的客户避免受骗。”他说,他无法就具体客户及其经历发表评论。
尽管这些攻击变得越来越精巧,但它们源自一个存在了几十年的基本的网络安全威胁:数据泄露,即银行客户的个人信息遭泄露。根据美国联邦贸易委员会的数据,从2020年到2022年,超过3亿人的个人信息落入了黑客之手,导致88亿美元的损失。
一旦黑客获得了一批数据,他们就会对信息进行筛选,并将其与真人进行匹配。那些窃取信息的人几乎从来都不是最终使用信息的人。盗贼卖出信息。行业专家可以利用轻易获得的程序中的任意一个来假冒目标客户的电话号码——这就是卡巴茨尼克的例子中可能发生的事情。他声音的录音很容易被找到。在互联网上,有其在会议上讲话和参加筹款活动的视频。