创建第一个“感知”广告拦截器,它与页面布局无关


正如实践所示,广告拦截器与广告之间的斗争变成了一场无休止的军备竞赛 。 发布者正在推出难以与用户生成的内容区分开的新广告格式。 广告拦截者会迅速找到确定和屏蔽这些格式的方法。 反过来,发布者再次更改代码以绕过过滤器。 等等到无穷大。

一个可感知的广告拦截器的开发人员认为,这种猫捉老鼠的游戏不会永远持续下去。 普林斯顿大学和斯坦福大学的专家提供了一种截然不同的阻止横幅的方法-识别广告不是通过HTML标记,而是通过视觉广告标记。 就像人们一样。 这样就抵消了某些网站实施广告拦截程序的尝试。

这个想法是基于一个基本前提。 根据法规文件, 要求发布商明确突出广告内容,以使人们可以区分。 如果一个人可以区分它,那么计算机就可以。

研究人员认为,当前广告拦截器的发行商和开发商之间的“军备竞赛”是一个安全问题 。 首先,可以将阻止程序视为可提高系统安全性的功能,因为它不允许在计算机上执行可能有害的脚本。 其次,猫和老鼠的游戏就像病毒与杀毒软件的永恒斗争:它们是在通用环境中(在浏览器中)运行的相互敌对的过程。 但是法律法规对发布者具有约束力,因此广告拦截器比反病毒软件具有领先优势。

但是,在这种相互斗争中,阻止者在系统中拥有更多特权,因此他们总是有硬道理。 也就是说,在四个状态的系统(这是系统的完整模型)中,最终必须赢得阻止者(状态2和4)。


科学工作的作者写道,该模型分为三个相对容易分析的“迷你战斗”。

下图描述了感知广告拦截器的体系结构。 大部分工作在“感知库”中完成,该库应迅速适应新的广告标签技术。


例如,Facebook用几种方式同时标记广告横幅,这些横幅很容易被眼睛察觉并被感知阻止者识别。


到目前为止,作者仅发布了创新的阻止程序,将其作为Chrome Facebook Ad Highlighter的扩展。 最初的初步版本于2016年8月11日发布。 它最少依赖于HTML标记分析。 有趣的是,Facebook注意到了一种新工具的出现-并更改了标记以绕过感知阻止器。 作为回应,科学著作的作者发布了一个新版本,其中完全消除了对标记的依赖。 的确,该扩展程序现在具有有限的功能。 它仅突出显示广告,而不会将其剪切掉。 其中一位作者 ,这样做是有目的的,因为科学家不想卷入道德冲突。


由于没有很多方法可以在Internet上标记广告,因此该广告拦截器是一种非常通用的工具,而且非常轻巧。 您不需要经常更新它,并且每个新模块(针对新标记技术)仅需要几十行代码。 在测试期间,他成功屏蔽了50个测试站点中的50个广告。

测试表明,该阻止程序将页面加载速度降低了0.53±0.15 s。 但这仅是在禁用OCR文本识别模块的情况下进行的,这会大大减慢工作速度(多+1秒)。 但是,即使禁用了OCR模块,该阻止程序也显示出大约相同的高效率。 开发人员说,如果您实现本机文本识别,则生产率将大大提高,因为他们在概念中使用了JavaScript实现。 Tesseract C ++的实现测试表明,其速度比JavaScript快约10倍。

尽管下载速度略有下降,但用户仍然会赢得胜利,因为页面上的横幅广告和脚本本身会使页面平均降低44%的速度 ,并且不必要地加载CPU,从而导致移动设备上的电池消耗过多设备。 而且如上所述,它们本身会带来安全风险,因为恶意代码通常是通过标语网络分发的,更不用说通过跟踪cookie来跟踪用户了。

一些专家认为,在线广告现在是一个严重的问题和冲突。 此冲突不是用户和广告商之间的冲突,而是广告商和发布者之间的冲突。 在线广告给用户带来麻烦并威胁到隐私和安全,这一事实令广告商感到非常难过。 他们不需要这样的广告。 对于无法提供合理格式的发布商来说,这是一个问题。 从这个意义上讲,广告拦截器可以消除不平衡现象,并有助于找到可接受的解决方案来引入更充分的广告。

Source: https://habr.com/ru/post/zh-CN403255/


All Articles