使用创新的方法来区分Internet上的人和机器人会带来许多严重的问题出人意料的是,要确保网站可以确保用户不是机器人,需要付出很多努力。 因此,在进入站点时,通常会从CAPTCHA系统中看到问题:建议通过单击几下鼠标来识别人行横道,交通信号灯和店面的模糊照片。
任务的类型多种多样:从需要识别并进入该领域的模糊信件,
到达美航空网站上的“ Comfort Plus”之类的公司标语-似乎现代航空运输的可悲状态仍然不足以反乌托邦。 不过,最常见的是Google的reCAPTCHA服务,该服务的
第三版于2018年底发布 。 它的任务是显着减少用户进入网站时所需的操作次数,这是通过根据用户行为的“人性化”为用户分配不可显示的等级来实现的。 最终,CAPTCHA的最初任务是清除出于网站目的而不是出于诚实目的的机器人帐户。
但是,由Google专家开发的创新系统有一个缺点:新版本跟踪用户在网站上的所有活动,因此可以确定他是否真的是一个人。
翻译成Alconost
资料来源:Alexey Bezrodny / iStock / Getty Images Plus需要改进吗?
在我们了解这种新产品的工作原理之前,先弄清楚它的来源是很有用的。 新的reCAPTCHA取代了相对较旧的Web技术,该技术不仅用于保护站点。
CAPTCHA工具-意思是“用于区分计算机和人的全自动图灵公共测试”-最初是在90年代后期出现的:它是
由最早的搜索引擎之一-AltaVista组成的团队开发的 。 在此之前,编写一个自动注册该服务并发送成千上万的垃圾邮件评论的机器人非常容易。 AltaVista解决方案基于打印机手册中的建议,以防止不良的光学字符识别(OCR); CAPTCHA系统的特征性模糊文本是专门制作的,这种方式很难用计算机阅读,但对于人来说却很容易,因此可以过滤出僵尸程序。
到2000年代初,这些测试无处不在。 然后是reCAPTCHA,它是由卡内基·梅隆大学的研究人员开发的,于2009年被Google收购,它使用了相同的想法,但是采用了一种新的方式:通过输入验证文本,用户必须识别程序无法识别的某些单词。 也就是说,程序扫描文本并标记它无法识别的单词。 在reCAPTCHA测试中,然后将这些单词放在已知单词旁边-通过这种方式,用户会在一个已知单词上进行检查,然后他帮助识别一个新单词。
到2011年,
Google仅使用reCAPTCHA测试就
对整个
《纽约时报》档案进行
了数字化处理 。 用户一次只用一个模糊的单词就可以识别报纸扫描中的文本,最终可以数字化报纸目录并组织搜索。 通过创建一种方便的工具来保护网站免受僵尸程序的侵扰,Google能够吸引人们从事繁琐的工作。
您不能拒绝使用reCAPTCHA:您被迫同意跟进或停止使用所需的网站。取得了这样的成绩后,2014年reCAPTCHA切换为显示来自Google Street View应用程序的图像。 单击“我不是机器人”按钮后,可能会要求您确定九个图像中的哪个包含“自行车”或“路灯”。 同时,Google减少了要求用户检查的频率-这是通过
行为分析实现的:现在reCAPTCHA可以在后台工作并跟踪我们如何使用网站。
如果您的计算机上有来自Google的Cookie,或者您使用页面上的鼠标和键盘看起来像不是机器人,则系统不会要求您进行街景测试。 但是一些关心隐私的用户抱怨说,在删除cookie并以隐身模式查看时
,提供通过的reCAPTCHA测试数量
急剧增加 。
用户还指出,当使用带有Firefox等Google Chrome的竞争浏览器进行工作时,需要进行更多测试,这自然引发了一个问题:reCAPTCHA是否用于增强Google在浏览器中的主导地位?
这引起了严重的隐私问题,特别是因为Google的主要收入来自依赖数据跟踪的广告业务。 可能令人不安的是,reCAPTCHA本质上是隐藏在常规网站上的广告跟踪工具,就像嵌入在网页中的同一Facebook Like按钮一样。
Google的观点
要使用最新版本的reCAPTCHA,
开发人员应在网站的尽可能多的页面上
包含跟踪标签 -这为更好地了解用户操作提供了机会。 但是,此工具并非一尘不染:例如,还有Google Analytics(分析),该平台可帮助开发人员和营销人员了解访问者如何使用网站。
根据Built With版本 ,它是一种出色的工具,可在
访问量最高的1百万个网站中的100,000多个中使用
100,000 ,但同时也是跟踪Internet用户习惯的策略的一部分。
新版本的reCAPTCHA填补了该图像的缺失部分,并允许Google进一步渗透到不使用Google Analytics(分析)的网站。 为了回应相关索赔,该
公司告诉Fast Company ,它不会出于广告目的从reCAPTCHA收集用户数据,而是将其收集的数据用于改善服务。
但是,即使对于在家中实施此技术的开发人员,此数据也仍然封闭在黑匣子中。 reCAPTCHA
文档没有提及用户数据,也没有说明如何跟踪用户以及最终在何处找到信息-它仅描述了实际实现。
我要求Google详细说明从长远来看,公司在reCAPTCHA与广告业务之间的独立性方面将承担哪些义务:事实是它们现在没有连接,这并不意味着将来就不会连接。
“ Google不会将reCAPTCHA用于个性化广告。”
谷歌发言人表示,“ reCAPTCHA仅可用于打击垃圾邮件和[网站]的滥用”,并且“ reCAPTCHA服务API的工作原理是收集有关硬件和软件的信息,例如设备和应用程序数据,并发送这些信息。 Google数据进行分析。 与您使用服务有关的收集信息将用于改善reCAPTCHA并用于一般安全目的。 Google不会将reCAPTCHA用于个性化广告。”
太好了,希望Google信守诺言。 问题在于没有理由相信一切都会如此。 引入如此强大的跟踪技术是应该引起公众密切关注的一个步骤,因为我们已经看到了出错的容易程度。 例如,2014年曾承诺,WhatsApp将保持独立,并将与Facebook后端基础设施分开工作,但
仅在两年后,该决定才进行了修订 。 当Google收购Nest时,我们还获得了独立性的保证,
五年后它就被
放弃了 :设备所有者必须切换到Google帐户或放弃某些功能。
凭借其庞大的资源和广泛的覆盖范围,Google可以创建类似于reCAPTCHA的服务,但这也是怀疑一切都会变得更糟的原因。
不幸的是,我们作为用户几乎无能为力。 您不能拒绝使用reCAPTCHA:您被迫同意跟进或停止使用所需的网站。 如果您不喜欢机场的人体扫描仪,则可以至少拒绝它们,并进行常规搜索。 但是,如果该站点具有reCAPTCHA,则不能拒绝使用它。
如果Google打算在考虑公共利益而不是自身利益的基础上创建这样的工具,则公司需要找到更令人信服的方法,以确保他人在方便时不会改变自己的想法。 如果他们想打开项目的源代码(就像
其他许多产品一样 ),将其从公司中剔除或至少建立第三方监督,那么这可能是一个很好的开始,它将有助于赢得用户的信任。
关于翻译这篇文章由Alconost翻译。
Alconost以70种语言
本地化游戏 ,
应用程序和网站 。 母语翻译,语言测试,带有API的云平台,连续本地化,24/7项目经理,任何格式的字符串资源。
我们还制作
广告和培训视频 -适用于销售,图像,广告,培训,预告片,专家,Google Play和App Store的预告片的网站。
→
了解更多