ABBYY Mobile Web Capture:在智能手机的浏览器中直接显示高质量的文档照片

图片

我们的客户经常使用手机拍照,然后将其发送到汽车共享公司,签证中心,电信运营商,金融公司和其他公司。 文件的照片足以租车,激活SIM卡,申请贷款。 但是有时候很难从智能手机获得高质量的图像。 尽管如此,我们还是设法解决了这个问题。

现在,iOS和Android上有许多用于“移动扫描”文档的应用程序。 但是,您的手机上有多少个移动应用程序? 如果您不能这样做,为什么还要浪费时间并安装更多新的呢?

在任何智能手机上已经存在的移动浏览器中直接拍摄文档要容易得多。 这就是我们创建ABBYY Mobile Web Capture的原因 。 这是JavaScript API,即我们提供给客户的SDK,可嵌入他们的网页和基于Web的应用程序中。 它使您可以直接在最受欢迎的移动OS上的Web浏览器中捕获优质图片,并将其发送到服务器或云进行进一步处理。 今天,我们将讨论这项技术的工作原理。

ABBYY Mobile Web Capture可以从移动浏览器的视频流中拍摄所需文档的照片。 帐户,驾照,护照,合同,申请表,申请书-任何文件都可以处理。

新产品使用我们的移动技术来自动捕获图像Image Capture,并将其转移到JavaScript。 该算法的核心是用C ++编写的,因此我们使用WebAssembly技术将其传输到Web浏览器。 此外,我们创建了负责使用相机的UI组件。 它们被添加到JS API中,以便开发人员可以简单方便地将来自视频流的捕获内容嵌入到基于Web的应用程序或网站中。 为了使集成非常简单,我们将示例网页代码的源代码添加到了产品的分发包中,并显示了如何正确使用我们的API。 实际上,开发人员只需要将此代码复制到他的网站即可,仅此而已-比插入用于流量分析的指标更简单。

之后,就可以在浏览器中打开摄像机并将其指向文档。 然后,ABBYY Mobile Web Capture会执行以下操作:

1.当文档进入框架时,我们在视频流中找到其边界。

2.接下来,您将自动捕获文档的清晰图像。 为此,您需要确保此人已停止移动相机并且已经“对准”了所需的文档。 我们不依赖电话的传感器,因为始终有可能一个人握住电话不动,而另一只手拿着文件移动。 为避免这种情况,我们评估图片是否在移动,即 考虑对象之间的偏移量。 如果它很小,则可以开始捕获。 另外,我们看一下清晰度。 因此,SDK会自动捕获您需要拍摄文档图片以获取高质量图像的时刻。 您不必按任何按钮:


3.在捕获带有文档的框架之后,将其剪切到边界并对齐:



ABBYY Mobile Web Capture提供了很好的图片,然后可以将其发送以供识别,例如,在ABBYY FlexiCapture中 ,并且肯定会对其进行处理。 在我们使用ABBYY FlexiCapture进行的项目的示例中,我们看到客户通常更方便地通过智能手机而不是扫描仪来输入文档。 但是,以这种方式获得的图像通常会变得模糊-因此,它们根本无法进行高质量的处理。 然后,要求通过电话发送照片的人“拍照”。 但是客户这样做并不总是很方便。

当我们开发ABBYY Mobile Web Capture时,我们意识到在浏览器中以视频流拍摄文档并不是那么简单。 首先,搜索文档的边界,估计帧的偏移和清晰度需要计算资源-我必须进行优化,以使浏览器中的视频流不会减慢。 其次,在iOS上,我们面临这样一个事实:在Safari中,不可能获得比高清分辨率更高的视频。 我们在iOS上拍摄的照片,即使在很酷的XS iPhone上,也不太好。 根本无法识别它们,因为要识别以第10种字体键入的A4文档,您需要完整的HD图像及更高版本。 我们向Apple写了错误报告,并要求使其能够从Safari以高分辨率使用相机。 他们在iOS 12.2中修复了它! 没有这个,我们的产品将无法像现在一样工作。 现在-SDK为您提供了精美的图片,然后您可以对它们进行任何操作。

当然,当我们开发SDK时,我们评估了最终用户需要解决的任务。 谈谈他们。

您需要首次开设帐户或从银行贷款,订购保险,租车或其他服务


假设您来银行。 虽然没有,但是如果您来了,那么一切都已经错了。 许多人讨厌去银行。 您的想法是这样的:“嗯,现在至少要半个小时。” 因此,如果您需要尽快获得某种形式的现金贷款,您很可能会打电话给Google并找到可用的选项。 假设您找到有关贷款的信息,并且该站点提供了在线填写申请的信息。 仅在站点而不是在应用程序中安排它很方便-您需要安装该应用程序,但是您仍然不知道他们是否会向您提供贷款。 为什么要用不必要的应用程序预先阻塞电话? 因此,您按下按钮,然后需要填写您的个​​人数据。

过去是这样的:银行要求将文件拿到相机上或从图库上载完成的照片。 人们这样做了,但是图片可能模糊不清或根本没有文档图像-根据我们项目的经验,人们经常会混淆并完全上传错误的文件。 这些钱全都寄到了银行,但是图像不适合,一切都花光了。

一些银行试图以这种方式解决这个问题:他们将“即时”的认可放在后面。 但这是另一个故事:客户拍摄了文档,然后将其发送给后台以供识别。 大约需要一分钟。 但是,当您通过手机进行服务时,一分钟是很长的时间。 在这段时间内,您很可能会确定一切都停滞了,关闭页面并致电技术支持或放弃所有东西,然后前往另一个站点申请贷款。

使用ABBYY Mobile Web Capture,客户端不需要安装任何软件。 他在视频流中拍摄文档。 技术可以处理照片并改善图像质量,现在可以轻松将其发送到银行。

您需要处理手机中的照片,然后将其发送到政府机构,签证中心,银行


你有护照吗? 碰巧手边没有文件,但您已对其进行拍照,并且图像存储在智能手机的图库中。 如果您需要在某处进行注册或在航空公司的网站上购买机票,这总是很有用的。 有时可能会要求您发送护照掉头的照片。 如果照片不是很清晰或在地毯上拍摄怎么办? 他们会在签证中心了解吗? 可能吧,但是最好不要冒险。

您可以使用ABBYY Mobile Web Capture将这张照片上传到您的站点,该技术将在图像中找到文档的边框。 如果没有界限,我们将发出警告,并提请客户注意客户可能下载了错误的事实。 另外,我们将尝试评估文档的质量,以了解其是否适合进一步识别。 (“我们将尝试”,因为此功能现在处于技术预览模式,但是我们正在积极努力进行改进。)

需要在CRM中填写卡片,而不会产生不必要的折磨


这是一个例子:我们有一个潜在的客户-汽车经销商,他需要了解向其出售汽车的人的一切。 为此,员工在Web门户(例如CRM系统)上输入客户数据。 他们向客户端请求权限,对其进行扫描,然后将数据重新输入到计算机中。 为什么员工使用Web门户而不使用移动应用程序? 非常简单:经销商的主要任务是销售汽车并为客户服务,而不是为内部应用程序编写大量代码。 因此,对于公司而言,快速创建适用于所有平台的解决方案至关重要。

借助ABBYY Mobile Web Capture,可以简化此业务流程:员工只需在智能手机上拍摄文档图片,然后使用我们的其他产品ABBYY FlexiCapture发送图像以进行识别和处理。 因此,最终,我们将节省时间,并提高数据质量。

老实说,我本人遇到过几种情况,这些情况对我直接在浏览器中扫描文档非常有用。 例如,一年前我申请签证时,我花了大约一个小时来拍摄所有必要的文件,将它们传输到计算机上,以所需的格式保存并上传到网站。 因此,在15分钟内,所有东西都可以被拍照。

我真的希望不久以后ABBYY Mobile Web Capture将在许多站点上使用,并将有助于简化需要拍照的任务!

移动SDK产品所有者Olga Titova

Source: https://habr.com/ru/post/zh-CN466019/


All Articles