我如何创建有利可图的Android文本识别应用程序

大家好 在上一篇文章中,我谈到了如何在Google Play市场上赚到我的第一笔$ 100。 在本文中,我将更多地讨论项目的开发和管理。

本文的主题是一个Android文本识别应用程序,该应用程序已经投放市场4个月,通过付费订阅,应用程序内购买和广告获利,将近10,000次安装。

该应用程序可以识别文本(Google Vision OCR API),翻译识别的内容(Bing Translate API),生成可搜索的PDF,在Cloud中存储历史记录。

关于识别,API选择的一些知识


创建您的Android文本识别应用程序的想法很久以前就出现了。 该主题是偶然选择的。 我想开发一个OCR应用程序,因为我已经具有基于Tesseract的现成的OCR功能。 早先在Habré上,我写了如何基于Tesseract创建简单的OCR应用程序 。 那时,在我看来,工作几乎完成了一半,您只需要快速滚动一张漂亮的脸蛋即可投入生产! 哦,我错了。

在此过程中,很明显,在Android设备上执行OCR是一个坏主意,该设备的性能很差,并且您必须等待很长时间才能获得结果。 此外,Tesseract OCR模块占用大量磁盘空间(17 MB),而这只是Light版本,带有最少的英语词典。 我决定创建一个后端部件,并在那里放置OCR模块。 由于词典变得更加完整,以及有机会更新鲜地使用Tesseract版本(Tesseract的Java包装器比Android包装器更频繁地更新),因此识别质量提高了20-30%。

但同样,识别质量是开源的:),就像人们对开源库所期望的那样。 然后,一位与GitHub的熟人建议我测试Google Vision OCR API。 该库不是免费的,但是我有心理上的意愿为API付费。 Google Vision给出了更为准确的结果,而这正是我目前正在使用的结果。 一个月内,仅使用此API的费用约为20美元。

Google提供了一个很好的文本翻译库,但对我而言似乎很昂贵-翻译费用比识别费用高2-3倍,为了节省,我改用了Microsoft的Bing Translate API。 质量还没有下降,但是在广告中,我无法喊出100多种语言进行翻译,其中只有64种语言。没有免费的优质API可供翻译。

我使用的所有其他服务都是Google。 Google App Engine用于托管应用程序,Google Database,Google Storage用于数据存储。
使用现成的解决方案对我来说很方便-我一个人工作,很少有发展时间(我是年轻的母亲)。

有关设计,团队管理的一些知识


开发工作独自完成,但吸引了设计师和Android初级开发人员来进行新设计。

我想写一些关于寻找设计师的文章。 应用程序设计,图标和促销花了我$ 55。 我相信它非常便宜,价格远远超过质量。 我在俄罗斯自由职业者网站上找到了一名设计师。 几乎不花钱的设计师都有一个共同的特点-只有在详细说明细节(直到每个按钮的形状以及该按钮的RGB颜色代码)后,他们才能发挥出色的作用。 这意味着您需要成为一名创意总监,并花时间进行详细的工作。

在Upwork上找到了初级Android开发人员。 我只是想从客户那里获得经验。 给他一个简单的任务-拉设计。 付了70美元。 当然,雇用Senior dev-a,指示评估应用程序的体系结构,向他学习一些东西,但不敢花很多钱会更有趣。

我想指出,让其他人参与项目可以使您更好地控制项目。 当您为他人计划时,请设定截止日期-您为自己计划,然后开始更快,更自觉地完成工作。

关于分配的一点


当应用程序进入Play市场时,我在AdWords上投放了广告,吸引了来自世界各地的用户。 大多数用户来自印度(占总数的15%)。 但是,这些国家的人们从未购买过订阅。 他们订阅了很多次,但是在7个免费试用期内,他们取消了订阅以避免付款。 此外,他们对广告的点击几乎没有。 事实证明,为此类用户提供服务是无利可图的,因为我必须支付API费用,因此我决定从人均GDP排名前30位的国家(包括俄罗斯和乌克兰)删除该应用程序。

希望我的经验对您有所帮助。 如果您从事类似的项目,或者只是想交流经验,请写信或添加到linkedin。

Source: https://habr.com/ru/post/zh-CN422191/


All Articles