使用python从FTS网站上的注册表中获取摘录

联邦税务局的网站egrul.nalog.ru/index.html提供了一个出色的服务,用于检查承包商或他们自己的公司。

检查的本质是向统一法人实体州注册簿(法人实体事实的统一注册簿)提交请求,并在线从注册簿中提取摘要。

使用该服务不会造成任何困难:我将其添加到PSRN,单击“查找”按钮,然后单击下面的“下载”按钮。 一切都摘录了。

自动化如何在这里提供帮助? 很简单

如果您的馆藏由n个法人实体组成,那么甚至将OGRN复制到服务搜索字符串中的工作也可能会很无聊。

我们将摆脱常规,自动执行从注册表中归档和下载摘录的过程!

在我们的例子中,程序将从预先准备好的excel表中“拾取”一个OGRN,在服务行中输入值,然后按必要的按钮。

理想情况下,程序将如下所示:


让我们开始吧。

首先,准备excel表,在该表中,我们将在列中添加将要使用的OGRN:



OGRN的数量无关紧要(您甚至可以下载整个USRLE),主要是它们都在A列中。

我们将提取文件命名为EGRUL.xlsx并将其保存在python工作目录中。

现在,使用程序本身-egrul.py创建文件。

与往常一样,程序的第一行从导入必要的模块开始,然后选择浏览器(在我的情况下为Chrome)并“转到”该站点:



接下来,我们遍历excel表中的所有PSRN:



在这里,您需要注意循环开始时的x值:



2-这是带有OGRN(开始)的初始单元格,其对应于excel表中的A2。 尽管循环中显示了数字10,但最后一个单元格将是A9。

必须记住,所有OGRN均已处理,并且最后的值没有丢失。
在向USRLE提交请求之间,该程序可承受30秒的暂停。 这可能看起来太长了,并且这个时间段将要缩短。 这可以通过将行time.sleep(30)中的值更改为time.sleep(10)来完成。 但是,在这种情况下,您可能会受到联邦税务局的制裁并获得验证码。 您可以绕过此验证码,但这是另一篇文章的主题。 并且在该程序中,最好在程序请求为30秒的过程中留出30秒的延迟,然后安静地喝茶。

该程序的链接在这里

在此处链接到excel测试图。

Source: https://habr.com/ru/post/zh-CN455808/


All Articles