Lidamos com erros e “muletas” no Registro Estadual Unificado de Pessoas Jurídicas - o registro estadual de pessoas jurídicas



Na semana passada, lançamos um artigo sobre o registro - um registro estadual com dados de 10 milhões de empresas. Esse material fala sobre coisas básicas, por isso é melhor começar com isso.

Aqui, revelaremos um tópico rico e fértil - os problemas do Registro Estadual Unificado de Pessoas Jurídicas que impedem que nossos desenvolvedores fiquem entediados.

Estrutura XML quebra periodicamente


Em 2017, a cada dois ou três meses, as atualizações traziam xmls no formato errado. Há um conjunto completo: tags desconhecidas, tags abertas, incompatibilidade de tipo de dados. Por exemplo, no xsd, o tipo de data é especificado, mas, na verdade, há uma sequência incompreensível.

Quando isso acontece, resta escrever para o suporte técnico e esperar humildemente. Nada mais pode ser feito. Mas devemos admitir que em 2018 não houve problemas, tudo está claro.

E na descarga completa para 2015, está um xml quebrado, que nunca será corrigido. O Serviço Tributário Federal disse que sabia, mas não pretendia consertá-lo: faça, dizem eles, as seguintes atualizações.

As atualizações aparecem em pastas com datas passadas longas


Situação: você baixou o livro de referência completo no início de 2018, aplicou todas as atualizações e baixou atualizações diariamente. Você é relaxado e sereno, porque você sabe: em seu banco de dados os dados mais relevantes sobre pessoas jurídicas.

Mas você ainda perdeu um fato: ontem à noite, o Federal Tax Service não apenas lançou a próxima atualização, mas também colocou novos arquivos em uma pasta há três meses. Tudo bem, sua base está desatualizada.

As atualizações retroativas vêm em dois tipos:

  • Alterar arquivos existentes
  • adicione novos.

Para remover algo, não vimos.

Estamos lutando com tudo isso aqui. Nosso diretório local contém a fatia de dados atual do servidor FTS - o padrão. Todas as noites baixamos absolutamente todos os arquivos do servidor de registro e comparamos com o padrão.

Encontramos os novos arquivos claramente como: eles simplesmente não existem no diretório local. Se o arquivo foi, mas as datas de sua alteração na referência e nos novos bancos de dados forem diferentes, compare as somas de verificação. Quando forem diferentes, pegue um novo xml-ku e aplique a atualização.

Mas há uma nuance! Às vezes, informações irrelevantes chegam retroativamente à atualização e não podem ser aplicadas. Agora, haverá um exemplo um pouco confuso, observe suas mãos.

Suponha que, em 21 de maio, tenha sido lançada uma atualização para o LLC Romashka. Encontra-se na pasta 21/06/2018 . E em 22 de maio, o Federal Tax Service colocou um arquivo no diretório em 20/06/2018 , também tinha algo sobre "Daisy". Isso é algo que não vamos tocar. Embora o novo arquivo seja recente, seu conteúdo é irrelevante devido à atualização de 21 de maio.

Registros desaparecem entre anos


Parece que, se você pegar o arquivo 01/01 / 2015_FULL e posteriormente lançar todas as atualizações para 2015, obterá dados de 01/01 / 2016_FULL. E não!

A situação usual do nosso mundo imperfeito:

  1. Todo o ano de 2016 no cadastro não há nada sobre a empresa. Nem no arquivo completo no começo do ano, nem nas atualizações.
  2. Em 01.01.2017_FULL, a empresa aparece de repente e vive em silêncio o ano todo.
  3. E então bam - em 01/01/ 01_FULL não há mais empresa. Com alguma sorte, ela virá mais tarde em uma das atualizações, mas não um fato.

Cerca de 1000 entidades legais desaparecem de ano para ano.


Esta maravilhosa LLC foi publicada no Registro Unificado de Pessoas Jurídicas apenas uma vez: na atualização de 21/02/2017. Não há empresa em nenhum outro lugar, nem em uma descarga completa

Portanto, não funcionará para realizar uma descarga completa no início do ano e aplicar todas as atualizações até hoje. Por favor, comece em 2015, caso contrário, seu registro ficará incompleto.

Xsd muda de repente


Algumas vezes desde 2015, o Federal Tax Service mudou repentinamente o xsd. É assim: chega uma atualização, você tenta analisá-la de acordo com o formato antigo, mas nada funciona. Revigora!

Adaptar-se ao novo xsd é, em geral, uma coisa cotidiana. O problema é que ninguém está alertando sobre mudanças. Acrobacias - publique um anúncio em uma seção arbitrária no site do Federal Tax Service, mas geralmente não é. Você aprenderá sobre tudo sobre o fato.

Não está claro como identificar afiliados.


Como eu disse em um artigo anterior, filiais no USRLE não são registros separados, são atributos de entidades legais. Por lei, filiais e escritórios de representação não podem existir por si mesmos, e é por isso que eles são armazenados nos registros da empresa principal.

Mas nossos clientes têm suas próprias necessidades: prestam serviços a agências de outras empresas, assinam documentos comuns com elas e mantêm agências em seus sistemas de contabilidade como entidades separadas. Por esse motivo, transformaremos filiais e escritórios de representação do USRLE em cartões separados e vincularemos ao registro mestre.

Os cartões de afiliados criados precisam ser identificados. A estrutura USRLE fornece PPC, um nome abreviado, nome completo e até mesmo o nome em latim. Mas, para torná-lo mais divertido, é garantido que o Serviço de Impostos Federais preencha apenas o endereço. Como mostrar ramificações, não para exibir endereços.


Um exemplo típico: as filiais na descarga não têm nada além de um endereço

Primeiro, ainda olhamos para o campo com um nome abreviado: de repente, algo está lá. Em 50% dos casos, o campo realmente não está vazio, mas mesmo assim é muito cedo para se alegrar: o nome pode ser o mesmo para todas as filiais de uma entidade legal. Como identificador, isso não é mais útil que um campo vazio.

Se o nome do ramo estiver vazio ou não exclusivo, nós o criaremos.

Por exemplo, usaremos a mesma LLC "Camomila". Possui três ramificações com nomes vazios e esses endereços:

  • Moscou, Lane Turchaninov;
  • Moscou, aterro de Ozerkovskaya;
  • São Petersburgo, Nevsky Prospect.

Pegamos os dados da empresa e os transformamos em um identificador de nome saudável da filial.

  1. Adicione a palavra "Filial" ou "Divisão" ao nome, atributos diferentes foram fornecidos para eles no Registro Estadual Unificado de Pessoas Jurídicas.
  2. Inclua no nome o nome abreviado da organização principal. Agora, temos três nomes idênticos: "Filial da LLC Romashka".
  3. Pegamos os endereços das ramificações e, entre parênteses, adicionamos aos nomes as diferentes partes dos endereços.

    Atribuímos o endereço a uma parte única: para os dois primeiros ramos de "Margaridas", este é o endereço completo e para o terceiro - apenas "São Petersburgo". Se todas as cidades fossem diferentes, elas adicionariam apenas cidades aos nomes das filiais.

No nosso exemplo, os ramos serão os seguintes:

  • “Filial da LLC Romashka (Moscou, Turchaninov Lane)”;
  • "Filial da LLC Romashka (Moscou, aterro de Ozerkovskaya)";
  • "Filial da LLC Romashka (São Petersburgo)."

Sim, se a ramificação no USRLE tiver um nome, mas não exclusivo, pularemos as duas primeiras etapas. Nós adicionamos a parte do endereço a esse nome não exclusivo.

Nós levamos o endereço do nome ao máximo para a rua, porque o inferno começa com a parte da casa como “dmvld 3, building 5, room 14/51, de. 145. " É difícil desmontar, mas como parte do nome do ramo, parece ridículo. Portanto, unimos filiais localizadas na mesma rua. Existem até ramos diferentes no mesmo prédio! Felizmente, existem poucos.

Basta pegar e conectar o registro não funciona


Além desses problemas, o Registro Unificado de Pessoas Jurídicas do Estado está cheio de erros no nível de símbolos, endereços e outras ninharias. Por exemplo, quando em vez de "LLC" você encontra três zeros no diretório, isso nem é surpreendente.

Também existem endereços com erros, onde sem eles. Por exemplo, "Leningrado" em vez de "São Petersburgo" é um caso muito significativo. Uma opção mais mundana: o endereço da organização Zheleznodorozhny na região de Moscou é indicado como uma cidade, embora tenha sido um distrito de Balashikha por vários anos.

De fato, tudo é verdade no diretório, porque o USRLE armazena os detalhes dos documentos constituintes da organização. Mas, para trabalhar com o banco de dados, para pesquisá-lo, os dados devem ser trazidos à realidade. Nossos usuários procuram organizações localizadas em São Petersburgo, e nenhuma vez registradas em Leningrado.

Portanto, abrir o Registro Estadual Unificado de Pessoas Jurídicas e obter uma base adequada para operação industrial é outra tarefa. Deixe-me lembrá-lo dos volumes: se você pegar o livro de referência completo no início de 2015 e todas as atualizações até hoje, receberá 100 milhões de entradas.

Para analisar o USRLE, escrevemos um algoritmo: ele recebe todas as entradas na entrada desde 2015 e na saída fornece 10 milhões de entradas relevantes. Gerencia em algum lugar em uma hora. Uma parte importante do processo é nosso produto de Cliente Único . Ele arruma os dados: limpa endereços, encontra duplicatas, corrige erros de digitação.

Se você gosta de analisar livros de referência complexos, estruturar dados e trazê-los para uma forma humana, venha trabalhar conosco. Agora, estamos procurando um javista, salário - 195.000-250.000 , 000 antes da dedução, detalhes - em hh.ru. E você também precisa de um controle de qualidade: de 115.000 a 150.000 ₽, detalhes no mesmo hh .

Source: https://habr.com/ru/post/pt414885/


All Articles