
Há alguns meses, experimentamos: será possível
coletar um diretório adequado de unidades que emitem passaportes russos em Habr? A coisa é útil: muitas pessoas precisam desses dados, não há fonte canônica e as existentes são muito mais ou menos.
E você sabe, tudo deu certo. O diretório utilizável está pronto, você pode baixar e usar. E também fizemos dicas que aceleram a entrada de unidades em formulários eletrônicos.
CSV "Naked" - em domínio público
A referência compilada e limpa que postamos no GitHub. No interior, tudo é simples, CSV com dois campos:
- código do departamento;
- nome da unidade.
Encontra-se aqui
github.com/hflabs/fms-unit/releases/latest .
Também existem dicas prontas para formulários de entrada (além disso, grátis)
Reunimos unidades para fazer um serviço pronto - dicas para formulários de entrada. E aqui estão eles prontos.
“Dicas” O DaData.ru pode ser integrado ao site, CRM ou CMS e passar para um colega atencioso: o usuário só precisa digitar o código da unidade e o nome preencherá o serviço.
Todo mundo parece odiar preencher o nome da unidade. Tentamos aliviar o sofrimento das pessoas.Até as "Dicas" extraem a região e o tipo de unidade do código, às vezes de maneira conveniente. Aqui está uma breve especificação da resposta.
Damos até 10.000 consultas gratuitamente a "Dicas" por dia, ou seja, ≈300 formulários preenchidos. Mais - como parte de uma assinatura, a partir de 5 000 ₽ por ano. Ele funciona através do jQuery-plugin, API ou componentes para diferentes CRM, CMS, "1C" e muito mais.
Os detalhes estão em
dadata.ru/suggestions/outward/fms_unit/ .
"Habr" ajudou muito com os dados
A primeira pergunta de quem ouve sobre o projeto: "Realmente, através do Habr, você o coletou?" Não apenas "Habr" ajudou, mas a contribuição dos vendedores ambulantes é grande e extensa. Somos gratos e um pouco surpresos: a primeira vez que nos voltamos para a comunidade, e imediatamente esse resultado.
Inicialmente, tivemos alguns desenvolvimentos. Mas, em primeiro lugar, longe de ser uma referência completa. Em segundo lugar, eu queria verificar se os dados são adequados para passaportes reais.
Muitos enviaram unidades de seus passaportes através do formulário de coleta quando lançamos um grito. Eles enviaram um e cinco a dez registros cada. Heróis que não têm preguiça de dirigir tudo isso com as mãos - respeito.
Três pessoas oferecidas em um banco de dados pessoal de tamanho respeitável. Amigável e gratuito.
Aqueles que estão preocupados com a segurança: todos os diretórios foram enviados anonimamente, não um byte de dados pessoaisTais presentes levaram as coisas significativamente adiante. Como resultado, após três semanas, coletamos o volume do qual não é uma vergonha fabricar um produto adequado para uso industrial.
O caminho para o sucesso - "Um monte de dados brutos + 300 regekspov + um pouco de pitonochki"
Portanto, os dados brutos estão nas mãos do produto alimentar Dadata nalgeon. Ele descreveu outras danças com uma citação da manchete. Tudo o que reunimos passou por uma série de transformações maravilhosas.
Para começar, normalizei os nomes das unidades. Aqui eu tive que trabalhar fervorosamente com um arquivo. Por exemplo, nos passaportes "ao vivo", os números das unidades territoriais são indicados com "Não": "TP No. 1 em G. Khimki ..." O mesmo ocorre na maioria dos diretórios coletados, exceto um - contém todos os números sem um "Não": "TP 1 em G. Khimki ...". Eu tive que incorporar.
Os anos entraram em colapso. Em vários diretórios, os nomes das unidades são "borrados" por ano, mesmo quando não mudam com o tempo.
500-168, . . ,2007
500-168, . . ,2008
500-168, . . ,2009
500-168, . . ,2010
Combinamos esses registros, vinculando-os a um período: no exemplo acima, de quatro registros, obtivemos um com datas "2007-2010".
Coletamos outro livro de referência - “2018+”. Em 2018, ocorreu um golpe - agora o nome do departamento "supremo" do Ministério da Administração Interna da região não está escrito nos passaportes. Portanto, em um documento emitido no território de Krasnoyarsk, independentemente do código, eles indicam "GU do Ministério de Assuntos Internos da Rússia em todo o território de Krasnoyarsk".
Pegamos todos os códigos coletados, divididos por regiões e geramos os mesmos nomes para eles no estilo de 2018. Os nomes foram retirados dos diretórios coletados, algo teve que ser pesquisado na Internet. Aconteceu algo assim.
240-001, ,2018
240-002, ,2018
240-003, ,2018
Os anos foram removidos. Aconteceu que havia uma bagunça perfeita nos diretórios: em algum lugar, há anos, em algum lugar não. Permanece em todo lugar remover os anos para uma referência mais completa ou deixar apenas unidades ao longo dos anos por causa disso, não está claro o que. Escolha uma referência mais completa.
Os diretórios foram combinados , os dados em êxtase fundidos. Eles esfregaram o resultado minuciosamente com um pano, pentearam e lembraram: por exemplo, “RA”, quando necessário, foi transformado em “República Altai” e mais uma dúzia dessas alterações foram feitas.
E agora, o guia está pronto. Use, você fez por si mesmo (de fato, você fez por si mesmo :).
Algumas sutilezas para corrosão
Existem muitas entradas no diretório com os mesmos códigos de unidade. Isso se deve ao fato de que em diferentes anos nos passaportes a ortografia da mesma unidade era diferente. Combinamos opções semelhantes, mas deixamos opções muito diferentes: deixe o usuário escolher como ele a possui no documento.
Pode acontecer que o seu passaporte e diretório sejam escritos de maneira um pouco diferente. Sem normalização mínima, cada unidade teria tantas opções semelhantes que você poderia encontrar a correta. Portanto, reduzimos o "DEPARTAMENTO DE ASSUNTOS INTERNOS" para "ATC", "CIDADES" e "MONTANHA". - para “G.”, “DEPARTAMENTO DE PASSAPORTE E SERVIÇO DE VISTO” - para “OPVS”, etc.
Se você começar a digitar um nome, "Dicas" também contribuiráMas! Nenhuma lei ou estatuto exige que o nome da unidade nos documentos letra por letra coincida com a opção no passaporte. Abreviações e omissões são permitidas. O principal é que os outros detalhes sejam aproximadamente semelhantes e iguais: a série, número, data, código da unidade.
Os erros podem ser relatados para nós dadata.ru/fix/fms . Indique o código e o nome do registro do problema e escreva no comentário o que está errado. Corrija e estabeleça um guia atualizado para todos. Ou envie solicitações de pool para o GitHub.
Naturalmente, você pode corrigir o CSV com as mãos se tiver um manual simples sem "Dicas". Mas não está claro como tudo vai parar se você pegar a próxima versão do diretório conosco.
Em geral, use sua saúde:
Se você compartilhar o artigo, ajude as pessoas que estão procurando um diretório de unidades de passaportes. Sofrendo o suficiente, eles serão gratos.