Recogieron para todos "Habrom" el libro de referencia "Por quién fue emitido ..." para pasaportes. Descargar a la salud



Desde hace un par de meses, experimentamos: ¿será posible recopilar un directorio adecuado de unidades que emitan pasaportes rusos en Habr? La cosa es útil: muchas personas necesitan estos datos, no hay una fuente canónica, y las existentes son muy regulares.

Y sabes, todo salió bien. El directorio utilizable está listo, puede descargarlo y usarlo. Y también hicimos consejos que aceleran la entrada de unidades en formularios electrónicos.

CSV "desnudo" - en el dominio público


La referencia compilada y limpia que publicamos en GitHub. En el interior, todo es simple, CSV con dos campos:

  • código de departamento;
  • nombre de la unidad

Aquí se encuentra github.com/hflabs/fms-unit/releases/latest .

También hay consejos listos para los formularios de entrada (además, gratis)


Reunimos unidades para hacer un servicio listo para usar: consejos para formularios de entrada. Y aquí están listos.

"Consejos" DaData.ru puede integrarse en el sitio, CRM o CMS y considerarse un compañero atento: el usuario solo necesita ingresar el código de la unidad y el nombre completará el servicio.


Todo el mundo parece odiar completar el nombre de la unidad. Intentamos aliviar el sufrimiento de las personas.

Incluso los "Consejos" extraen la región y el tipo de unidad del código, a veces convenientemente. Aquí hay una breve especificación de la respuesta.
TituloDescripción
valorValor de línea única (como se muestra en la lista de solicitudes)
data.codeCódigo de unidad
data.nameEl nombre de la unidad en el caso instrumental ("¿quién lo emitió?")
data.region_codeCódigo de región
data.typeTipo de unidad:

  • 0 - unidad FMS;
  • 1 - GUVD o el Ministerio del Interior de la región;
  • 2 - Distrito o ciudad ATC o ATS;
  • 3 - estación de policía.
Damos hasta 10,000 consultas a "Consejos" al día de forma gratuita, esto es ≈300 formularios completos. Más: como parte de una suscripción, de 5 000 ₽ por año. Funciona a través de jQuery-plugin, API o componentes para diferentes CRM, CMS, "1C" y más.

Los detalles se encuentran en dadata.ru/suggestions/outward/fms_unit/ .

"Habr" ayudó mucho con los datos


La primera pregunta de aquellos que escuchan sobre el proyecto: "Realmente, a través de Habr, ¿lo has recogido?" No solo "Habr" ayudó, sino que la contribución de los vendedores ambulantes es excelente y extensa. Estamos agradecidos y un poco sorprendidos: la primera vez que recurrimos a la comunidad e inmediatamente ese resultado.

Inicialmente, tuvimos algunos desarrollos. Pero, en primer lugar, lejos de ser una referencia completa. En segundo lugar, quería comprobar qué tan adecuados son los datos para pasaportes reales.

Muchas unidades enviaron desde sus pasaportes a través del formulario de recolección cuando lanzamos un grito. Enviaron uno y cinco o diez registros cada uno. Héroes que no son demasiado flojos para manejar todo esto con sus manos: respeto.

Tres personas ofrecieron en una base de datos personal de tamaño respetable. Amable y gratis.


Aquellos que están preocupados por la seguridad: todos los directorios se enviaron de forma anónima, no un byte de datos personales

Tales obsequios hicieron avanzar significativamente las cosas. Como resultado, después de tres semanas recolectamos el volumen del cual no es una pena hacer un producto adecuado para uso industrial.

El camino hacia el éxito: "Un montón de datos en bruto + 300 regekspov + un poco de pitonochki"


Por lo tanto, los datos en bruto están en manos del producto alimenticio Dadata nalgeon. Describió otras danzas con una cita del titular. Todo lo que hemos recopilado ha pasado por una serie de maravillosas transformaciones.

Para comenzar, normalizó los nombres de las unidades. Aquí tuve que trabajar fervientemente con un archivo. Por ejemplo, en los pasaportes “vivos”, los números de las unidades territoriales se indican con “No.”: “TP No. 1 en G. Khimki ...”. Lo mismo ocurre en la mayoría de los directorios recopilados, excepto uno: contiene todos los números sin un "No": "TP 1 en G. Khimki ...". Tuve que incrustar.

Los años colapsaron. En varios directorios, los nombres de las unidades están "borrosos" por año, incluso cuando no cambian con el tiempo.

500-168, . . ,2007
500-168, . . ,2008
500-168, . . ,2009
500-168, . . ,2010

Combinamos estos registros, vinculándolos a un período: en el ejemplo anterior, de cuatro registros, obtuvimos uno con las fechas "2007-2010".

Recopilamos otro libro de referencia: "2018+". En 2018, ocurrió un golpe de estado: ahora el nombre del departamento "supremo" del Ministerio del Interior de la región no está escrito en los pasaportes. Por lo tanto, en un documento emitido en el territorio de Krasnoyarsk, independientemente del código, indican "GU del Ministerio del Interior de Rusia en todo el territorio de Krasnoyarsk".

Tomamos todos los códigos recopilados, divididos por regiones y generamos los mismos nombres para ellos al estilo de 2018. Los nombres fueron tomados de los directorios recopilados, algo tuvo que buscarse en Internet. Resultó algo así.

240-001, ,2018
240-002, ,2018
240-003, ,2018


Los años fueron eliminados. Resultó que había un desastre perfecto en los directorios: en algún lugar, hay años, en algún lugar no. Queda en todas partes eliminar los años para una referencia más completa, o dejar solo unidades a lo largo de los años por el simple hecho de que no está claro qué. Elija una referencia más completa.

Los directorios se combinaron , los datos en éxtasis se fusionaron. Frotaron el resultado a fondo con un trapo, lo peinaron y lo recordaron: por ejemplo, "RA", donde fue necesario, se convirtió en la "República de Altai" y se hicieron una docena más de tales cambios.

Y ahora, la guía está lista. Úsalo, lo hiciste por ti mismo (de hecho, lo hiciste por ti mismo :).

Un par de sutilezas para corrosivos


Hay muchas entradas en el directorio con los mismos códigos de unidad. Esto se debe al hecho de que en diferentes años en los pasaportes la ortografía de la misma unidad era diferente. Combinamos opciones similares, pero dejamos unas muy diferentes: deje que el usuario elija cómo lo tiene en el documento.

Puede resultar que su pasaporte y directorio estén escritos de manera un poco diferente. Sin una normalización mínima, cada unidad tendría tantas opciones similares que podría encontrar la correcta. Por lo tanto, redujimos el "DEPARTAMENTO DE ASUNTOS INTERNOS" a "ATC", "CIUDADES" y "MONTAÑA". - a "G.", "DEPARTAMENTO DE PASAPORTE Y SERVICIO DE VISA" - a "OPVS", etc.


Si comienza a escribir un nombre, los "Consejos" también contribuirán

Pero! Ninguna ley o reglamento exige que el nombre de la unidad en los documentos letra por letra coincida con la opción en el pasaporte. Se permiten abreviaturas y omisiones. Lo principal es que los otros detalles son aproximadamente similares e iguales: la serie, el número, la fecha, el código de la unidad.

Los errores pueden ser reportados a nosotros dadata.ru/fix/fms . Indique el código y el nombre del registro del problema y escriba en el comentario lo que está mal. Corrija y diseñe una guía actualizada para todos. O envíe solicitudes de grupo a GitHub.

Naturalmente, puede corregir CSV con sus manos si tiene un manual simple sin "Consejos". Pero no está claro cómo se detendrá todo si alguna vez nos quita la próxima versión del directorio.

En general, use su salud:


Si comparte el artículo, ayude a las personas que buscan un directorio de unidades de pasaportes. Los que sufren, estarán agradecidos.

Source: https://habr.com/ru/post/448504/


All Articles