Sie sammelten fĂŒr alle "Habrom" das Nachschlagewerk "Von wem es ausgestellt wurde ..." fĂŒr PĂ€sse. Auf Gesundheit herunterladen



Vor ein paar Monaten haben wir experimentiert: Wird es möglich sein, in Habr ein geeignetes Verzeichnis von Einheiten zu sammeln, die russische PĂ€sse ausstellen ? Die Sache ist nĂŒtzlich: Viele Menschen brauchen diese Daten, es gibt keine kanonische Quelle und die vorhandenen sind sehr mittelmĂ€ĂŸig.

Und du weißt, alles hat geklappt. Das verwendbare Verzeichnis ist fertig, Sie können es herunterladen und verwenden. Außerdem haben wir Tipps gegeben, die die Eingabe von Einheiten in elektronische Formulare beschleunigen.

"Naked" CSV - gemeinfrei


Die kompilierte und bereinigte Referenz haben wir auf GitHub gepostet. Im Inneren ist alles einfach, CSV mit zwei Feldern:

  • Abteilungscode;
  • GerĂ€tename.

Liegt hier github.com/hflabs/fms-unit/releases/latest .

Es gibt auch vorgefertigte Tipps fĂŒr Eingabeformulare (außerdem kostenlos)


Wir haben Einheiten gesammelt, um einen vorgefertigten Service zu bieten - Tipps fĂŒr Eingabeformulare. Und hier sind sie bereit.

„Tipps“ DaData.ru kann in die Site, das CRM oder das CMS integriert werden und als fĂŒrsorglicher Mitarbeiter betrachtet werden: Der Benutzer muss nur den GerĂ€tecode eingeben, und der Name fĂŒllt den Service aus.


Jeder scheint es zu hassen, den Namen der Einheit auszufĂŒllen. Wir haben versucht, das Leiden der Menschen zu lindern.

Sogar "Tipps" ziehen die Region und den GerÀtetyp aus dem Code, manchmal bequem. Hier ist eine kurze Beschreibung der Antwort.
TitelBeschreibung
WertEinzeiliger Wert (wie in der Eingabeaufforderungsliste angezeigt)
data.codeGerÀtecode
data.nameDer Name der Einheit im Instrumentenkoffer ("Wer hat sie ausgestellt?")
data.region_codeRegionalcode
DatentypArt der Einheit:

  • 0 - FMS-Einheit;
  • 1 - GUVD oder das Innenministerium der Region;
  • 2 - ATC oder ATS Bezirk oder Stadt;
  • 3 - Polizeistation.
Wir geben tĂ€glich bis zu 10.000 Anfragen zu „Tipps“ kostenlos, dies sind 300 ausgefĂŒllte Formulare. Mehr - im Rahmen eines Abonnements ab 5 000 ₜ pro Jahr. Es funktioniert ĂŒber jQuery-Plugin, API oder Komponenten fĂŒr verschiedene CRM, CMS, "1C" und mehr.

Details finden Sie unter dadata.ru/suggestions/outward/fms_unit/ .

"Habr" hat viel mit Daten geholfen


Die erste Frage derer, die von dem Projekt hören: "Wirklich, haben Sie es durch Habr gesammelt?" Nicht nur "Habr" hat geholfen, auch der Beitrag der StraßenhĂ€ndler ist großartig und umfangreich. Wir sind dankbar und ein wenig ĂŒberrascht: Das erste Mal, als wir uns an die Community wandten, und sofort ein solches Ergebnis.

Anfangs hatten wir einige Entwicklungen. Aber erstens weit entfernt von einer vollstĂ€ndigen Referenz. Zweitens wollte ich ĂŒberprĂŒfen, wie angemessen die Daten fĂŒr echte PĂ€sse sind.

Viele schickten Einheiten aus ihren PĂ€ssen durch das Sammelformular, als wir einen Schrei warfen. Sie schickten jeweils ein und fĂŒnf bis zehn Aufzeichnungen. Helden, die nicht zu faul sind, um all dies mit ihren HĂ€nden zu fahren - Respekt.

Drei Personen in einer persönlichen Datenbank von respektabler GrĂ¶ĂŸe angeboten. Freundlich und kostenlos.


Sicherheitsbedenken: Alle Verzeichnisse wurden anonym gesendet, kein Byte personenbezogener Daten

Solche Gaben haben die Dinge erheblich vorangebracht. Infolgedessen haben wir nach drei Wochen das Volumen gesammelt, aus dem es keine Schande ist, ein Produkt fĂŒr den industriellen Einsatz geeignet zu machen.

Der Weg zum Erfolg - „Eine Menge Rohdaten + 300 Regekspov + ein wenig Pitonochki“


Die Rohdaten liegen also in den HĂ€nden des Lebensmittelprodukts Dadata Nalgeon. Er beschrieb weitere TĂ€nze mit einem Zitat aus der Überschrift. Alles, was wir gesammelt haben, hat eine Reihe wundervoller Transformationen durchlaufen.

Normalisieren Sie zunĂ€chst die Namen der Einheiten. Hier musste ich leidenschaftlich mit einer Datei arbeiten. In den "lebenden" PĂ€ssen sind beispielsweise die Nummern der Gebietseinheiten mit "Nr." Angegeben: "TP Nr. 1 in G. Khimki ...". Das gleiche gilt fĂŒr die meisten gesammelten Verzeichnisse, bis auf eines - es enthĂ€lt alle Nummern ohne "Nein": "TP 1 in G. Khimki ...". Ich musste einbetten.

Die Jahre brachen zusammen. In mehreren Verzeichnissen werden die Namen von Einheiten nach Jahr „verwischt“, auch wenn sie sich nicht mit der Zeit Ă€ndern.

500-168, . . ,2007
500-168, . . ,2008
500-168, . . ,2009
500-168, . . ,2010

Wir haben diese DatensĂ€tze kombiniert und an einen Punkt gebunden: Im obigen Beispiel haben wir von vier DatensĂ€tzen einen mit dem Datum „2007-2010“ erhalten.

Wir haben ein weiteres Nachschlagewerk gesammelt - „2018+“. 2018 kam es zu einem Staatsstreich - jetzt steht der Name der „obersten“ Abteilung des Innenministeriums in der Region nicht mehr in den PĂ€ssen. In einem im Gebiet Krasnojarsk herausgegebenen Dokument wird daher unabhĂ€ngig vom Kodex „GU des russischen Innenministeriums im gesamten Gebiet Krasnojarsk“ angegeben.

Wir haben alle gesammelten Codes, unterteilt nach Regionen, verwendet und im Stil von 2018 dieselben Namen fĂŒr sie generiert. Die Namen wurden aus den gesammelten Verzeichnissen ĂŒbernommen, etwas musste im Internet gesucht werden. Es stellte sich so etwas heraus.

240-001, ,2018
240-002, ,2018
240-003, ,2018


Die Jahre wurden entfernt. Es stellte sich heraus, dass die Verzeichnisse ein perfektes Durcheinander aufwiesen: Irgendwo gibt es Jahre, irgendwo nicht. Es bleibt entweder ĂŒberall, die Jahre fĂŒr eine vollstĂ€ndigere Bezugnahme zu entfernen, oder nur Einheiten ĂŒber die Jahre zu lassen, um nicht klar zu sein, was. WĂ€hlen Sie eine vollstĂ€ndigere Referenz.

Die Verzeichnisse wurden kombiniert , die Daten in Ecstasy zusammengefĂŒhrt. Sie rieben das Ergebnis grĂŒndlich mit einem Lappen ab, kĂ€mmten es und erinnerten es daran: Zum Beispiel wurde „RA“, wo nötig, in die „Republik Altai“ umgewandelt, und ein Dutzend solcher Änderungen wurden vorgenommen.

Und jetzt ist der Leitfaden fertig. Verwenden Sie es, Sie haben es fĂŒr sich selbst getan (tatsĂ€chlich haben Sie es fĂŒr sich selbst getan :).

Ein paar Feinheiten fĂŒr Ă€tzend


Es gibt viele EintrÀge im Verzeichnis mit denselben Einheitencodes. Dies liegt an der Tatsache, dass in verschiedenen Jahren in den PÀssen die Schreibweise derselben Einheit unterschiedlich war. Wir haben Àhnliche Optionen kombiniert, aber sehr unterschiedliche gelassen: Lassen Sie den Benutzer auswÀhlen, wie er sie im Dokument hat.

Es kann sich herausstellen, dass Ihr Reisepass und Ihr Verzeichnis etwas anders geschrieben sind. Ohne minimale Normalisierung hĂ€tte jede Einheit so viele Ă€hnliche Optionen, dass Sie die richtige finden könnten. Aus diesem Grund haben wir die "ABTEILUNG FÜR INTERNE ANGELEGENHEITEN" auf "ATC", "CITIES" und "MOUNTAIN" reduziert. - an „G.“, „ABTEILUNG FÜR PASS UND VISA-DIENST“ - an „OPVS“ usw.


Wenn Sie einen Namen eingeben, tragen auch "Tipps" dazu bei

Aber! Kein Gesetz oder Gesetz schreibt vor, dass der Name der Einheit in den Dokumenten Buchstabe fĂŒr Buchstabe mit der Option im Reisepass ĂŒbereinstimmt. AbkĂŒrzungen und Auslassungen sind zulĂ€ssig. Die Hauptsache ist, dass die anderen Details ungefĂ€hr gleich und gleich sind: Serie, Nummer, Datum, Einheitencode.

Fehler können uns dadata.ru/fix/fms gemeldet werden. Geben Sie den Code und den Namen des Problemdatensatzes an und schreiben Sie in den Kommentar, was falsch ist. Korrigieren und erstellen Sie einen aktualisierten Leitfaden fĂŒr alle. Oder senden Sie Pool-Anfragen an GitHub.

NatĂŒrlich können Sie CSV mit Ihren HĂ€nden korrigieren, wenn Sie ein Handbuch ohne "Tipps" haben. Es ist jedoch nicht klar, wie alles zum Stillstand kommen wird, wenn Sie uns jemals die nĂ€chste Version des Verzeichnisses abnehmen.

Verwenden Sie im Allgemeinen Ihre Gesundheit:


Wenn Sie den Artikel teilen, helfen Sie Personen, die nach einem Verzeichnis von Einheiten aus PĂ€ssen suchen. Leidende werden dankbar sein.

Source: https://habr.com/ru/post/de448504/


All Articles