
Vor ein paar Monaten haben wir experimentiert: Wird es möglich sein, in Habr
ein geeignetes Verzeichnis von Einheiten zu
sammeln, die russische PĂ€sse ausstellen ? Die Sache ist nĂŒtzlich: Viele Menschen brauchen diese Daten, es gibt keine kanonische Quelle und die vorhandenen sind sehr mittelmĂ€Ăig.
Und du weiĂt, alles hat geklappt. Das verwendbare Verzeichnis ist fertig, Sie können es herunterladen und verwenden. AuĂerdem haben wir Tipps gegeben, die die Eingabe von Einheiten in elektronische Formulare beschleunigen.
"Naked" CSV - gemeinfrei
Die kompilierte und bereinigte Referenz haben wir auf GitHub gepostet. Im Inneren ist alles einfach, CSV mit zwei Feldern:
- Abteilungscode;
- GerÀtename.
Liegt hier
github.com/hflabs/fms-unit/releases/latest .
Es gibt auch vorgefertigte Tipps fĂŒr Eingabeformulare (auĂerdem kostenlos)
Wir haben Einheiten gesammelt, um einen vorgefertigten Service zu bieten - Tipps fĂŒr Eingabeformulare. Und hier sind sie bereit.
âTippsâ DaData.ru kann in die Site, das CRM oder das CMS integriert werden und als fĂŒrsorglicher Mitarbeiter betrachtet werden: Der Benutzer muss nur den GerĂ€tecode eingeben, und der Name fĂŒllt den Service aus.
Jeder scheint es zu hassen, den Namen der Einheit auszufĂŒllen. Wir haben versucht, das Leiden der Menschen zu lindern.Sogar "Tipps" ziehen die Region und den GerĂ€tetyp aus dem Code, manchmal bequem. Hier ist eine kurze Beschreibung der Antwort.
Wir geben tĂ€glich bis zu 10.000 Anfragen zu âTippsâ kostenlos, dies sind 300 ausgefĂŒllte Formulare. Mehr - im Rahmen eines Abonnements ab 5 000 ✠pro Jahr. Es funktioniert ĂŒber jQuery-Plugin, API oder Komponenten fĂŒr verschiedene CRM, CMS, "1C" und mehr.
Details finden Sie unter
dadata.ru/suggestions/outward/fms_unit/ .
"Habr" hat viel mit Daten geholfen
Die erste Frage derer, die von dem Projekt hören: "Wirklich, haben Sie es durch Habr gesammelt?" Nicht nur "Habr" hat geholfen, auch der Beitrag der StraĂenhĂ€ndler ist groĂartig und umfangreich. Wir sind dankbar und ein wenig ĂŒberrascht: Das erste Mal, als wir uns an die Community wandten, und sofort ein solches Ergebnis.
Anfangs hatten wir einige Entwicklungen. Aber erstens weit entfernt von einer vollstĂ€ndigen Referenz. Zweitens wollte ich ĂŒberprĂŒfen, wie angemessen die Daten fĂŒr echte PĂ€sse sind.
Viele schickten Einheiten aus ihren PĂ€ssen durch das Sammelformular, als wir einen Schrei warfen. Sie schickten jeweils ein und fĂŒnf bis zehn Aufzeichnungen. Helden, die nicht zu faul sind, um all dies mit ihren HĂ€nden zu fahren - Respekt.
Drei Personen in einer persönlichen Datenbank von respektabler GröĂe angeboten. Freundlich und kostenlos.
Sicherheitsbedenken: Alle Verzeichnisse wurden anonym gesendet, kein Byte personenbezogener DatenSolche Gaben haben die Dinge erheblich vorangebracht. Infolgedessen haben wir nach drei Wochen das Volumen gesammelt, aus dem es keine Schande ist, ein Produkt fĂŒr den industriellen Einsatz geeignet zu machen.
Der Weg zum Erfolg - âEine Menge Rohdaten + 300 Regekspov + ein wenig Pitonochkiâ
Die Rohdaten liegen also in den HĂ€nden des Lebensmittelprodukts Dadata Nalgeon. Er beschrieb weitere TĂ€nze mit einem Zitat aus der Ăberschrift. Alles, was wir gesammelt haben, hat eine Reihe wundervoller Transformationen durchlaufen.
Normalisieren Sie zunĂ€chst die Namen der Einheiten. Hier musste ich leidenschaftlich mit einer Datei arbeiten. In den "lebenden" PĂ€ssen sind beispielsweise die Nummern der Gebietseinheiten mit "Nr." Angegeben: "TP Nr. 1 in G. Khimki ...". Das gleiche gilt fĂŒr die meisten gesammelten Verzeichnisse, bis auf eines - es enthĂ€lt alle Nummern ohne "Nein": "TP 1 in G. Khimki ...". Ich musste einbetten.
Die Jahre brachen zusammen. In mehreren Verzeichnissen werden die Namen von Einheiten nach Jahr âverwischtâ, auch wenn sie sich nicht mit der Zeit Ă€ndern.
500-168, . . ,2007
500-168, . . ,2008
500-168, . . ,2009
500-168, . . ,2010
Wir haben diese DatensĂ€tze kombiniert und an einen Punkt gebunden: Im obigen Beispiel haben wir von vier DatensĂ€tzen einen mit dem Datum â2007-2010â erhalten.
Wir haben ein weiteres Nachschlagewerk gesammelt - â2018+â. 2018 kam es zu einem Staatsstreich - jetzt steht der Name der âoberstenâ Abteilung des Innenministeriums in der Region nicht mehr in den PĂ€ssen. In einem im Gebiet Krasnojarsk herausgegebenen Dokument wird daher unabhĂ€ngig vom Kodex âGU des russischen Innenministeriums im gesamten Gebiet Krasnojarskâ angegeben.
Wir haben alle gesammelten Codes, unterteilt nach Regionen, verwendet und im Stil von 2018 dieselben Namen fĂŒr sie generiert. Die Namen wurden aus den gesammelten Verzeichnissen ĂŒbernommen, etwas musste im Internet gesucht werden. Es stellte sich so etwas heraus.
240-001, ,2018
240-002, ,2018
240-003, ,2018
Die Jahre wurden entfernt. Es stellte sich heraus, dass die Verzeichnisse ein perfektes Durcheinander aufwiesen: Irgendwo gibt es Jahre, irgendwo nicht. Es bleibt entweder ĂŒberall, die Jahre fĂŒr eine vollstĂ€ndigere Bezugnahme zu entfernen, oder nur Einheiten ĂŒber die Jahre zu lassen, um nicht klar zu sein, was. WĂ€hlen Sie eine vollstĂ€ndigere Referenz.
Die Verzeichnisse wurden kombiniert , die Daten in Ecstasy zusammengefĂŒhrt. Sie rieben das Ergebnis grĂŒndlich mit einem Lappen ab, kĂ€mmten es und erinnerten es daran: Zum Beispiel wurde âRAâ, wo nötig, in die âRepublik Altaiâ umgewandelt, und ein Dutzend solcher Ănderungen wurden vorgenommen.
Und jetzt ist der Leitfaden fertig. Verwenden Sie es, Sie haben es fĂŒr sich selbst getan (tatsĂ€chlich haben Sie es fĂŒr sich selbst getan :).
Ein paar Feinheiten fĂŒr Ă€tzend
Es gibt viele EintrÀge im Verzeichnis mit denselben Einheitencodes. Dies liegt an der Tatsache, dass in verschiedenen Jahren in den PÀssen die Schreibweise derselben Einheit unterschiedlich war. Wir haben Àhnliche Optionen kombiniert, aber sehr unterschiedliche gelassen: Lassen Sie den Benutzer auswÀhlen, wie er sie im Dokument hat.
Es kann sich herausstellen, dass Ihr Reisepass und Ihr Verzeichnis etwas anders geschrieben sind. Ohne minimale Normalisierung hĂ€tte jede Einheit so viele Ă€hnliche Optionen, dass Sie die richtige finden könnten. Aus diesem Grund haben wir die "ABTEILUNG FĂR INTERNE ANGELEGENHEITEN" auf "ATC", "CITIES" und "MOUNTAIN" reduziert. - an âG.â, âABTEILUNG FĂR PASS UND VISA-DIENSTâ - an âOPVSâ usw.
Wenn Sie einen Namen eingeben, tragen auch "Tipps" dazu beiAber! Kein Gesetz oder Gesetz schreibt vor, dass der Name der Einheit in den Dokumenten Buchstabe fĂŒr Buchstabe mit der Option im Reisepass ĂŒbereinstimmt. AbkĂŒrzungen und Auslassungen sind zulĂ€ssig. Die Hauptsache ist, dass die anderen Details ungefĂ€hr gleich und gleich sind: Serie, Nummer, Datum, Einheitencode.
Fehler können uns dadata.ru/fix/fms gemeldet werden. Geben Sie den Code und den Namen des Problemdatensatzes an und schreiben Sie in den Kommentar, was falsch ist. Korrigieren und erstellen Sie einen aktualisierten Leitfaden fĂŒr alle. Oder senden Sie Pool-Anfragen an GitHub.
NatĂŒrlich können Sie CSV mit Ihren HĂ€nden korrigieren, wenn Sie ein Handbuch ohne "Tipps" haben. Es ist jedoch nicht klar, wie alles zum Stillstand kommen wird, wenn Sie uns jemals die nĂ€chste Version des Verzeichnisses abnehmen.
Verwenden Sie im Allgemeinen Ihre Gesundheit:
Wenn Sie den Artikel teilen, helfen Sie Personen, die nach einem Verzeichnis von Einheiten aus PĂ€ssen suchen. Leidende werden dankbar sein.