
في الأسبوع الماضي ، نشرنا
مقالًا حول سجل التسجيل - سجل الدولة مع بيانات من 10 ملايين شركة. تتحدث تلك المواد عن الأشياء الأساسية ، لذا من الأفضل البدء بها.
سنكشف هنا عن موضوع غني وخصب - مشاكل سجل الدولة الموحد للكيانات القانونية التي تمنع مطورينا من الشعور بالملل.
ينكسر هيكل Xml بشكل دوري
في عام 2017 ، كل شهرين إلى ثلاثة أشهر ، جلبت التحديثات ملفات XML بتنسيق غير صحيح. هناك مجموعة كاملة: علامات غير معروفة ، علامات مفتوحة ، عدم تطابق نوع البيانات. على سبيل المثال ، في xsd يتم تحديد نوع التاريخ ، ولكن في الواقع هناك سلسلة غير مفهومة.
عندما يحدث هذا ، يبقى الكتابة إلى الدعم الفني والانتظار بتواضع. لا يمكن فعل المزيد. لكن يجب أن نعترف أنه في عام 2018 لم تكن هناك مشاكل ، كل شيء واضح.
وفي التفريغ الكامل لعام 2015 ، يوجد ملف xml مكسور ، والذي لن يتم إصلاحه أبدًا. قالت مصلحة الضرائب الفيدرالية إنها على علم بذلك ، لكنها لم تنوي إصلاحه: خذوا ، كما يقولون ، التحديثات التالية.
تظهر التحديثات في مجلدات التواريخ الماضية الطويلة
الحالة: قمت بتنزيل الكتاب المرجعي الكامل في بداية عام 2018 ، وقمت بتطبيق جميع التحديثات وتحديثات التنزيل يوميًا. أنت مرتاح وهادئ ، لأنك تعرف: في قاعدة البيانات الخاصة بك البيانات الأكثر صلة بالكيانات القانونية.
لكنك ما زلت تفوتك حقيقة واحدة: الليلة الماضية لم تصدر مصلحة الضرائب الفيدرالية التحديث التالي فحسب ، بل وضعت أيضًا ملفات جديدة في مجلد قبل ثلاثة أشهر. حسنًا ، قاعدتك قديمة.
تأتي التحديثات بأثر رجعي في نوعين:
- قم بتغيير الملفات الموجودة
- إضافة أخرى جديدة.
لإزالة شيء ما ، لم نر.
نحن نكافح مع كل هذا هنا. يحتوي دليلنا المحلي على شريحة البيانات الحالية من خادم FTS - المعيار. كل ليلة نقوم بتنزيل جميع الأرشيفات من خادم التسجيل ومقارنتها بالمعيار.
نجد الملفات الجديدة بوضوح كيف: ببساطة لا توجد في الدليل المحلي. إذا كان الملف مختلفًا ، ولكن تختلف تواريخ تغييره في المرجع وقواعد البيانات الجديدة ، فقم بمقارنة المجموع الاختباري. عندما تكون هذه مختلفة ، خذ xml-ku جديد وقم بتطبيق التحديث.
ولكن هناك فارق بسيط! في بعض الأحيان تأتي المعلومات غير ذات الصلة في التحديث بأثر رجعي ، ثم لا يمكن تطبيقها. الآن سيكون هناك مثال مربك قليلاً ، راقب يديك.
لنفترض ، في 21 مايو ، تم إصدار تحديث لـ LLC Romashka. يقع في المجلد
06/21/2018 . وفي 22 مايو ، وضعت مصلحة الضرائب الفيدرالية ملفًا في الدليل بتاريخ
06/20/2018 ، وكان لديها أيضًا شيء حول "ديزي". هذا شيء لن نلمسه. على الرغم من أن الملف الجديد حديث ، إلا أن محتوياته غير ذات صلة بسبب تحديث 21 مايو.
تختفي السجلات بين السنوات
يبدو أنه إذا أخذت الأرشيف 01/01 / 2015_FULL وقمت بعد ذلك بتدوين جميع التحديثات لعام 2015 ، فستحصل على بيانات من 01/01/2016/2016. ولا!
الوضع المعتاد من عالمنا الناقص:
- كل عام 2016 في السجل لا يوجد شيء عن الشركة. لا في الأرشيف الكامل في بداية العام ولا في التحديثات.
- في 01.01.2017_FULL ، ظهرت الشركة فجأة وتعيش بهدوء طوال العام.
- ثم بم - يوم 01/01/ 2018_FULL لا توجد شركة مرة أخرى. مع أي حظ ، ستأتي لاحقًا في أحد التحديثات ، ولكن ليس حقيقة على الإطلاق.
يختفي حوالي 1000 كيان قانوني من سنة إلى أخرى.
أضاءت شركة ذات مسؤولية محدودة رائعة في سجل الدولة الموحد للكيانات القانونية مرة واحدة فقط: في التحديث بتاريخ 21.2.2017. لا توجد شركة في أي مكان آخر ، وليس في تفريغ واحد كامللذلك ، لن يعمل على تفريغ كامل في بداية العام وتطبيق جميع التحديثات حتى اليوم. يرجى البدء من عام 2015 ، وإلا لن يكتمل تسجيلك.
يتغير Xsd فجأة
بضع مرات منذ عام 2015 ، تغيرت مصلحة الضرائب الفيدرالية فجأة xsd. يبدو الأمر كما يلي: يأتي التحديث ، وتحاول تحليله وفقًا للتنسيق القديم ، ولكن لا شيء يعمل. ينشط!
للتكيف مع xsd الجديد ، بشكل عام ، شيء يومي. المشكلة هي أنه لا أحد يحذر من التغييرات. الأيروبكسات - نشر إعلان في قسم تعسفي على موقع الويب الخاص بخدمة الضرائب الفيدرالية ، ولكنه ليس كذلك عادةً. سوف تتعلم كل شيء على الحقيقة.
من غير الواضح كيفية تحديد الشركات التابعة.
كما قلت في مقال سابق ، فإن الفروع في USRLE ليست سجلات منفصلة ، فهي سمات للكيانات القانونية. بموجب القانون ، لا يمكن أن توجد الفروع والمكاتب التمثيلية بمفردها ، ولهذا السبب يتم تخزينها في سجلات الشركة الرئيسية.
لكن لعملائنا احتياجاتهم الخاصة: فهم يقدمون خدمات لفروع الشركات الأخرى ، ويوقعون معهم مستندات مشتركة ، ويحافظون على الفروع في أنظمة المحاسبة الخاصة بهم ككيانات منفصلة. وبسبب هذا ، سنقوم بتحويل الفروع والمكاتب التمثيلية من USRLE إلى بطاقات منفصلة وربطها بالسجل الرئيسي.
يجب تحديد بطاقات الأفلييت التي تم إنشاؤها. يوفر هيكل USRLE لـ PPC اسمًا مختصرًا واسمًا كاملاً وحتى الاسم باللاتينية. ولكن لجعل الأمر أكثر متعة ، فإن خدمة الضرائب الفيدرالية مضمونة لملء العنوان فقط. كيفية إظهار الفروع وليس عرض العناوين.
مثال نموذجي: الفروع في التفريغ ليس لها سوى عنوانأولاً ، ما زلنا ننظر في الحقل باسم مختصر: فجأة يوجد شيء ما هناك. في 50٪ من الحالات ، لا يكون الحقل فارغًا حقًا ، ولكن حتى ذلك الحين ، من السابق لأوانه أن نفرح: قد يكون الاسم هو نفسه لجميع فروع الكيان القانوني. كمعرف ، هذا ليس أكثر فائدة من حقل فارغ.
إذا كان اسم الفرع فارغًا أو غير فريد ، فإننا ننشئه بأنفسنا.
على سبيل المثال ، سنأخذ كل "Camomile" ذات المسؤولية المحدودة. لديها ثلاثة فروع بأسماء فارغة وعناوين مثل:
- موسكو ، تورشانينوف لين ؛
- موسكو ، سد Ozerkovskaya ؛
- سان بطرسبرج ، نيفسكي بروسبكت.
نأخذ بيانات الشركة التي هي ، ونحولها إلى معرف اسم عاقل للفرع.
- أضف كلمة "الفرع" أو "القسم" في الاسم ، وقد تم توفير سمات مختلفة لها في سجل الولاية الموحد للكيانات القانونية.
- قم بتضمين الاسم المختصر للمنظمة الرئيسية. الآن لدينا ثلاثة أسماء متطابقة "فرع LLC Romashka".
- نأخذ عناوين الفروع وفي الأقواس نضيف إلى الأسماء الأجزاء المختلفة من العناوين.
نعزو العنوان إلى جزء فريد: بالنسبة لأول فرعين من "Daisies" هذا هو العنوان الكامل ، وبالنسبة للثالث - فقط "سان بطرسبرغ". إذا كانت جميع المدن مختلفة ، فسيضيفون مدنًا فقط إلى أسماء الفروع.
في مثالنا ، ستكون الفروع على النحو التالي:
- "فرع LLC Romashka (موسكو ، Turchaninov Lane)" ؛
- "فرع LLC Romashka (موسكو ، أوزيركوفسكايا إمبانكمينت)" ؛
- "فرع LLC Romashka (سانت بطرسبرغ)."
نعم ، إذا كان للفرع في USRLE اسم ، ولكن ليس فريدًا ، فإننا نتخطى أول خطوتين. نضيف جزء العنوان إلى هذا الاسم غير الفريد.
نأخذ عنوان الاسم إلى أقصى حد للشارع ، لأن الجحيم يبدأ بجزء المنزل مثل "dmvld 3 ، المبنى 5 ، الغرفة 14/51 ، من. 145. " من الصعب تفكيكها ، لكنها تبدو سخيفة كجزء من اسم الفرع. لذلك ، نتحد الفروع الموجودة في نفس الشارع. حتى أن هناك فروع مختلفة في نفس المبنى! لحسن الحظ ، هناك عدد قليل.
مجرد اتخاذ وتوصيل التسجيل لا يعمل
بالإضافة إلى هذه المشاكل ، فإن سجل الدولة الموحد للكيانات القانونية مليء بالأخطاء على مستوى الرموز والعناوين والتوافه الأخرى. على سبيل المثال ، عندما تقابل بدلاً من "LLC" ثلاثة أصفار في الدليل ، فهذا ليس مفاجئًا.
هناك أيضًا عناوين بها أخطاء ، حيث بدونها. على سبيل المثال ، تعد "لينينغراد" بدلاً من "سانت بطرسبرغ" حالة مهمة جدًا. خيار أكثر دنيوية: يشار إلى عنوان منظمة Zheleznodorozhny في منطقة موسكو كمدينة ، على الرغم من أنها كانت منطقة Balashikha لعدة سنوات.
في الواقع ، كل شيء صحيح في الدليل ، لأن USRLE يخزن التفاصيل من الوثائق التأسيسية للمؤسسة. ولكن للعمل مع قاعدة البيانات ، للبحث عنها ، يجب إحضار البيانات إلى الواقع. يبحث مستخدمونا عن مؤسسات تقع في سانت بطرسبرغ ، ولم يتم تسجيلهم مرة واحدة في لينينغراد.
لذلك ، يعد فتح سجل الدولة الموحد للكيانات القانونية والحصول على قاعدة مناسبة للعمليات الصناعية مهمة أخرى. دعني أذكرك بالمجلدات: إذا أخذت الكتاب المرجعي الكامل في بداية عام 2015 وجميع التحديثات حتى اليوم ، فستحصل على 100 مليون إدخال.
لتحليل USRLE ، كتبنا خوارزمية: يتلقى جميع الإدخالات عند الإدخال منذ عام 2015 ، وعند الإخراج يعطي 10 مليون مدخلات ذات صلة. يدير مكان ما في غضون ساعة. جزء مهم من العملية هو منتج
العميل الواحد . يرتب البيانات: ينظف العناوين ويجد التكرارات ويصحح الأخطاء المطبعية.
إذا كنت ترغب في تحليل الكتب المرجعية المعقدة ، وبناء البيانات وإحضارها إلى شكل بشري ، تعال إلينا للعمل. الآن نحن نبحث عن راتب javista - 195،000-250،000 ₽ قبل الخصم ، التفاصيل - على hh.ru. وتحتاج أيضًا إلى ضمان الجودة: من 115000 إلى 150.000 ₽ ، تفاصيل عن نفس الساعة .