🚗 🏇 🗂️ الويب الدلالي والبيانات المرتبطة. التصحيحات والإضافات ⚠️ 👨🏾 🌫️

أريد أن أقدم للجمهور جزءًا من هذا الكتاب الذي تم إصداره مؤخرًا:

النمذجة الأنطونية للمؤسسات: الأساليب والتقنيات [النص]: دراسة / [س. V. Gorshkov، S. S. Kralin، O. I. Mushtak and others؛ المحرر التنفيذي S. V. Gorshkov]. - ايكاترينبرج: دار النشر بجامعة الأورال ، 2019. - 234 صفحة: Ill. ، Tab. 20 سم - المصادقة يشار إلى الجزء الخلفي من الحلمة. أ. - مكتبة. في نهاية الفصل. - ISBN 978-5-7996-2580-1: 200 نسخة.

غلاف الكتاب والعمود الفقري

الغرض من حساب هذه القطعة على حبري هو ثلاثة أضعاف:

جمع الأسئلة والتعليقات لأخذها في الاعتبار عند تضمين هذا النص في شكل منقح في المنشورات الأخرى.
لجعل الإضافات غير المتوافقة للغاية مع تنسيق الدراسة المطبوعة: الملاحظات الموضعية (أدناه هي أسفل المفسدين) والارتباطات التشعبية ؛ وكذلك إجراء تصحيحات (أدناه لم يتم تسليط الضوء عليها بأي شكل من الأشكال).
لا يزال العديد من معتنقي الويب الدلالي والبيانات المرتبطة يعتقدون أن دائرتهم ضيقة جدًا ، وذلك أساسًا لأن الجمهور العام لم يشرح للجمهور بشكل جيد ماهية الويب الدلالي والبيانات المرتبطة. صاحب الشظية ، رغم أنه ينتمي إلى هذه الدائرة ، لا يلتزم بمثل هذا الرأي ، ولكنه مع ذلك يعتبر نفسه مضطرًا للقيام بمحاولة أخرى.

محتوى الفقرة

الويب الدلالي
البيانات المرتبطة
RDF
RDFS
SPARQL
OWL
ربط بيانات المؤسسة
ربط بيانات المؤسسة
أدب

الويب الدلالي

يمكن تمثيل تطور الإنترنت على النحو التالي (أو الحديث عن مقاطعه ، المشكلة بالترتيب التالي):

المستندات على الإنترنت . التقنيات الرئيسية - Gopher ، FTP ، إلخ
الإنترنت شبكة عالمية لمشاركة الموارد المحلية.
وثائق الانترنت . التقنيات الرئيسية هي HTML و HTTP.
تأخذ طبيعة الموارد المكشوفة في الاعتبار ميزات وسيط الإرسال الخاص بهم.
البيانات على الإنترنت . التقنيات الرئيسية - REST و SOAP API ، XHR ، إلخ.
يمكن القول أن الناس ليسوا فقط مستهلكين للموارد.
بيانات الإنترنت . التقنيات الرئيسية هي تقنيات البيانات المرتبطة.
هذه المرحلة الرابعة ، التي تنبأ بها بيرنرز لي ، مبتكر التقنيات الرئيسية للثاني ومدير W3C ، تسمى الويب الدلالي ؛ تم تصميم تقنيات البيانات المرتبطة لجعل بيانات الويب غير قابلة للقراءة فقط ، ولكن أيضًا "قابلة للقراءة آليًا".

هل الويب الدلالي ميت؟

تُجبر محركات البحث مواقع الويب بنجاح على استخدام RDFa و JSON-LD وأنفسهم يستخدمون تقنيات مشابهة لتلك الموضحة أدناه (Google Knowledge Graph ، Bing Knowledge Graph ، إلخ).

ما الذي يعوق الاستخدام الأوسع والأعمق لهذه التقنيات على الويب؟ لا يمكن للمؤلف الإجابة على هذا السؤال ، لكن يمكنه التحدث على أساس التجربة الشخصية. المهام التي سيتم حلها "خارج الصندوق" في سياق بداية الشبكة الدلالية هي ، ولكنها ليست منتشرة على نطاق واسع ، وأولئك الذين يواجهون هذه المهام ليس لديهم وسائل قسرية ضد أولئك القادرين على توفير حل. توفير المستقل لحل لهذه الأخيرة يتناقض مع نماذج أعمالهم.

ومع ذلك ، فإن تقنيات البيانات المرتبطة قد انتشرت إلى ما وراء الشبكة الجماهيرية ؛ في الواقع ، تم تخصيص هذا الكتاب لهذه التطبيقات ، ويأمل مجتمع البيانات المرتبطة حاليًا أن تصبح هذه التقنيات أكثر انتشارًا في بيئة الشركة من خلال التقاط (أو إعلان) اتجاهات Gartner مثل الرسوم البيانية للمعرفة ونسيج البيانات.

يبدو أنه تم اقتراح فترة زمنية معينة في كتيب عام 2011: F. Bauer، M. Kaltenböck. البيانات المفتوحة المرتبطة: الأساسيات. دليل البدء السريع لصناع القرار .

إن الويب الدلالي هو رؤية منهجية للإنترنت المستقبلي أكثر من كونه اتجاهًا عفويًا أو ضغطًا محددًا ، على الرغم من أنه قادر على مراعاة هذه الأخيرة. على سبيل المثال ، من الخصائص المهمة لما يسمى Web 2.0 "المحتوى الذي ينشئه المستخدم". ندعو W3C's Web Annotation Ontology ومبادرة مثل Solid إلى أخذها في الاعتبار.

من التالي ، سيرى القارئ مراسلات المفاهيم الأساسية للمرحلتين الثانية والرابعة:

نظراء URL هم URIs ،
مكافئ HTML هو RDF ،
تشبه الارتباطات التشعبية لـ HTML تكرارات URIs في مستندات RDF.

البيانات المرتبطة

عرّف بيرنرز لي البيانات المرتبطة على أنها شبكة دلالات "جيدة الصنع": مجموعة من الأساليب والتقنيات لتحقيق أهدافها النهائية. المبادئ الأساسية للبيانات المرتبطة بيرنرز لي حددت ما يلي.

المبدأ 1 استخدام URI ( معرف الموارد الموحد ) لتسمية الكيانات.

URIs هي معرفات الكيانات العالمية بدلاً من معرفات سجلات السلسلة المحلية. بعد ذلك ، تم التعبير عن هذا المبدأ بشكل أفضل في شعار Google Knowledge Graph " الأشياء ، وليس الجمل ".

المبدأ 2 استخدام URIs في نظام HTTP بحيث يمكن إزالة الإشارة إليها.

بالانتقال إلى URI ، يجب أن يكون من الممكن الحصول على المعنى وراء هذا الدلالة (هنا التشبيه باسم المشغل " * " في C واضح) ؛ بتعبير أدق ، للحصول على فكرة عن هذا المعنى - اعتمادًا على قيمة Accept: رأس HTTP. ربما مع ظهور عصر AR / VR ، سيكون من الممكن الحصول على المورد نفسه ، في الوقت الحالي ، على الأرجح ، سيكون مستند RDF نتيجة لتنفيذ استعلام DESCRIBE SPARQL.

المبدأ 3 باستخدام معايير W3C - في المقام الأول RDF (S) و SPARQL - على وجه الخصوص ، عند URI dereferencing.

سيتم وصف هذه "الطبقات" المنفصلة لمكدس تقنية Linked Data ، والمعروفة أيضًا باسم Semantic Web Layer Cake ، أدناه.

المبدأ 4 استخدام المراجع إلى URIs أخرى عند وصف الكيانات.

يتيح لك RDF أن تقصر نفسك على وصف شفهي للمورد باللغة الطبيعية ، والمبدأ الرابع يشجع على عدم القيام بذلك. مع التقيد العام بالمبدأ الأول ، يصبح من الممكن ، عند وصف المورد ، الإشارة إلى الآخرين ، بما في ذلك "الغرباء" ، وهذا هو السبب في أن البيانات تسمى ذات صلة. في الواقع ، لا مفر من استخدام URIs المسمى في قاموس RDFS.

RDF

RDF (إطار وصف الموارد) هو شكل رسمي لوصف الكيانات ذات الصلة.

يتم إجراء بيانات النموذج "كائن مسند إلى موضوع" ، تسمى ثلاثة توائم ، حول الكيانات وعلاقاتها. في أبسط الحالات ، يكون الموضوع ، المسند ، والعنصر URIs. يمكن أن يكون URI نفسه في مواقع مختلفة بثلاثة توائم مختلفة: يكون موضوعًا ، مسندًا ، وكائنًا ؛ وبالتالي ، فإن ثلاثة توائم تشكل نوعا من الرسم البياني يسمى الرسم البياني RDF.

يمكن أن تكون الموضوعات والكائنات ليست فقط URIs ، ولكن أيضًا ما يسمى العقد الفارغة ، ويمكن أن تكون الكائنات أيضًا حرفية . تمثل الحرف أمثلة على أنواع بدائية تتكون من تمثيل سلسلة وإعلان نوع.

أمثلة لكتابة الحرفي (في بناء Turtle ، انظر أدناه): "5.0"^^xsd:float و "five"^^xsd:string . حرفية مع rdf:langString يمكن أيضًا rdf:langString بعلامة لغة ، في Turtle مكتوب مثل هذا: "five"@en و ""@ru .

العقد الفارغة هي موارد "مجهولة المصدر" بدون معرّفات عمومية ، ومع ذلك ، يمكن المطالبة بها ؛ نوع من المتغيرات الوجودية.

لذلك (هذا ، في الواقع ، هو بيت القصيد من RDF):

الموضوع هو URI أو عقدة فارغة ،
المسند هو URI ،
الكائن هو URI أو عقدة فارغة أو حرفي.

لماذا لا يمكن أن تكون العقد فارغة؟

السبب المحتمل هو الرغبة في الفهم غير الرسمي وترجمته إلى لغة منطق spo من الدرجة الأولى في spo كشيء مثل $p (s، o)$ حيث $ع$ - المسند $s$ و $o$ هي الثوابت. توجد آثار لهذا الفهم في المستند " LBase: دلالات لغات الويب الدلالي " ، الذي يحتوي على وضع مذكرة مجموعة عمل W3C. مع هذا الفهم ، سيتم ترجمة sp [] الثلاثي sp [] ، حيث [] عقدة فارغة ، كـ $\ موجود x \؛ p (s، x)$ حيث $x$ هو متغير ، ولكن كيف إذن ترجمة s [] o ؟ بوجود حالة توصية W3C ، تقدم وثيقة دلالات 1.1 RDF طريقة ترجمة مختلفة ، لكن لا تزال لا تعتبر إمكانية أن تكون العقد عبارة عن فراغات.

ومع ذلك ، سمح مانو سبورني.

RDF هو نموذج مجردة. يمكن كتابة RDF (متسلسل) في بناء جملة مختلف: RDF / XML ، السلاحف (الأكثر قابلية للقراءة البشرية) ، JSON-LD ، HDT (ثنائي).

يمكن إجراء تسلسل RDF نفسه في RDF / XML بطرق مختلفة ، لذلك ، على سبيل المثال ، فإن XML الناتج لا طائل منه للتحقق من صحة مع XSD أو محاولة استرداد البيانات باستخدام XPath. وبالمثل ، من غير المحتمل أن يلبي JSON-LD رغبة مطور جافا سكريبت العادي في العمل مع RDF باستخدام نقطة Javascript وتدوين المربع بين قوسين (على الرغم من أن JSON-LD تتحرك في هذا الاتجاه ، مما يشير إلى آلية تأطير ).

تقدم معظم بناء الجملة طرقًا لتقصير عناوين URL الطويلة. على سبيل المثال ، سوف يسمح لك الإعلان @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> في السلاحف ، بالكتابة بدلاً من <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> فقط rdf:type .

RDFS

RDFS (مخطط RDF) هو قاموس نمذجة أساسي يقدم مفاهيم الملكية rdfs:subClassOf والخصائص مثل rdf:type و rdfs:subClassOf و rdfs:domain و rdfs:range . باستخدام قاموس RDFS ، على سبيل المثال ، يمكن كتابة التعبيرات الصحيحة التالية:

 rdf:type rdf:type rdf:Property . rdf:Property rdf:type rdfs:Class . rdfs:Class rdfs:subClassOf rdfs:Resource . rdfs:subClassOf rdfs:domain rdfs:Class . rdfs:domain rdfs:domain rdf:Property . rdfs:domain rdfs:range rdfs:Class . rdfs:label rdfs:range rdfs:Literal .

RDFS هو قاموس الوصف والنمذجة ، لكنها ليست لغة قيود (على الرغم من أن المواصفات الرسمية تترك إمكانية مثل هذا الاستخدام). لا ينبغي فهم كلمة "مخطط" بنفس المعنى الوارد في تعبير "مخطط XML". على سبيل المثال :author rdfs:range foaf:Person يعني أن rdf:type جميع قيم :author خاصية :author هو foaf:Person ، ولكن لا يعني أن هذا يجب أن يقال مقدمًا.

SPARQL

SPARQL (بروتوكول SPARQL ولغة استعلام RDF) هي لغة استعلام لبيانات RDF. في الحالة البسيطة ، يكون استعلام SPARQL عبارة عن مجموعة من العينات التي تُقارن بها ثلاثة توائم من الرسم البياني. يمكن العثور على المتغيرات في عينات في مواقف الموضوعات ، المسندات ، والأشياء.

سيقوم الاستعلام بإرجاع قيم المتغيرات التي ، عند استبدالها في نماذج ، يمكن أن تنتج رسمًا فرعيًا للرسم البياني RDF الذي تم استجوابه (مجموعة فرعية من ثلاثة توائم لها). يجب أن يكون للمتغيرات التي تحمل نفس الاسم في عينات ثلاثية مختلفة نفس القيمة.

على سبيل المثال ، في المجموعة الموضحة أعلاه من سبع بديهيات RDFS ، سيعود الاستعلام التالي rdfs:domain و rdfs:range كقيمتي ?s و ?p على التوالي:

 SELECT * WHERE { ?s ?p rdfs:Class . ?p ?p rdf:Property . }

تجدر الإشارة إلى أن SPARQL تعريفية وليست لغة لوصف اجتياز الرسم البياني (ومع ذلك ، فإن بعض مستودعات RDF تقدم طرقًا لضبط خطة تنفيذ الاستعلام). لذلك ، لا يمكن حل بعض مهام الرسم البياني القياسية ، على سبيل المثال ، العثور على أقصر مسار ، على SPARQL ، بما في ذلك استخدام آلية مسارات الممتلكات (ولكن ، مرة أخرى ، توفر مستودعات RDF الفردية امتدادات خاصة لحل هذه المشكلات).

SPARQL لا تشارك في افتراض انفتاح العالم وتتبع نهج "النفي كالفشل" ، إنشاءات مثل FILTER NOT EXISTS {…} ممكنة في ذلك. يؤخذ توزيع البيانات في الاعتبار باستخدام آلية الاستعلام الموحدة .

لا تحتوي نقطة وصول SPARQL - وهو متجر RDF قادر على معالجة استفسارات SPARQL - على نظيرات مباشرة من المرحلة الثانية (انظر بداية هذا القسم). يمكن تشبيهه بقاعدة بيانات تستند إلى محتويات صفحات HTML التي تم إنشاؤها ، ولكن يمكن الوصول إليها خارجيًا. تشبه نقطة وصول SPARQL نقطة وصول API من المرحلة الثالثة ، ولكن مع اختلافين رئيسيين. أولاً ، من الممكن دمج العديد من الاستعلامات "الذرية" في واحد (والذي يُعتبر سمة أساسية من سمات GraphQL) ، وثانياً ، يتم توثيق API بشكل كامل (وهو ما حاولت HATEOAS تحقيقه).

ملاحظة جدلية

RDF هي وسيلة لنشر البيانات على الويب ، لذلك ينبغي اعتبار مستودعات RDF قواعد بيانات موثقة. صحيح ، نظرًا لأن RDF عبارة عن رسم بياني ، وليس شجرة ، فقد تبين أنها أيضًا رسم بياني. إنه لأمر مدهش ما حدث. من كان يظن أن هناك أشخاص أذكياء يقومون بتطبيق عقد فارغة. كود لم ينجح .

هناك طرق أقل فاعلية بالكامل لتنظيم الوصول إلى بيانات RDF ، على سبيل المثال ، أجزاء البيانات المرتبطة (LDF) ومنصة البيانات المرتبطة (LDP).

OWL

OWL (لغة الأنطولوجيا على الويب) - شكليات تمثيل المعرفة ، الإصدار النحوي للمنطق الوصفي $\ mathcal {SROIQ (D)}$ (في كل مكان أدناه ، من الأصح قول OWL 2 ، كانت النسخة الأولى من OWL تستند إلى $\ mathcal {SHOIN (D)}$ ).

تتوافق الفصول مع مفاهيم المنطق الوصفي في OWL ، والخصائص تتوافق مع الأدوار ، ويحتفظ الأفراد باسمهم السابق. وتسمى البديهيات أيضا البديهيات.

على سبيل المثال ، في ما يسمى بناء جملة مانشستر لكتابة OWL ، نحن نعرف بالفعل البديهية $\ mathsf {Parent} \ equiv \ mathsf {Human} \ sqcap \ موجود \ mathsf {hasParent} ^ {-} \ mathsf {.Human}$ سوف تكتب مثل هذا:

 Class: Human Class: Parent EquivalentClass: Human and (inverse hasParent) some Human ObjectProperty: hasParent

هناك بناء جملة آخر لكتابة OWL ، على سبيل المثال ، بناء الجملة الوظيفية المستخدمة في المواصفات الرسمية ، و OWL / XML . بالإضافة إلى ذلك ، يمكن إجراء تسلسل OWL إلى بناء جملة RDF التجريدي ولاحقًا إلى أي من الجمل المحددة.

البومة فيما يتعلق RDF يعمل في ناحيتين. من ناحية ، يمكن اعتباره نوعًا من القاموس الذي يمتد RDFS. من ناحية أخرى ، إنه شكل أكثر قوة ، والذي RDF هو مجرد تنسيق التسلسل. لا يمكن كتابة جميع بنيات OWL الأولية باستخدام ثلاثية RDF واحدة.

اعتمادًا على المجموعة الفرعية من بنيات OWL المسموح باستخدامها ، فإنهم يتحدثون عن ملفات تعريف OWL المزعومة . المعيار والأكثر شهرة هي OWL EL ، OWL RL و OWL QL. يؤثر اختيار ملف التعريف على التعقيد الحسابي للمهام النموذجية. مجموعة كاملة من تصاميم OWL مطابقة $\ mathcal {SROIQ (D)}$ ، ودعا OWL DL. في بعض الأحيان يتحدثون أيضًا عن OWL Full ، حيث يُسمح باستخدام تصميمات OWL بالحرية الكاملة الملازمة للـ RDF ، دون قيود دلالة وحسابية $\ mathcal {SROIQ (D)}$ . على سبيل المثال ، يمكن أن يكون كل شيء فئة وممتلكات. البومة الكاملة غير قابلة للحل.

تتمثل المبادئ الأساسية لإلحاق التأثيرات في OWL في قبول افتراض العالم المفتوح ( OWA ) ورفض افتراض افتراض الاسم الفريد ( UNA ). أدناه سنرى ما يمكن أن تؤدي إليه هذه المبادئ والتعرف على بعض بنيات OWL.

دع الأنطولوجيا تحتوي على الجزء التالي (في بناء جملة مانشستر):

 Class: manyChildren EquivalentTo: Human that hasChild min 3 Individual: John Types: Human Facts: hasChild Alice, hasChild Bob, hasChild Carol

هل سيترتب على ما سبق أن يوحنا كبير؟ سيؤدي رفض UNA إلى إجبار محرك الإخراج على الإجابة عن هذا السؤال بالنفي ، لأن Alice و Bob قد يكونان نفس الشخص. لكي يحدث ما يلي ، تحتاج إلى إضافة البديهية التالية:

 DifferentIndividuals: Alice, Bob, Carol, John

دعونا الآن جزء من الأنطولوجيا له الشكل التالي (أعلن جون لتكون كبيرة ، ولكن لديه طفلان فقط المشار إليها):

 Class: manyChildren EquivalentTo: Human that hasChild min 3 Individual: John Types: Human, manyChildren Facts: hasChild Alice, hasChild Bob DifferentIndividuals: Alice, Bob, Carol, John

هل ستكون هذه الأنطولوجيا غير متسقة (والتي يمكن تفسيرها كدليل على بيانات غير صالحة)؟ سيؤدي اعتماد OWA إلى إجبار محرك الإخراج على الاستجابة بشكل سلبي: "في مكان ما" آخر (في علم الوجود آخر) قد يقال إن كارول هي أيضًا طفل جون.

لاستبعاد احتمال ذلك ، نضيف حقيقة جديدة عن جون:

 Individual: John Facts: hasChild Alice, hasChild Bob, not hasChild Carol

لاستبعاد ظهور الأطفال الآخرين ، نقول أن جميع قيم خاصية "إنجاب طفل" هم أشخاص ، لدينا أربعة منهم فقط:

 ObjectProperty: hasChild Domain: Human haracteristics: Irreflexive Class: Human EquivalentTo: { Alice, Bill, Carol, John }

الآن ستصبح الأنطولوجيا مثيرة للجدل ، والتي لن يخفق محرك الإخراج في الإبلاغ عنها. آخر البديهيات ، بمعنى ما ، "أغلقنا" العالم ، ونلاحظ كيف يتم استبعاد احتمال أن يكون جون طفلاً لنفسه.

ربط بيانات المؤسسة

مجموعة من الأساليب والتقنيات كانت البيانات المرتبطة في الأصل مخصصة لنشر البيانات على الويب. يواجه استخدامها في بيئة الشركة عددًا من الصعوبات.

على سبيل المثال ، في بيئة شركة مغلقة ، فإن القوة الاستنتاجية لـ OWL ، بناءً على اعتماد OWA ورفض UNA ، والقرارات بسبب الطبيعة المفتوحة والموزعة للويب ، ضعيفة للغاية. وهنا المخرجات التالية ممكنة.

تمكين دلالات OWL ، التي تنطوي على التخلي عن OWA واعتماد UNA ، وتنفيذ محرك الإخراج المقابل. - بهذه الطريقة يذهب تخزين Stardog RDF.
التخلي عن القدرات الاستنتاجية لـ OWL لصالح محركات القاعدة. - Stardog يدعم SWRL . يينا و GraphDB تقدم لغات حكمهم الخاصة .
رفض إمكانيات استنتاج OWL ، واستخدام لنمذجة مجموعة فرعية واحدة أو أخرى بالقرب من RDFS. - انظر أكثر على هذا في وقت لاحق.

هناك مشكلة أخرى تتمثل في الاهتمام الأكثر أهمية بأنه في عالم الشركات ، يمكن تكريس مشاكل جودة البيانات ، ونقص أدوات التحقق من صحة البيانات في مكدس البيانات المرتبطة. المخرجات هي على النحو التالي.

مرة أخرى ، يبني استخدام OWL مع دلالات العالم المغلق وتفرد الأسماء في وجود محرك إخراج مناسب للتحقق من الصحة.
باستخدام SHACL ، تم توحيده بعد إصلاح قائمة طبقات كعكة Semantic Web Layer Cake (ومع ذلك ، يمكن استخدامه أيضًا كمحرك قاعدة) أو ShEx .
إدراك أن كل شيء يتم في نهاية المطاف عن طريق استعلامات SPARQL ، وإنشاء آلية بسيطة خاصة بنا للتحقق من صحة البيانات باستخدامها.

ومع ذلك ، حتى الرفض الكامل للقدرات الاستنتاجية وأدوات التحقق من الصحة ، تترك مكدس البيانات المرتبطة بدون منازع في مهام تشبه المناظر الطبيعية ومهام تكامل البيانات المفتوحة والموزعة على الويب.

ماذا عن نظام معلومات الشركات العادية؟

سوف أصف هنا رد الفعل الأولي النموذجي للمشاركين في التنمية لإظهار كيف تبدو هذه المجموعة من وجهة نظر تقنية المعلومات التقليدية (تذكر حكاية الفيل):

محلل الأعمال : RDF يشبه النموذج المنطقي المخزن مباشرة.
محلل النظام : RDF هو EAV ، مع مجموعة من الفهارس ولغة استعلام مريحة فقط.
المطور : حسنًا ، كل ذلك بروح مفاهيم النموذج الغني والرمز المنخفض ، لقد قرأت عنه مؤخرًا.
مدير المشروع : نعم انهار المكدس !

تدل الممارسة على أنه يتم استخدام المجموعة في الغالب في المهام المتعلقة بتوزيع البيانات وعدم تجانسها ، على سبيل المثال ، عند إنشاء أنظمة للفئة MDM (إدارة البيانات الرئيسية) أو DWH (مستودع البيانات). هذه المهام متوفرة في أي صناعة.

بالنسبة للتطبيقات الخاصة بالصناعة ، تعد تقنيات البيانات المرتبطة حاليًا الأكثر شعبية في الصناعات التالية.

التقنيات الطبية الحيوية (حيث ترتبط شعبيتها على ما يبدو بتعقيد مجال الموضوع) ؛

تيار

في اليوم الآخر ، في "نقطة الغليان" ، مؤتمر " رابطة الأنطولوجيا". من النظرية إلى التطبيق العملي . "

تصنيع وتشغيل المنتجات المعقدة (هندسة واسعة النطاق ، وإنتاج النفط والغاز ؛ وغالباً ما نتحدث عن معيار ISO 15926 ) ؛

تيار

هنا ، السبب هو تعقيد مجال الموضوع ، عندما ، على سبيل المثال ، في المرحلة الأولية ، إذا كنا نتحدث عن صناعة النفط والغاز ، فإن المحاسبة البسيطة تحتاج إلى بعض وظائف CAD.

في عام 2008 ، عقد مؤتمر تمثيلي للتركيب نظمته شيفرون.

يبدو أن ISO 15926 في النهاية ثقيلة بعض الشيء بالنسبة لصناعة النفط والغاز (ووجدت تطبيقًا تقريبًا في الهندسة الميكانيكية). فقط Statoil (Equinor) جلس عليها بدقة ، في النرويج ، تشكل نظام بيئي كامل من حوله. يحاول البعض الآخر فعل شيء خاص بهم. على سبيل المثال ، وفقًا للشائعات ، تعتزم وزارة الطاقة المحلية إنشاء "نموذج وجودي مفاهيمي لمجمع الوقود والطاقة" ، على ما يبدو ، تم إنشاؤه لصناعة الطاقة الكهربائية .

المنظمات المالية (حتى XBRL يمكن اعتبارها مزيجًا من SDMX و RDF Data Cube) ؛

تيار

في بداية العام ، قام موقع LinkedIn على نحو غير فعال بإغراق المؤلف بوظائف شاغرة لكل عمالقة القطاع المالي تقريبًا ، الذين يعرف أسمائهم: Goldman Sachs و JPMorgan Chase و / أو Morgan Stanley و Wells Fargo و SWIFT / Visa / Mastercard و Bank of America و Citigroup و Fed دويتشه بنك. بالمناسبة ، في مؤتمر المعرفة الرسم البياني ، احتلت المؤسسات المالية صباح كامل من اليوم الأول .

على HeadHunter ، واجه Sberbank فقط شيئًا مثيرًا للاهتمام ، لقد كان حول "تخزين EAV مع نموذج بيانات يشبه RDF".

من المحتمل أن الاختلاف في درجة حب التقنيات المقابلة للمؤسسات المالية المحلية والغربية يرجع إلى الطبيعة العابرة للحدود الوطنية لأنشطة هذه الأخيرة. على ما يبدو ، يتطلب التكامل عبر حدود الدولة حلولًا تنظيمية وفنية مختلفة نوعيًا.

أنظمة الإجابة على الأسئلة التي لها تطبيقات تجارية (IBM Watson و Apple Siri و Google Knowledge Graph) ؛

تيار

بالمناسبة ، مؤلف سيري توماس غروبر هو مؤلف تعريف علم الوجود ذاته (بمعنى تكنولوجيا المعلومات) باعتباره "مواصفات تصور". في رأيي ، فإن إعادة ترتيب الكلمات في هذا التعريف لا يغير معناها ، والتي ربما تشير إلى أنها غير موجودة.

نشر البيانات المنظمة (لسبب وجيه يمكن أن يعزى ذلك بالفعل إلى البيانات المفتوحة المرتبطة).

تيار

من المعجبين الكبار بالبيانات المرتبطة - ما يسمى بـ GLAM: المعارض والمكتبات والمحفوظات والمتاحف. يكفي أن نقول أنه لتحل محل MARC21 ، تقوم مكتبة الكونجرس بالترويج لـ BIBFRAME ، والذي يوفر الأساس لمستقبل الوصف الببليوغرافي ، وبالطبع ، يعتمد على RDF.

غالبًا ، كمثال على مشروع ناجح في مجال البيانات المرتبطة المرتبطة ، فإن Wikidata هي نوع من الإصدار القابل للقراءة آليًا من Wikipedia ، ولا يتم إنشاء محتوياته ، على عكس DBPedia ، عن طريق الاستيراد من مربعات المعلومات من المقالات ، ولكن يتم إنشاؤها يدويًا أو أكثر (وبالتالي تصبح مصدرًا للمعلومات لنفسه) صناديق المعلومات).

نوصي أيضًا بالتعرف على قائمة مستخدمي متجر Stardog RDF على موقع Stardog على الويب في قسم العملاء.

على الرغم من ذلك ، فقد تم وضع Gartner Hype Cycle for Emporging Technologies في تصنيف وإدارة الشركات في منتصف الهبوط في وادي خيبة الأمل مع احتمال الوصول إلى "هضبة الإنتاجية" في موعد لا يتجاوز 10 سنوات.

ربط بيانات المؤسسة

قليلا من التاريخ

من الاهتمام التاريخي ، قدم إلى طاولة توقعات Gartner لعدة سنوات حول التقنيات التي تهمنا.

عام	تكنولوجيا	تقرير	موقف	سنوات للهضبة
2001	الويب الدلالي	التكنولوجيات الناشئة	الزناد الابتكار	5-10
2006	الويب الدلالي للشركات	التكنولوجيات الناشئة	ذروة التوقعات مبالغ فيها	5-10
2012	الويب الدلالي	البيانات الكبيرة	ذروة التوقعات مبالغ فيها	> 10
2015	البيانات المرتبطة	التحليلات المتقدمة وعلوم البيانات	الحضيض من خيبة الأمل	5-10
2016	إدارة الأنطولوجيا المؤسسة	التكنولوجيات الناشئة	الحضيض من خيبة الأمل	> 10
2018	الرسوم البيانية المعرفة	التكنولوجيات الناشئة	الزناد الابتكار	5-10

ومع ذلك ، بالفعل في "دورة الضجيج ..." لعام 2018 ، ظهر اتجاه صعودي آخر - الرسم البياني للمعرفة. كان هناك تناسخ معين: قواعد بيانات إدارة قواعد البيانات الرسومية ، التي جذبت انتباه المستخدمين وقوة المطورين ، تحت تأثير طلبات السابق وعادات الأخير ، اكتسبت ملامح وتحديد مواقع منافسيها السابقين.

كل رسم بياني تقريبًا ، تعلن DBMS عن نفسها منصة مناسبة لبناء "رسم بياني للمعرفة" (يتم "استبدال البيانات المرتبطة" أحيانًا "بالبيانات المتصلة") ، ولكن ما مدى تبرير هذه الادعاءات؟

قواعد بيانات الرسم البياني لا تزال asemantic ، البيانات في الرسم البياني DBMS لا تزال صومعة البيانات نفسها. URI , RDF- RDF-. — LPG, .

, . , SQL.

, RDF- LPG. , Blazegraph: RDF*, RDF LPG.

RDF- LPG : « RDF-» . Knowledge Graphs Data Fabric , , . , , , , . : Data Fabric — , , NoETL, Knowledge Graph — , , Data Fabric done right.

أدب

Halpin, H., Monnin, A. (eds.) (2014) Philosophical Engineering: Toward a Philosophy of the Web
Allemang, D., Hendler, J. (2011) Semantic Web for the Working Ontologist (2nd ed.)
Staab, S., Studer, R. (eds.) (2009) Handbook on Ontologies (2nd ed.)
Wood, D. (ed.). (2011) Linking Enterprise Data
Uschold M. (2018) Demystifying OWL for the Enterprise
Keet, M. (2018) An Introduction to Ontology Engineering

الويب الدلالي والبيانات المرتبطة. التصحيحات والإضافات

محتوى الفقرة

الويب الدلالي

البيانات المرتبطة

RDF

RDFS

SPARQL

OWL

ربط بيانات المؤسسة

ربط بيانات المؤسسة

أدب

More articles: