👉🏿 ⛈️ 📄 لمحة صغيرة عن SIMD في .NET / C # 💆 ✍🏾 👨🏾‍🎨

يتم توجيه انتباهك إلى نظرة عامة صغيرة على إمكانات توجيه الخوارزميات في .NET Framework و .NETCORE. الغرض من هذه المقالة هو تقديم هذه التقنيات لأولئك الذين لم يعرفوها على الإطلاق وإظهار أن .NET لا يتخلف كثيراً عن اللغات "الحقيقية المترجمة" للمواطن الأصلي.
التنمية.

لقد بدأت للتو في تعلم أساليب التحويل ، لذلك إذا وجهني شخص من المجتمع إلى حالة غير صريحة أو قدم نسخًا محسنة من الخوارزميات الموضحة أدناه ، فسوف أكون سعيدًا جدًا.

قليلا من التاريخ

في .NET ، ظهر SIMD لأول مرة في عام 2015 مع إصدار .NET Framework 4.6. ثم تمت إضافة أنواع Matrix3x2 و Matrix4x4 و Plane و Quaternion و Vector2 و Vector3 و Vector4 ، مما سمح بإنشاء حسابات متجهة. في وقت لاحق ، تمت إضافة نوع Vector <T> ، مما أتاح مزيدًا من الفرص لتوجيه الخوارزميات. لكن العديد من المبرمجين كانوا لا يزالون غير راضين عن ذلك حدت الأنواع المذكورة أعلاه من تدفق أفكار المبرمج ولم تسمح باستخدام القوة الكاملة لتعليمات SIMD للمعالجات الحديثة. بالفعل في الوقت الحاضر ، في .NET Core 3.0 Preview ، ظهرت مساحة اسم System.Runtime.Intrinsics ، والتي توفر حرية أكبر بكثير في اختيار التعليمات. للحصول على أفضل النتائج في السرعة ، تحتاج إلى استخدام RyuJit وبناء إما على x64 أو تعطيل Prefer 32 بت والبناء على AnyCPU. جميع المعايير التي قمت بتشغيلها على جهاز كمبيوتر مع معالج Intel Core i7-6700 3.40 جيجاهرتز (Skylake).

تلخيص عناصر الصفيف

قررت أن أبدأ بالمشكلة الكلاسيكية ، والتي تتم كتابتها غالبًا عندما يتعلق الأمر بالتوجه. هذه هي مهمة العثور على مجموع عناصر الصفيف. سنكتب أربعة تطبيقات لهذه المهمة ، وسوف نلخص عناصر مجموعة Array:

الأكثر وضوحا

public int Naive() { int result = 0; foreach (int i in Array) { result += i; } return result; }

باستخدام LINQ

 public long LINQ() => Array.Aggregate<int, long>(0, (current, i) => current + i);

باستخدام المتجهات من System.Numerics:

 public int Vectors() { int vectorSize = Vector<int>.Count; var accVector = Vector<int>.Zero; int i; var array = Array; for (i = 0; i < array.Length - vectorSize; i += vectorSize) { var v = new Vector<int>(array, i); accVector = Vector.Add(accVector, v); } int result = Vector.Dot(accVector, Vector<int>.One); for (; i < array.Length; i++) { result += array[i]; } return result; }

باستخدام التعليمات البرمجية من مساحة System.Runtime.Intrinsics:

 public unsafe int Intrinsics() { int vectorSize = 256 / 8 / 4; var accVector = Vector256<int>.Zero; int i; var array = Array; fixed (int* ptr = array) { for (i = 0; i < array.Length - vectorSize; i += vectorSize) { var v = Avx2.LoadVector256(ptr + i); accVector = Avx2.Add(accVector, v); } } int result = 0; var temp = stackalloc int[vectorSize]; Avx2.Store(temp, accVector); for (int j = 0; j < vectorSize; j++) { result += temp[j]; } for (; i < array.Length; i++) { result += array[i]; } return result; }

أطلقت معيارًا عن هذه الطرق الأربع على جهاز الكمبيوتر الخاص بي وحصلت على هذه النتيجة:

الطريقة	ItemsCount	متوسط
ساذج	10	75.12 ن
LINQ	10	1 186.85 ن
المتجهات	10	60.09 ن
الجوهرية	10	255.40 ن

ساذج	100	360.56 ن
LINQ	100	2 719.24 ن
المتجهات	100	60.09 ن
الجوهرية	100	345.54 ن

ساذج	1000	1 847.88 ن
LINQ	1000	12 033.78 ن
المتجهات	1000	240.38 ن
الجوهرية	1000	630.98 ن

ساذج	10000	18 403.72 ن
LINQ	10000	102 489.96 ن
المتجهات	10000	7 316.42 ن
الجوهرية	10000	3 365.25 ن

ساذج	100000	176 630.67 ns
LINQ	100000	975 998.24 ns
المتجهات	100000	78 828.03 ن
الجوهرية	100000	41 269.41 ن

يمكن أن نرى أن الحلول مع Vectors و Intrinsics هي أسرع بكثير من الحل الواضح ومع LINQ. الآن نحن بحاجة إلى معرفة ما يحدث في هاتين الطريقتين.

النظر في طريقة المتجهات بمزيد من التفاصيل:

المتجهات

 public int Vectors() { int vectorSize = Vector<int>.Count; var accVector = Vector<int>.Zero; int i; var array = Array; for (i = 0; i < array.Length - vectorSize; i += vectorSize) { var v = new Vector<int>(array, i); accVector = Vector.Add(accVector, v); } int result = Vector.Dot(accVector, Vector<int>.One); for (; i < array.Length; i++) { result += array[i]; } return result; }

int vectorSize = Vector <int> .Count؛ - هذا هو عدد الأرقام 4 بايت يمكننا وضعه في ناقل. إذا تم استخدام تسريع الأجهزة ، فإن هذه القيمة توضح عدد الأرقام التي يمكن وضعها في سجل SIMD بأربع أرقام. في الحقيقة ، يُظهر عدد عناصر هذا النوع التي يمكن تشغيلها بالتوازي ؛
accVector - متجه تتراكم فيه نتيجة الوظيفة ؛
var v = ناقل جديد <int> (array، i)؛ - يتم تحميل البيانات في متجه v جديد ، من الصفيف ، بدءًا من الفهرس i. سيتم تحميل بيانات vectorSize بالضبط.
accVector = Vector.Add (accVector، v)؛ - يتم إضافة متجهين.
على سبيل المثال ، يتم تخزين أرقام الصفيف 8: {0 ، 1 ، 2 ، 3 ، 4 ، 5 ، 6 ، 7} و vectorSize == 4 ، ثم:
في التكرار الأول من accVector حلقة = {0 ، 0 ، 0 ، 0} ، v = {0 ، 1 ، 2 ، 3} ، بعد الإضافة في accVector ، ستكون: {0 ، 0 ، 0 ، 0} + {0 ، 1 ، 2 ، 3} = {0 ، 1 ، 2 ، 3}.
في التكرار الثاني ، v = {4 ، 5 ، 6 ، 7} وبعد الإضافة accVector = {0 ، 1 ، 2 ، 3} + {4 ، 5 ، 6 ، 7} = {4 ، 6 ، 8 ، 10}.
يبقى فقط للحصول على مجموع جميع عناصر المتجه بطريقة أو بأخرى ، لذلك يمكننا تطبيق الضرب العددي بواسطة متجه مليء بوحدات: int result = Vector.Dot (accVector، Vector <int> .One)؛
ثم اتضح: {4 ، 6 ، 8 ، 10} {1 ، 1 ، 1 ، 1} = 4 1 + 6 1 + 8 1 + 10 * 1 = 28.
في النهاية ، إذا لزم الأمر ، تتم إضافة الأرقام التي لا تتناسب مع المتجه الأخير.

إذا نظرت إلى رمز أسلوب Intrinsics:

الجوهرية

 public unsafe int Intrinsics() { int vectorSize = 256 / 8 / 4; var accVector = Vector256<int>.Zero; int i; var array = Array; fixed (int* ptr = array) { for (i = 0; i < array.Length - vectorSize; i += vectorSize) { var v = Avx2.LoadVector256(ptr + i); accVector = Avx2.Add(accVector, v); } } int result = 0; var temp = stackalloc int[vectorSize]; Avx2.Store(temp, accVector); for (int j = 0; j < vectorSize; j++) { result += temp[j]; } for (; i < array.Length; i++) { result += array[i]; } return result; }

يمكنك أن ترى أنه يشبه إلى حد كبير المتجهات مع بعض الاستثناءات:

يتم إعطاء vectorSize بواسطة ثابت. هذا لأنه يتم استخدام إرشادات Avx2 التي تعمل على سجلات 256 بت بشكل صريح في هذه الطريقة. في التطبيق الحقيقي ، يجب أن يكون هناك فحص لمعرفة ما إذا كان معالج Avx2 الحالي يدعم التعليمات ، وإذا لم يكن كذلك ، فاتصل برمز آخر. يبدو شيء مثل هذا:
```
 if (Avx2.IsSupported) { DoThingsForAvx2(); } else if (Avx.IsSupported) { DoThingsForAvx(); } ... else if (Sse2.IsSupported) { DoThingsForSse2(); } ... 
```
var accVector = Vector256 <int> .Zero؛ تم إعلان accVector على أنه ناقل 256 بت مليء بالأصفار.
ثابت (int * ptr = Array) - يتم إدخال مؤشر إلى صفيف في ptr.
ثم نفس العمليات كما في Vectors: تحميل البيانات في متجه وإضافة متجهين.
لتلخيص عناصر المتجه تم تطبيق الطريقة التالية:
- يتم إنشاء صفيف على المكدس: var temp = stackalloc int [vectorSize]؛
- يتم تحميل المتجه إلى هذا الصفيف: Avx2.Store (temp، accVector)؛
- في حلقة يتم تلخيص عناصر الصفيف.
ثم يتم إضافة عناصر الصفيف التي لم يتم وضعها في المتجه الأخير

قارن بين صفيفين

من الضروري مقارنة صفيفين من البايتات. في الواقع هذه هي المشكلة التي بسببها بدأت في تعلم SIMD في .NET. مرة أخرى ، سوف نكتب عدة طرق للمعيار ، وسنقوم بمقارنة مجموعتين: ArrayA و ArrayB:

الحل الأكثر وضوحا:

 public bool Naive() { for (int i = 0; i < ArrayA.Length; i++) { if (ArrayA[i] != ArrayB[i]) return false; } return true; }

الحل عبر LINQ:

 public bool LINQ() => ArrayA.SequenceEqual(ArrayB);

الحل عبر وظيفة MemCmp:

 [DllImport("msvcrt.dll", CallingConvention = CallingConvention.Cdecl)] static extern int memcmp(byte[] b1, byte[] b2, long count); public bool MemCmp() => memcmp(ArrayA, ArrayB, ArrayA.Length) == 0;

باستخدام المتجهات من System.Numerics:

 public bool Vectors() { int vectorSize = Vector<byte>.Count; int i = 0; for (; i < ArrayA.Length - vectorSize; i += vectorSize) { var va = new Vector<byte>(ArrayA, i); var vb = new Vector<byte>(ArrayB, i); if (!Vector.EqualsAll(va, vb)) { return false; } } for (; i < ArrayA.Length; i++) { if (ArrayA[i] != ArrayB[i]) return false; } return true; }

باستخدام الجوهرية:

 public unsafe bool Intrinsics() { int vectorSize = 256 / 8; int i = 0; const int equalsMask = unchecked((int) (0b1111_1111_1111_1111_1111_1111_1111_1111)); fixed (byte* ptrA = ArrayA) fixed (byte* ptrB = ArrayB) { for (; i < ArrayA.Length - vectorSize; i += vectorSize) { var va = Avx2.LoadVector256(ptrA + i); var vb = Avx2.LoadVector256(ptrB + i); var areEqual = Avx2.CompareEqual(va, vb); if (Avx2.MoveMask(areEqual) != equalsMask) { return false; } } for (; i < ArrayA.Length; i++) { if (ArrayA[i] != ArrayB[i]) return false; } return true; } }

نتيجة الاختبار على جهاز الكمبيوتر الخاص بي:

الطريقة	ItemsCount	متوسط
ساذج	10000	66 719.1 ن
LINQ	10000	71 211.1 ن
المتجهات	10000	3 695.8 ن
Memcmp	10000	600.9 ن
الجوهرية	10000	1 607.5 ن

ساذج	100000	588 633.7 ن
LINQ	100000	651 191.3 ن
المتجهات	100000	34 659.1 ن
Memcmp	100000	5 513.6 ن
الجوهرية	100000	12078.9 ن

ساذج	1،000،000	5 637 293.1 ن
LINQ	1،000،000	6 622 666.0 ن
المتجهات	1،000،000	777 974.2 ن
Memcmp	1،000،000	361 704.5 ن
الجوهرية	1،000،000	434 252.7 ن

أعتقد أن كل الشفرة الخاصة بهذه الطرق مفهومة ، باستثناء سطرين في Intrinsics:

 var areEqual = Avx2.CompareEqual(va, vb); if (Avx2.MoveMask(areEqual) != equalsMask) { return false; }

في الأول ، يتم مقارنة متجهين من أجل المساواة ويتم تخزين النتيجة في متجه متساوي ، حيث يتم تعيين كل البتات على 1 في عنصر في موضع معين إذا كانت العناصر المقابلة في va و vb متساوية. اتضح أنه إذا كانت المتجهات من البايتة va و vb متساوية تمامًا ، فعندئذٍ تكون جميع العناصر مساوية لـ 255 (11111111b). بسبب Avx2.CompareEqual عبارة عن غلاف يحتوي على _mm256_cmpeq_epi8 ، ثم على موقع Intel على الويب يمكنك رؤية الكود الزائف لهذه العملية:
أسلوب MoveMask من ناقل يجعل رقم 32 بت. قيم البتات هي البتات العالية لكل عنصر من عناصر البايت البالغ عددها 32 عنصرًا في المتجه. يمكن العثور على الكود الكاذب هنا .

وبالتالي ، إذا لم تتطابق بعض البايتات في va و vb ، فعندها تكون البايتات المقابلة هي 0 ، وبالتالي فإن البتات الأكثر أهمية في هذه البايتات ستكون 0 أيضًا ، مما يعني أن البتات المقابلة في استجابة Avx2.MoveMask ستكون أيضًا 0 وستكون المقارنة أيضًا 0 مع equalsMask لن تعمل.

دعنا نحلل مثالًا صغيرًا ، على افتراض أن طول الموجه 8 بايت (لكتابته كان أقل):

اسمحوا va = {100 ، 10 ، 20 ، 30 ، 100 ، 40 ، 50 ، 100} ، و vb = {100 ، 20 ، 10 ، 30 ، 100 ، 40 ، 80 ، 90} ؛
ثم تكون Equal مساوية لـ {255، 0، 0، 255، 255، 255، 0، 0}؛
ستُرجع طريقة MoveMask 10011100b ، والتي ستحتاج إلى مقارنة مع القناع 11111111b ، لأن نظرًا لأن هذه الأقنعة غير متساوية ، فقد تبين أن المتجهات va و vb غير متساوية.

حساب عدد مرات حدوث عنصر في المجموعة

في بعض الأحيان يكون من الضروري حساب عدد المرات التي يتم فيها العثور على عنصر معين في مجموعة ما ، على سبيل المثال ، ints ، يمكن أيضًا تسريع هذه الخوارزمية. دعنا نكتب بعض الطرق للمقارنة ، سنبحث عن عنصر العنصر في صفيف الصفيف.

الأكثر وضوحا:

 public int Naive() { int result = 0; foreach (int i in Array) { if (i == Item) { result++; } } return result; }

باستخدام LINQ:

 public int LINQ() => Array.Count(i => i == Item);

باستخدام المتجهات من System.Numerics.Vectors:

 public int Vectors() { var mask = new Vector<int>(Item); int vectorSize = Vector<int>.Count; var accResult = new Vector<int>(); int i; var array = Array; for (i = 0; i < array.Length - vectorSize; i += vectorSize) { var v = new Vector<int>(array, i); var areEqual = Vector.Equals(v, mask); accResult = Vector.Subtract(accResult, areEqual); } int result = 0; for (; i < array.Length; i++) { if (array[i] == Item) { result++; } } result += Vector.Dot(accResult, Vector<int>.One); return result; }

باستخدام الجوهرية:

 public unsafe int Intrinsics() { int vectorSize = 256 / 8 / 4; //var mask = Avx2.SetAllVector256(Item); //var mask = Avx2.SetVector256(Item, Item, Item, Item, Item, Item, Item, Item); var temp = stackalloc int[vectorSize]; for (int j = 0; j < vectorSize; j++) { temp[j] = Item; } var mask = Avx2.LoadVector256(temp); var accVector = Vector256<int>.Zero; int i; var array = Array; fixed (int* ptr = array) { for (i = 0; i < array.Length - vectorSize; i += vectorSize) { var v = Avx2.LoadVector256(ptr + i); var areEqual = Avx2.CompareEqual(v, mask); accVector = Avx2.Subtract(accVector, areEqual); } } int result = 0; Avx2.Store(temp, accVector); for(int j = 0; j < vectorSize; j++) { result += temp[j]; } for(; i < array.Length; i++) { if (array[i] == Item) { result++; } } return result; }

نتيجة الاختبار على جهاز الكمبيوتر الخاص بي:

الطريقة	ItemsCount	متوسط
ساذج	1000	2 824.41 ن
LINQ	1000	12 138.95 ن
المتجهات	1000	961.50 ن
الجوهرية	1000	691.08 ن

ساذج	10000	27 072.25 ن
LINQ	10000	113 967.87 ns
المتجهات	10000	7 571.82 ن
الجوهرية	10000	4،296.71 ن

ساذج	100000	361 028.46 ن
LINQ	100000	1،091،994.28 ن
المتجهات	100000	82 839.29 ns
الجوهرية	100000	40 307.91 ن

ساذج	1،000،000	1 634 175.46 ns
LINQ	1،000،000	6 194 257.38 ns
المتجهات	1،000،000	583 901.29 ns
الجوهرية	1،000،000	413 520.38 ن

تتشابه طرق المتجهات والأصالة في المنطق تمامًا ، والاختلافات هي فقط في تنفيذ عمليات محددة. الفكرة ككل هي:

يتم إنشاء ناقل متجه يتم فيه تخزين العدد المطلوب في كل عنصر ؛
يتم تحميل جزء من المصفوفة في المتجه v ومقارنته مع القناع ، ثم يتم تعيين جميع البتات في عناصر متساوية في Equal ، لأن areEqual عبارة عن متجه من ints ، ثم إذا قمت بتعيين جميع وحدات بت عنصر واحد ، فسنحصل على -1 في هذا العنصر ((int) (1111_1111_1111_1111_1111_1111_1111_1111b) == -1) ؛
the vector areEqual يتم طرحها من accVector وبعد ذلك سيكون accVector هو مجموع عدد المرات التي حدث فيها عنصر العنصر في جميع المتجهات v لكل موقف (ناقص min يعطي زائد).

يمكن العثور على جميع التعليمات البرمجية من المقال على جيثب

الخاتمة

لقد درست جزءًا صغيرًا جدًا من الاحتمالات التي يوفرها .NET لحسابات البيانات. للحصول على قائمة كاملة وحديثة من العناصر الداخلية المتاحة في .NETCORE تحت x86 ، يمكنك الرجوع إلى التعليمات البرمجية المصدر . من المريح أنه في ملفات C # في ملخص كل مضمن ، يوجد اسم خاص به من عالم C ، مما يبسط فهم الغرض من هذا المضمون وترجمة خوارزميات C ++ / C الحالية إلى .NET. وثائق System.Numerics.Vector متاحة في msdn .

في رأيي ، .NET لديه ميزة كبيرة على C ++ ، لأنه يتم تجميع JIT بالفعل على جهاز العميل ، ثم يمكن للمترجم تحسين الكود لمعالج عميل معين ، مما يوفر أقصى أداء. في الوقت نفسه ، يمكن أن يظل مبرمج لكتابة التعليمات البرمجية السريعة في إطار لغة واحدة والتكنولوجيا.

محدث (09/15/2019):

كان هناك عضادة في المعايير

في المقاييس ، استخدمت IterationSetup ، والتي ، كما اتضح فيما بعد ، يمكن أن تؤثر بشكل كبير على أداء المعايير التي تنجح في أقل من 100 مللي ثانية. إذا أعدتها على GlobalSetup ، فستكون النتائج هكذا.

مجموع عناصر الصفيف:

الطريقة	ItemsCount	يعني	خطأ	Stddev	النسبة
ساذج	10	3.531 ن	0.0336 ن	0.0314 ن	1.00
LINQ	10	76.925 ن	0.4166 ن	0.3897 ن	21.79
المتجهات	10	2.750 ن	0.0210 ن	0.0196 ن	0.78
الجوهرية	10	6.513 ن	0.0623 ن	0.0582 ن	1.84

ساذج	100	47.982 ن	0.3975 ن	0.3524 ن	1.00
LINQ	100	590.414 ن	3.8808 ن	3.4402 ن	12.31
المتجهات	100	10.122 ن	0.0747 ن	0.0699 ن	0.21
الجوهرية	100	14.277 ن	0.0566 ن	0.0529 ن	0.30

ساذج	1000	569.910 ن	2.8297 ن	2.6469 ن	1.00
LINQ	1000	5658.570 ن	31.7465 ن	29.6957 ن	9.93
المتجهات	1000	79.598 ن	0.3498 ن	0.3272 ن	0.14
الجوهرية	1000	66.970 ن	0.3937 ن	0.3682 ن	0.12

ساذج	10000	5637.571 ن	37.5050 ن	29.2814 ن	1.00
LINQ	10000	5649887 ن	294.8776 ن	275.8287 ن	10.02
المتجهات	10000	772.900 ن	2.6802 ن	2.5070 ن	0.14
الجوهرية	10000	579.152 ن	2.8371 ن	2.6538 ن	0.10

ساذج	100000	56352.865 ن	230.7916 ن	215.8826 ن	1.00
LINQ	100000	56210.571 ن	3775.7631 ن	3،152.9332 ن	9.98
المتجهات	100000	8،389.647 ن	165.9590 ن	227.1666 ن	0.15
الجوهرية	100000	7،261.334 ن	89.6468 ن	69.9903 ن	0.13

مقارنة مجموعتين:

الطريقة	ItemsCount	يعني	خطأ	Stddev	النسبة
ساذج	10000	7033.8 ن	50.636 ن	47.365 ن	1.00
LINQ	10000	64841.4 ن	289.157 ن	270.478 ن	9.22
المتجهات	10000	504.0 ن	2.406 ن	2.251 ن	0.07
Memcmp	10000	368.1 ن	2.637 ن	2.466 ن	0.05
الجوهرية	10000	283.6 ن	1.135 ن	1.061 ن	0.04

ساذج	100000	85214.4 ن	903.868 ن	845.478 ن	1.00
LINQ	100000	702،279.4 ن	2846.609 ن	2662.720 ن	8.24
المتجهات	100000	5،179.2 ن	45.337 ن	42.409 ن	0.06
Memcmp	100000	4510.5 ن	24.292 ن	22.723 ن	0.05
الجوهرية	100000	297.0 نانوثانية	11.452 ن	10.712 ن	0.03

ساذج	1،000،000	844،006.1 ن	352.478 ن	3232.990 ن	1.00
LINQ	1،000،000	6،483،079.3 ن	4264.040 ن	39886.455 ن	7.68
المتجهات	1،000،000	54180.1 ن	357.258 ن	334.180 ن	0.06
Memcmp	1،000،000	49.480.1 ن	515.675 ن	457.133 ن	0.06
الجوهرية	1،000،000	36،633.9 ن	680.525 ن	636.564 ن	0.04

عدد تكرارات عنصر في صفيف

الطريقة	ItemsCount	يعني	خطأ	Stddev	النسبة
ساذج	10	8.844 ن	0.0772 ن	0.0603 ن	1.00
LINQ	10	87.456 ن	0.9496 ن	0.8883 ن	9.89
المتجهات	10	3.140 ن	0.0406 ن	0.0380 ن	0.36
الجوهرية	10	13.813 ن	0.0825 ن	0.0772 ن	1.56

ساذج	100	107.310 ن	0.6975 ن	0.6183 ن	1.00
LINQ	100	626.285 ن	5.7677 ن	5.3951 ن	5.83
المتجهات	100	11.844 ن	0.2113 ن	0.1873 ن	0.11
الجوهرية	100	19.616 ن	0.1018 ن	0.0903 ن	0.18

ساذج	1000	1،032.466 ن	6.3799 ن	5.6556 ن	1.00
LINQ	1000	6266.605 ن	42.68585 ن	39.9028 ن	6.07
المتجهات	1000	83.417 ن	0.5393 ن	0.4780 ن	0.08
الجوهرية	1000	88.358 ن	0.4921 ن	0.4603 ن	0.09

ساذج	10000	9،942.503 ن	47.9732 ن	40.0598 ن	1.00
LINQ	10000	62305.598 ن	643.8775 ن	502.6972 ن	6.27
المتجهات	10000	914.967 ن	7.2959 ن	6.8246 ن	0.09
الجوهرية	10000	931.698 ن	6.3444 ن	5.9346 ن	0.09

ساذج	100000	94،834.804 ن	793.8585 ن	703.7349 ن	1.00
LINQ	100000	626،620.968 ن	4669.9221 ن	4،393.5038 ن	6.61
المتجهات	100000	9000.827 ن	179.5351 ن	192.1005 ن	0.09
الجوهرية	100000	8690.771 ن	101.7078 ن	95.1376 ن	0.09

ساذج	1،000،000	959302.249 ن	4،268.2488 ن	3،783.6914 ن	1.00
LINQ	1،000،000	6،218،681.888 ن	31321.9277 ن	29298.5506 ن	6.48
المتجهات	1،000،000	99778.488 ن	1975.6001 ن	4،252.6877 ن	0.10
الجوهرية	1،000،000	96،449.350 ن	1117.8067 ن	978.5116 ن	0.10

لمحة صغيرة عن SIMD في .NET / C #

قليلا من التاريخ

تلخيص عناصر الصفيف

قارن بين صفيفين

حساب عدد مرات حدوث عنصر في المجموعة

الخاتمة

More articles: