1. إنتل تبدأ عهدًا جديدًا من الأداء المعزّز بإطلاقها معالجات Xeon Scalable من الجيل الثالث (Ice Lake)
أطلقت شركة Intel الجيل الثالث الجديد من سلسلة معالجات Intel Xeon القابلة للتوسيع (Ice Lake) هذا العام. وتتميز رقاقة الجيل الثالث هذه بتحسينات عديدة مقارنةً بسلسلة معالجات Xeon Scalable من الجيل السابق (Cascade Lake). وتشمل هذه التحسينات ما يلي:
ترقية عملية التصنيع (من 14 نانومترًا إلى 10 نانومترات) وزيادة الكثافة النظرية للترانزستورات (بمقدار 2.7 ضعف).
ترقية البنية الدقيقة وتحسين عدد التعليمات المنفذة خلال دورة الساعة (IPC) (بمقدار 20%).
زيادة الحد الأقصى لعدد النوى (من 28 إلى 40)، وتحسين مجموعات تعليمات AVX2/AVX512، وزيادة سعة ذاكرة التخزين المؤقت من المستوى الثالث (L3) لكل نواة (من 1.375 ميغابايت إلى 1.5 ميغابايت).
التحسين الكبير في أداء الإدخال والإخراج، وزيادة عدد قنوات الذاكرة (من 6 إلى 8)، واختزال زمن الوصول إلى الذاكرة. وشهد بروتوكول PCIe ترقية من PCIe 3.0 إلى PCIe 4.0. وطرأ تحسّن طفيف أيضًا على عرض النطاق الترددي لناقل UPI.
السؤال الذي يطرح نفسه؛ هل ستثمر كل هذه التحسينات في أداء الأجهزة تعزيزًا في أداء التطبيقات، لا سيما فيما يتعلق بتطبيقات التنبؤ بالطقس والمناخ التي تتطلب عددًا كبيرًا من نوى وحدة المعالجة المركزية للحوسبة المتوازية واسعة النطاق؟ إن تطبيقات التنبؤ بالطقس والمناخ لها قيمة BF Ratio عالية نسبيًا بوجه العموم، ومعنى ذلك أن أداء هذه التطبيقات يعتمد إلى حد كبير على عرض النطاق الترددي للذاكرة وعدد عمليات النقطة العائمة في الثانية (FLOPS). والتحسينات المذكورة آنفًا التي شهدتها معالجات Xeon Scalable من الجيل الثالث تصب في مصلحة هذه التطبيقات بالتحديد، ولذا فإنها تشكل إضافة مذهلة حقًا طال انتظارها. ونخص بالذكر ارتفاع عدد عمليات النقطة العائمة في الثانية (FLOPS)، الذي يعود الفضل في تحقيقه إلى تحسين مجموعات تعليمات AVX وزيادة عرض النطاق الترددي للذاكرة نتيجةً لإضافة المزيد من قنوات الذاكرة. إذًا، كيف تحسّن معالجات Xeon Scalable من الجيل الثالث أداء تطبيقات التنبؤ بالمناخ والطقس مقارنة بالجيل السابق من معالجات Intel؟ لقد نفّذنا عملية تقييم وتحليل بالاستعانة بالعديد من النماذج المستخدمة على نطاق واسع للتنبؤ بالطقس والمناخ، منها نموذج WRF (أبحاث الطقس والتنبؤ به)، وMPAS-A (نموذج التنبؤ عبر المقاييس والغلاف الجوي)، وCESM (نموذج نظام الأرض المجتمعي).
في اختبار المقارنة التالي، أنشأنا بيئة اختبار في مختبر HPC التابع لشركة كايتوس لتطبيقات مختلفة، واعتمدنا على نقاط حوسبة تستخدم المعالجات 6230 و6248 و6258R ضمن سلسلة معالجات Xeon Scalable من الجيل الثاني (Cascade Lake) والمعالج 8358 ضمن سلسلة معالجات Xeon Scalable من الجيل الثالث (Ice Lake).
2. مقارنة أداء نموذج أبحاث الطقس والتنبؤ به (WRF)
نبذة عن نموذج أبحاث الطقس والتنبؤ به (WRF)
نموذج أبحاث الطقس والتنبؤ به (WRF) نظام متوسط النطاق من الجيل التالي للتنبؤ العددي بالطقس، وهو مصمم لكل من أبحاث الغلاف الجوي وتطبيقات التنبؤ التشغيلية. وهو ثمرة عمل مشترك بين المركز الوطني لأبحاث الغلاف الجوي (NCAR)، والإدارة الوطنية للمحيطات والغلاف الجوي (ممثلة بالمراكز الوطنية للتنبؤ البيئي (NCEP) ومختبر أبحاث نظام الأرض)، والقوات الجوية الأمريكية، ومختبر الأبحاث البحرية، وجامعة أوكلاهوما، وإدارة الطيران الفيدرالية (FAA).
حالة اختبار نموذج أبحاث الطقس والتنبؤ به (WRF)
يعرض الجدول 1 منطقة نطاق المحاكاة، والدقة الزمانية والمكانية لحالة اختبار نموذج أبحاث الطقس والتنبؤ به (WRF). وهو يعتمد على التشغيل ثنائي النطاق. يبلغ حجم النطاق الخشن (منخفض الدقة) والناعم (عالي الدقة) 425×300 و1150×802 بدقة 12 كم و4 كم وخطوة زمنية تبلغ 30 ث و10 ث على التوالي. كان عدد الطبقات الرأسية 35. وكان وقت التنبؤ 3 ساعات، وكان إخراج البيانات يحدث كل 3 ساعات.
نتائج اختبار أداء نموذج أبحاث الطقس والتنبؤ به (WRF)
اختبرنا أداء نموذج أبحاث الطقس والتنبؤ به (WRF) على معالج Intel 6230 Cascade Lake ومعالج 8358 Ice Lake باستخدام 224 نواة. عمل نموذج أبحاث الطقس والتنبؤ به (WRF) لمدة 695 ثانية على منصة المعالج 6230 و489 ثانية على منصة المعالج 8358، مع زيادة في الأداء بنسبة 42% على المنصة الثانية (انظر الشكل 1). يرجع السبب في ذلك إلى حد كبير إلى أن نموذج أبحاث الطقس والتنبؤ به (WRF) تطبيق مرتبط بالحوسبة والذاكرة، وأدت بنية الذاكرة المكونة من 8 قنوات لمعالج Ice Lake إلى تحسين عرض النطاق الترددي للذاكرة. بالإضافة إلى ذلك، ساهم ارتفاع عدد عمليات النقطة العائمة في الثانية (FLOPS) والوصول منخفض التأخير إلى الذاكرة إلى حد كبير في تحسين أداء نموذج أبحاث الطقس والتنبؤ به (WRF) العامل على منصة المعالج 8358.
الشكل 1. مقارنة أداء نموذج أبحاث الطقس والتنبؤ به (WRF) على منصتي المعالجين 6230 و8358
3. مقارنة أداء نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A)
نبذة عن نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A)
أُنشئ نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) (نموذج التنبؤ عبر المقاييس والغلاف الجوي) تحت قيادة المركز الوطني لأبحاث الغلاف الجوي، وهو نموذج للتنبؤ عبر النطاق يحل معادلات الحركة غير الهيدروستاتيكية القابلة للضغط بالكامل. يستخدم النموذج شبكة Voronoi مركزية غير منظمة (انظر الشكل 2) وتداخل الشبكة C لمتغيرات الحالة أساسًا للتجزئة الأفقية. ويمكن إنشاء الشبكات غير المنظمة ذات الدقة المتغيرة بإزاحة شبكية متباينة بسلاسة بحيث يمكن أن تتمتع نطاقات المحاكاة الرئيسية بدقة عالية ويتسنى تجنّب التغيرات المفاجئة في المقادير الفيزيائية بالقرب من الحدود.
حالة اختبار نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A)
حالة اختبار نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) محاكاة للطقس العالمي بدقة مكانية تبلغ 60 كم وبخطوة زمنية تساوي 360 ثانية. زمن التنبؤ ساعتان، ويضم 55 طبقة رأسية.
الشكل 2. شبكة MPAS Voronoi متغيرة الدقة من موقع MPAS-A الرسمي
نتائج اختبار نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A)
اختبرنا أداء نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) على معالج Intel 6230 Cascade Lake ومعالج 8358 Ice Lake باستخدام 320 نواة. عمل نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) لمدة 26.5 ثانية على منصة المعالج 6230 و15.5 ثانية على منصة المعالج 8358، مع زيادة في الأداء بنسبة 71% على المنصة الثانية (انظر الشكل 3). نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) تطبيق مرتبط بالذاكرة، شأنه شأن نموذج أبحاث الطقس والتنبؤ به (WRF). لذلك، ساعدت زيادة عدد قنوات الذاكرة في المعالج 8358 أيضًا على تعزيز أداء نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A).
يعرض الشكل 4 مقارنة بين عدد عمليات النقطة العائمة في الثانية (FLOPS) آنيًا وعرض النطاق الترددي للذاكرة على عقدة حوسبة واحدة لحالة اختبار نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) التي تعمل على منصتي المعالجين 6230 و8358. وكما نرى في الشكل، يقدّم نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) الذي يعمل على منصة المعالج 8358 أداءً أعلى بكثير من منصة المعالج 6230 بفضل التحسّن الكبير في عدد عمليات النقطة العائمة في الثانية (FLOPS) وعرض النطاق الترددي للذاكرة. علاوةً على ذلك، كانت نسبة BF لنموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) تساوي 2.55 تقريبًا على منصة المعالج 6230 و2.40 تقريبًا على منصة المعالج 8358. ويُعزى السبب في الانخفاض الطفيف للنسبة BF على منصة المعالج 8358 إلى انخفاض معدل الخطأ في LLC الناتج عن ذاكرة التخزين المؤقت L3 الإضافية لكل نواة.
الشكل 3. مقارنة أداء نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) على منصتي المعالجين 6230 و8358
الشكل 4. مقارنة بين عدد عمليات النقطة العائمة في الثانية (FLOPS) آنيًا وعرض النطاق الترددي للذاكرة على عقدة حوسبة واحدة لحالة اختبار نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) التي تعمل على منصتي المعالجين 6230 و8358
4. مقارنة أداء نموذج نظام الأرض المجتمعي (CESM)
نبذة عن نموذج نظام الأرض المجتمعي (CESM)
نموذج نظام الأرض المجتمعي (CESM) نموذج مناخي مقترن لمحاكاة النظام المناخي للأرض. ويتألف نموذج نظام الأرض المجتمعي (CESM) من نماذج منفصلة تحاكي في الوقت نفسه الغلاف الجوي للأرض والمحيطات والأرض وجليد اليابسة وجليد البحر، بالإضافة إلى مكون مقرن مركزي واحد، ويسمح للباحثين بإجراء بحث أساسي في الحالات المناخية للأرض في الماضي والحاضر والمستقبل. وتدعم المؤسسة الوطنية للعلوم (NSF) نموذج نظام الأرض المجتمعي (CESM) في المقام الأول ويعمل على صيانته مختبر المناخ والديناميكيات العالمية (CGD) في المركز الوطني لأبحاث الغلاف الجوي.
حالة اختبار نموذج نظام الأرض المجتمعي (CESM)
في هذا الاختبار، يقترن نموذج نظام الأرض المجتمعي (CESM) بالكامل مع الشبكة f19_g16. ومدة التنبؤ عام واحد.
نتائج اختبار أداء نموذج نظام الأرض المجتمعي (CESM)
أُنجزَ الاختبار على معالج 8358 Ice Lake وثلاثة معالجات Cascade Lake، بما فيها المعالجات 6248 و6230 و6258R باستخدام عقدة واحدة. وقد حقّق نموذج نظام الأرض المجتمعي (CESM) أداءً أعلى بكثير على منصة معالج 8358 Ice Lake منه على معالجات Cascade Lake. وارتفع الأداء بنسبة 94% بالمقارنة مع المعالج 6230 و83% بالمقارنة مع المعالج 6248 و65% بالمقارنة مع المعالج 6258R. لنموذج نظام الأرض المجتمعي (CESM) نسبة BF قريبة من 1 وهو مرتبط بالإدخال والإخراج ومرتبط بالاتصال. ولهذا السبب، تعذّر وصول زيادة النشاط إلى قيمة خطية مثالية وستنخفض إلى حد ما، ولكنها قد تصل إلى 83% (مقارنة بالمعالج 6248) و94% (مقارنة بالمعالج 6230).
الشكل 5. مقارنة أداء نموذج نظام الأرض المجتمعي (CESM) على منصات معالجات مختلفة
5. الخلاصة
بفضل التحسينات الرائعة على الجيل الثالث الجديد لمعالجات Xeon القابلة للتوسيع (Ice Lake) من Intel، بما في ذلك زيادة عدد قنوات الذاكرة ومجموعات تعليمات AVX2/AVX512 المحسنة، وبالنظر إلى نسبة BF العالية في تطبيقات التنبؤ بالطقس والمناخ، اختبرنا العديد من التطبيقات المستخدمة على نطاق واسع وحللناها، بما في ذلك نموذج أبحاث الطقس والتنبؤ به (WRF) ونموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) ونموذج نظام الأرض المجتمعي (CESM) على مجموعات الحوسبة عالية الأداء المُنشأة بواسطة معالج Xeon من الجيل الثالث القابل للتوسيع، وأجرينا مقارنة مع معالجات Xeon من الجيل الثاني. عند استخدام العدد نفسه من النوى، تحسّن أداء نموذج أبحاث الطقس والتنبؤ به (WRF) بنسبة 42% وتحسّن أداء نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) بنسبة 71% على منصة معالج Lake 8358 بالمقارنة مع منصة معالج Cascade Lake 6230. يُعزى ذلك إلى حد كبير إلى أن WRF تطبيق مرتبط بالحوسبة والذاكرة، وإلى أن نموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) تطبيق مرتبط بالذاكرة أيضًا. وحسّنت بنية الذاكرة من 8 قنوات لمعالج Ice Lake عرض النطاق الترددي للذاكرة. بالإضافة إلى ذلك، حسّن ارتفاع عدد عمليات النقطة العائمة في الثانية (FLOPS) والوصول منخفض التأخير إلى الذاكرة إلى حد كبير في أداء نموذج أبحاث الطقس والتنبؤ به (WRF) ونموذج التنبؤ عبر المقاييس والغلاف الجوي (MPAS-A) العاملين على منصة المعالج 8358. أما بالنسبة إلى نموذج نظام الأرض المجتمعي (CESM) غير المرتبط بعرض النطاق الترددي للذاكرة، فإن التزايد الملحوظ لعرض النطاق الترددي للذاكرة وعدد عمليات النقطة العائمة في الثانية (FLOPS) لمعالج Ice Lake أديا إلى زيادة أداء نموذج نظام الأرض المجتمعي (CESM) بنسبة 82.7% عن المعالج 6248، و94.1% عن المعالج 6230.
تستخدم كايتوس ملفات تعريف الارتباط للتمكين من استخدام الموقع الإلكتروني وتحسينه، وتخصيص المحتوى، وتحليل استخدام الموقع الإلكتروني. للحصول على المزيد سياسة الخصوصية يُرجى الاطلاع على من المعلومات.