XMC4800E196K2048AAXQMA1: المعايير ، الطاقة والإنتاجية

تحدد الأداء والقدرة المقاسة ما إذا كانت وحدة MCU الصناعية 32-بت تلبي قيود النشر الحقيقية: تكشف مجموعات القياس مع ملفات الطاقة المنهجية عن حساب لكل واط، وعنق زجاجة الإدخال/الإخراج، وقابلية الشبكات. تركز هذه المقالة على اختبارات التحكم في وحدة المعالجة المركزية/الذاكرة/الإدخال/الإخراج، وقياسات الطاقة القابلة للتكرار، واختبارات نقل الإيثرنت وDMA، وتوصيات عملية للضبط لXMC4800E196K2048AAXQMA1.لتوجيه المقايضات الهندسية وخيارات النشر.

مقدمة (خطاف يحركه البيانات - 10-15 ٪ من المقالة)

XMC4800E196K2048AAXQMA1: المعايير والطاقة والإنتاج

النقطة: يحتاج المهندسون إلى دليل رقمي قبل ارتكاب MCU لتجميع أجهزة الاستشعار أو ربط البروتوكول أو أدوار حساب الحافة. الدليل: مزيج من CoreMark / Dhrystone ، و memcpy microbenchmarks ، واختبارات حزم DMA و Ethernet ، بالإضافة إلى تحديد ملامح نوم microamp ينتج عنه عرض كامل. شرح: توضح هذه المقالة الاختبارات الخاضعة للرقابة ، وأفضل ممارسات القياس ، وتفسير النتائج حتى تتمكن الفرق من تقييم زمن الوصول ، و MB / s ، microjoules-per-operation في ظل أعباء عمل واقعية لـXMC4800E196K2048AAXQMA1.

الخلفية & الميزات الرئيسية (الخلفية)

مواصفات رئيسية بسرعة (السريع، SRAM، الساعة القصوى، قنوات ADC، I/Os، العبوة)

نقطة: الحدود الأساسية للهاردوير تشكل سقف الاختبارات والحدود القوة. دليل: عدد النواة، الذاكرة الافتراضية، الذاكرة الافتراضية السريعة، الساعة والعدد المحيط يحددان الإنتاجية المحتملة لـ CoreMark/MHz، منافسة DMA، وتدفق العينة ADC. شرح: الجدول الموجز أدناه يسلط الضوء على المعاملات التي تؤثر مباشرة على التأخير في CPU، التأخير في الذاكرة، وتدفق المحيط للاستخدام السريع أثناء تصميم الاختبار.

المواصفات القيمة (نموذجي) التأثير
فلاش 2048 كيلوبايت الانتظارات الزمنية لـ Flash تؤثر على تأخير استدعاء الكود والعمليات الثقيلة على التفرعات
SRAM ~352 KB (على العبوة) يسمح بالأدوات الكبيرة، يقلل من حركة الذاكرة الخارجية
ماكس كوبر في الدوران تصل إلى 144 ميغاهيرتز (ورقة بيانات الجهاز) مقاييس مباشرة CoreMark والإنتاجية ما لم I / O-bound
الأساسية اللحاء M4 مع FPU وحدة FPU ترفع معدل نقل نواة FP وتقلل من عدد الدورات
DMA قنوات متعددة يسمح بنقل صفر وحدة المعالجة المركزية لـ memcpy وانفجارات المحيطية
الاتصالات إيثرنت ، SPI ، UART ، CAN يحدد الشبكات وسقوف الإجهاد الطرفية

يسلط الضوء على العمارة التي تؤثر على الأداء

النقطة: تعيين الميزات المعمارية اختناقات ملحوظة في microproparents. الأدلة: وجود FPU ، مصفوفة الحافلات ، محرك DMA ، ودورات تغيير مسبق الفلاش / التسارع / op والكمون. شرح: تنتج FPU انتصارات كبيرة للحبات ذات النقطة العائمة ؛ حافلة متعددة الماجستير و DMA الطرفية المنفصلة تقلل من أكشاك وحدة المعالجة المركزية ؛ فلاش الانتظار ٪ ٪ أو عدم وجود ذاكرة التخزين المؤقت زيادة التعليمات جلب الكمون وانخفاض CoreMark / MHz ما لم يتم نقل رمز حرجة إلى SRAM.

منهجية المعيار وإعداد الاختبار (تحليل البيانات)

بيئة الاختبار والتكرار

النقطة: تتطلب القياسات المتكررة أجهزة ومرافق ثابتة ومسجلات مسيطرة عليها. الدليل: استخدام لوحة تقييم قياسية أو ناقل مميز بشكل جيد ، وقياس التيار عن طريق شانت + ADC المعايرة أو مقياس الجانب العالي ، والتقاط السلوك العابر مع مسبار النطاق / التيار. شرح: قفل إعدادات الساعة ، وتحسينات المترجم ، وبناء الأعلام ؛ تسجيل درجة الحرارة المحيطة وتصفية سكة حديد الطاقة؛ تشغيل دورات التدفئة؛ سجل نتائج في CSV مع ختم زمني، معرف اختبار، وعينات متوسطة لضمان الصحة الإحصائية عبر التشغيلات.

أحمال العمل والمعايير والمقاييس المقاسة

نقطة: تلتقط مجموعة تمثيلية سلوك وحدة المعالجة المركزية والذاكرة والانقطاع والإدخال / الخروج. الدليل: الجمع بين CoreMark و Dhrystone لخط الأساس لجهاز المعالجة المركزية ، ونواة عدد صحيح / FP و memcpy للذاكرة ، واختبارات تأخير الانقطاع للقيود في الوقت الحقيقي ، و DMA ، وانفجارات SPI / UART وتدفقات حزمة إيثرنت للدخول / الخروج. التفسير: التقاط CoreMark / MHz ، Dhrystone DMIPS ، دورات / op ، تأخير في ميكروثانية ، ميغابايت / ثانية لـ DMA / إيثرنت ، والطاقة لكل عملية في ميكروج للسماح بتطبيع المنصات ومقارنات كفاءة الطاقة.

نتائج معايير وحدة المعالجة المركزية والذاكرة والإدخال/الخروج (تحليل البيانات)

أداء وحدة المعالجة المركزية: تفسير نتائج CoreMark / Dhrystone

النقطة: يجب تطبيع أرقام CoreMark الخام للكشف عن قدرة وحدة المعالجة المركزية الحقيقية. الأدلة: تقديم CoreMark المطلق جنبا إلى جنب مع CoreMark / MHz ، والإبلاغ عن حالات الانتظار الفلاش وإعدادات الساعة المستخدمة. شرح: تطبيع عبر معدلات الساعة وفلاش الانتظار SRAM الدول لتحديد خطوط الأنابيب أو أكشاك الذاكرة ؛ ملاحظة أن التعليمات البرمجية الثقيلة الفرع قد تكون محدودة عن طريق فلاش نقل الحلقات الساخنة إلى <unk> أو تمكين أوضاع التسارع غالبا ما يحسن الدرجات الطبيعية بشكل كبير.

الذاكرة ومعدل الإدخال/الإخراج: عرض نطاق ذاكرة الوصول العشوائي، ال DMA، والإجهاد المحيطي

النقطة: الذاكرة ومعدل النقل المحيطي يحددان أداء حركة البيانات المستدام. الأدلة: قياس معدل نقل البيانات لأحجام نقل مختلفة، وDMA مستمر في ميجابايت/ثانية تحت حمل وحدة المعالجة المركزية المتزامن، ومعدلات انفجار المحيطات ل SPI/UART. شرح: المخطط لمعدل النقل مقابل حجم النقل لإيجاد نقاط التقاطع حيث يتفوق DMA على عمليات النقل المدفوعة بالمعالج؛ سجل استخدام وحدة المعالجة المركزية أثناء النقل لكشف مساحة كبيرة لمعالجة التطبيقات أثناء نقل البيانات.

استهلاك الطاقة وتحليل الكفاءة (دليل الطريقة)

قياسات وضع الطاقة النشطة والخاملة والمنخفضة

نقطة: تعريف الطاقة عبر الأوضاع يكشف توفير الطاقة القابل للاستخدام. دليل: عينة كاملة الحمل النشط (أقصى ساعة + الأجهزة الطرفية) ، والعمل مع ساعات بوابة ، وأوضاع النوم العميق ؛ قوة الحساب (ميجاواط) من الجهد الحالي والسكك الحديدية المقاس والمتوسط على نوافذ مستقرة. تفسير: تجنب لقطات عينة واحدة - متوسط عبر الدورات المتكررة والتقاط العابرة. دقة قياس الوثيقة وطريقة أخذ العينات؛ توفير قالب جدول للتيار والجهد والطاقة المحسوبة لضمان تقارير قابلة للمقارنة.

الوضع الحالي (mA) الجهد (V) الطاقة (ميجاواط)
نشط (ماكس)
الخمول
نوم عميق

Energy-per-operation والمفاضلات (القوة مقابل الأداء)

النقطة: الطاقة لكل عملية توحد مقايضة الطاقة وفترة التأخير. الدليل: احسب E = القدرة × الوقت لكل عملية وطاقة الرسم مقابل معدل النقل أثناء ساعة المسح أو DVFS (إذا كان ذلك متاحا). الشرح: خفض الساعة غالبا ما يقلل من القدرة المطلقة لكنه قد يزيد الطاقة لكل مهمة إذا زاد وقت التنفيذ أكثر من انخفاض القدرة؛ تشمل النصائح العملية استخدام DMA، ودمج دفعات الإدخال/الإخراج، وتقليل الاستيقاظ لتقليل الطاقة لكل مهمة.

اختبارات الإنتاجية: إيثرنت ، دما ودراسة حالة في العالم الحقيقي (دراسة حالة + طريقة)

خطة اختبار وتفسير الإنتاجية للشبكات والإيثرنت

نقطة: يجب على اختبارات الشبكات عزل البروتوكول وحدة المعالجة المركزية. الأدلة: تشغيل تيارات TCP / UDP بأحجام حزمة مختلفة ، والنهج البديلة التي تدفعها الانقطاع مقابل النسخ الصفري ، وقياس فقدان الحزم والزعزعة والتكاليف العامة لوحدة المعالجة المركزية لكل ميغابايت في الثانية. تفسير: عرض الإنتاجية مقابل حجم الحزمة وحمل وحدة المعالجة المركزية مقابل الإنتاجية لتحديد النقطة التي تصبح فيها انقطاعات أو معالجة ذاكرة التخزين المؤقت مرتبطة بوحدة المعالجة المركزية؛ قياس دورات وحدة المعالجة المركزية لكل حزمة لتوجيه حجم المخزن المؤقت وقطع التجمع.

دراسة حالة صغيرة + قائمة تفتيش النشر (ضبط العالم الحقيقي)

نقطة: يعطي التنظيم العملي مكاسب قابلة للقياس في الإنتاجية والكفاءة. الأدلة: في مثال بوابة تجميع المستشعرات ، زاد تطبيق قنوات DMA ذات الأولوية ، وتجميع الانقطاعات ، وإعادة حجم المخازن المؤقتة من ميغابايت / ثانية مستمرة وتقليل حمولة وحدة المعالجة المركزية. تفسير: نشر قائمة التحقق إعطاء الأولوية لنقل التيارات الثابتة إلى DMA ، ووضع رمز حساس للتأخير في SRAM ، وتمكين التجميع المحيطي ، واختيار أوضاع النوم المناسبة ، وإضافة مراقبة وقت التشغيل لجهاز المعالجة المركزية والذاكرة والتيار للكشف عن الانحدارات في الميدان.

ملخص وملاحظات قابلة للتنفيذ (10-15٪ من المقالة)

نقطة: نقاط القوة والقيود المقاسة توجه خيارات التكامل لـXMC4800E196K2048AAXQMA1.. الدليل: يُظهر الاختبار إنتاجًا قويًا مدعومًا من DMA وحسابًا قويًا لكل واط عندما يكون الرمز الساخن في SRAM ويتم استخدام الرياضيات المعجلة FPU. التفسير: يجب على المهندسين أولاً تشغيل اختبارات إنتاجية CoreMark بالإضافة إلى memcpy و DMA خفيفة الوزن ، ثم تطبيق DMA ذي الأولوية ، وضبط المخزن المؤقت ، وتجميع المقاطعة للوصول إلى أداء Ethernet و I / O القابل للاستخدام.

  • قم بتشغيل CoreMark و memcpy microbials أولاً لإنشاء عرض النطاق الترددي CoreMark / MHz و RAM ؛ تتنبأ هذه الأرقام بالمساحة الخام للتحويل إلى البيانات.XMC4800E196K2048AAXQMA1..
  • استخدم DMA للتحويلات المستمرة ونقل الحلقات الحساسة للتأخير إلى ذاكرة الوصول العشوائي لتقليل آثار التأخير الفلاش وتحسين الإنتاجية الطبيعية تحت انقطاعات واقعية.
  • قياس الطاقة لكل عملية لتوازن تقليل الساعة مقابل زيادة وقت التشغيل؛ دفعة الإدخال / الخروج وتقليل الاستيقاظ إلى أقل ميكروج / أوب للنشر المحدود للبطارية.

أسئلة متكررة

ما هو المعيار الذي يجب علي تشغيله أولاً للتقييم المقارن؟

ابدأ باستخدام CoreMark على مدار الساعة الثابتة ومعيار صغير memcpy لالتقاط خط الأساس لوحدة المعالجة المركزية وعرض النطاق الترددي لذاكرة الوصول العشوائي. يكشف هذان الاختباران السريعان عما إذا كان الجهاز مرتبطًا بوحدة المعالجة المركزية أو الذاكرة ويوجهان ما إذا كان يجب تحديد أولويات نقل الكود أو DMA أو ضبط الساعة لمزيد من التنميط.

كيف يمكنني قياس قوة النتائج القابلة للتكرار؟

استخدم مقاومة تحويلة معايرة وADC مأخوذ عينات أو مقياس طاقة عالي الجانب، ومتوسط النقاط عبر عدة جولات، والتقاط الانتقالات باستخدام راسم الإشارة عند تحليل الإشارات الوقوة. سجل الظروف المحيطة، وفصل السكك الحديدية، ودقة أخذ العينات لضمان أن القياسات قابلة للمقارنة عبر الإعدادات.

أي ضبط ينتج أكبر مكاسب في الإنتاجية ؟

عادةً ما يوفر نقل الحالة المستقرة إلى DMA وتغيير حجم المخازن المؤقتة لمطابقة رشقات حزمة Ethernet أكبر تحسن مستدام في MB / s مع تحرير وحدة المعالجة المركزية لمنطق التطبيق. ادمج هذا مع دمج المقاطعة ووضع الحلقات الساخنة في SRAM للحصول على أفضل النتائج.

Top