المنهجية
سيكون هذا الدورة تفاعلية للغاية مع مناقشات جماعية، دراسات الحالة، تمارين عملية، وأنشطة جماعية تكون في صميم التركيز.
أهداف الدورة
سيتمكن المشاركون في نهاية الدورة من:
- تصميم خطط تنفيذ البيانات الضخمة وإعداد استراتيجيات لحلول قائمة على البيانات
- شرح تحديات البيانات الضخمة والتقنيات التقليدية مثل إكسل
- مناقشة التحديات الرئيسية والفوائد للنظام البيئي هادوب والهياكل المعمارية الموزعة الأخرى للبيانات الضخمة
- استعراض ومناقشة التقنيات الرئيسية لتخزين ومعالجة البيانات الضخمة، مثل بوستغريسكيو ومونغو دي بي
- مناقشة خوارزميات التعلم الآلي الشهيرة وأهمية الأخلاق في تحليل البيانات والذكاء الصناعي
- تقديم مخطط معماري لحالات الاستخدام المركزة على التحليلات.
الفئات المستهدفة
هذه الدورة مثالية لمحللي البيانات، ومهندسي البيانات، وعلماء البيانات، وكذلك المحترفين الإداريين والإداريين الفنيين الذين يسعون لفهم استراتيجيات البيانات الضخمة والتكنولوجيات وحالات الاستخدام. الخلفية المفضلة المستدعاة تتضمن خبرة برمجية أساسية وتحليل البيانات باستخدام بايثون، معرفة بتقنيات قواعد البيانات الأساسية، والوعي بمبادرات الأعمال المدفوعة بالتحليلات.
الكفاءات المستهدفة
- ورش عمل عملي للبيانات الضخمة
- هياكل وتكنولوجيا تحليل البيانات الضخمة
- الأخلاق والنزاهة في تحليل البيانات الضخمة
- تخزين البيانات الضخمة وتنفيذ أنظمة الحوسبة
- تصميم مخطط الهندسة المعمارية
مقدمة في تحليل البيانات الضخمة
- ما هي البيانات الضخمة؟
- 5 "V" للبيانات الضخمة
- كيف ترتبط البيانات الضخمة بتحليل البيانات؟
- تأثير البيانات الضخمة على التقنيات
- ثورة المصدر المفتوح
- المفاهيم الرئيسية للبيانات الضخمة وأنواع البيانات
- النصوص والصوت والصور
- الأدوار المهنية المتعلقة بالبيانات الضخمة
- كيف يمكن لمشاريع البيانات الضخمة تلبية احتياجات المنظمة
- أمثلة على البيانات الضخمة:
- نيتفليكس، لينكد إن، فيسبوك، جوجل، أوربتز، ديل، وغيرها.
- أفضل ممارسات في تصميم المشاريع
- تقييم الحالة الحالية لمنظمتك
تخزين البيانات الضخمة
- هندسة البيانات الضخمة والنماذج الأساسية
- البيئة الخاصة بـ هادوب
- نظرة عامة على هادوب
- نظام ملفات هادوب الموزع (HDFS)
- معالجة موازية جدا (MPP) مقابل التطبيقات الموزعة في الذاكرة
- قواعد البيانات العلائقية مقابل قواعد البيانات غير العلائقية
- بوستغريسكيو، مونغو دي بي، كاساندرا
- بيانات البث المباشر
- مستودع البيانات مقابل سوق البيانات
حساب البيانات الضخمة
- كيفية الوصول إلى البيانات الضخمة
- دور الحوسبة السحابية
- مخاطر نقل البيانات
- الشبكات والتعاون المكاني
- استخراج البيانات الضخمة وتحويلها وتحميلها (ETL)
- تقنيات حساب البيانات الضخمة
- استمرارية هادوب
- MapReduce وما بعدها
- الحساب الموزع
- المجموعات العالية الأداء
- سبارك
- البث المباشر: ستورم، سبارك البث المباشر المنظم
- تقنيات أخرى للبيانات الضخمة: كافكا، وغيرها
- تطبيقات السحابة للبيانات الضخمة
مشاريع البيانات الضخمة
- أساسيات تحليل البيانات
- الأدوار والأهداف
- مفاهيم الرياضيات والإحصاء الرئيسية
- المراقبة مقابل عدم المراقبة
- التقنيات والتطبيقات الرئيسية
- استخراج القيمة من البيانات الضخمة
- 5 "أقلام" لعلم البيانات
- أهمية الأخلاق
- القابلية للبرمجة
تصميم حلول البيانات الضخمة
- تحديد الفرص التحليلية
- تعريف وتقييم المشكلة
- وصف تأثير واستخدام البيانات لمعالجة المشكلة
- تحديد مصادر البيانات المحتملة
- عقد جلسة تفكيرية لاستراتيجية التحليلات للتنفيذ
- التخزين والحساب
- تحديد استراتيجية بيئة السحابة
- عقد جلسة تفكيرية لأنظمة التخزين الرئيسية وبيئات الحساب