- المدة الزمنية : 8 أسابيع طويلة
- الالتزام بالوقت: 1-2 ساعة في الأسبوع
- موضوع : علوم البيانات
ما ستتعلمه
- استيراد البيانات إلى R من تنسيقات الملفات المختلفة
- تجريف على شبكة الإنترنت
- كيفية ترتيب البيانات باستخدام tidyverse لتسهيل التحليل بشكل أفضل
- معالجة السلاسل باستخدام التعبيرات العادية (التعبير العادي)
- بيانات التشاجر باستخدام dplyr
- كيفية العمل مع التواريخ والأوقات بتنسيقات الملفات والتنقيب عن النص
وصف الدورة التدريبية
في هذه الدورة التدريبية ، وهي جزء من برنامج الشهادة الاحترافية في علوم البيانات ، فإننا نغطي العديد من الخطوات القياسية لعملية تشاحن البيانات مثل استيراد البيانات إلى R ، وتنظيم البيانات ، ومعالجة السلسلة ، وتحليل HTML ، والعمل مع التواريخ والأوقات ، واستخراج النص. نادرًا ما تكون جميع خطوات المشاحنات هذه ضرورية في تحليل واحد ، ولكن من المرجح أن يواجهها عالم البيانات جميعًا في مرحلة ما.
نادرًا ما يمكن الوصول إلى البيانات بسهولة في مشروع علوم البيانات. من المرجح أن تكون البيانات في ملف أو قاعدة بيانات أو مستخرجة من مستندات مثل صفحات الويب أو التغريدات أو ملفات PDF. في هذه الحالات ، الخطوة الأولى هي استيراد البيانات إلى R وترتيب البيانات ، باستخدام الحزمة tidyverse. تسمى الخطوات التي تحول البيانات من شكلها الخام إلى النموذج المرتبط رانق البيانات.
هذه العملية هي خطوة حاسمة لأي عالم بيانات. ستمكّنك معرفة كيفية تشابك البيانات وتنظيفها من تكوين رؤى مهمة قد تكون مخفية.
نادرًا ما يمكن الوصول إلى البيانات بسهولة في مشروع علوم البيانات. من المرجح أن تكون البيانات في ملف أو قاعدة بيانات أو مستخرجة من مستندات مثل صفحات الويب أو التغريدات أو ملفات PDF. في هذه الحالات ، الخطوة الأولى هي استيراد البيانات إلى R وترتيب البيانات ، باستخدام الحزمة tidyverse. تسمى الخطوات التي تحول البيانات من شكلها الخام إلى النموذج المرتبط رانق البيانات.
هذه العملية هي خطوة حاسمة لأي عالم بيانات. ستمكّنك معرفة كيفية تشابك البيانات وتنظيفها من تكوين رؤى مهمة قد تكون مخفية.
https://www.edx.org/course/data-science-wrangling