کلاس و دوره آموزشی نیمه خصوصی مدیریت داده ها با نرم افزار R دوره پیشرفته با استاد محمدرضا نوربخش
ثبت نام در کلاس آنلاین نیمه خصوصی مدیریت داده ها با نرم افزار R دوره پیشرفته با قیمت مناسب که استاد محمدرضا نوربخش برگزار می کند.
برگزار کننده: استاد محمدرضا نوربخش زمان ثبت نام: 1403/08/16 00:00 - 1403/08/30 23:59 زمان برگزاری: 1403/09/01 18:00 - 1403/09/30 20:00 روزهای برگزاری: شنبه، دوشنبه و چهار شنبه ها ساعت 16 تا 18- توضیحات دوره
- سرفصل ها
- نظرات
Tidyverse یک کتابخانه از ابزارهای برنامهنویسی و تجزیه داده است که برای زبان برنامهنویسی R تشکیل شده است. این مجموعه ابزارها توسط Hadley Wickham و تیم توسعه tidyverse ایجاد شده است و شامل بسیاری از بستههای معروف R است که برای تحلیل و پردازش دادههای ساختاریافته (Structured Data) استفاده میشود.
پیشپردازش (Preprocessing) و آمادهسازی دادهها (data wrangling) مرحلهای بسیار مهم و ضروری در فرایند تحلیل، مدلسازی و مصورسازی دادهها است. در صورتی که آشنایی مقدماتی با نرمافزار R دارید میتوانید پیش از انجام هر پروژهای بر روی دادهها، با کمک کتابخانه tidyverse، مجموعه دادههای نامرتب را به سادگی به مجموعه دادههای مرتب با ساختاری مطلوب تبدیل نمایید. بیش از نیمی از وقت یک تحلیلگر داده صرف پاکسازی (data cleaning) و آمادهسازی دادهها از یک قالب داده «خام» به قالبی مناسبتر است؛ تا بتواند برای اهداف دیگر مانند تحلیل مورد استفاده قرار گیرد. اگر این مرحله به درستی صورت نگیرد میتواند بر دیگر مراحل تحلیل دادهها اثری نامطلوب داشته باشد. لذا آشنایی و توانایی استفاده از امکانات موجود در کتابخانه tidyverse که خود شامل چندین کتابخانهی سودمند در آمادهسازی و مصورسازی دادههاست؛ خصوصا برای افرادی که در زمینه علم داده فعالیت میکنند ضروری است.
به کمک امکاناتی که در این کتابخانه قرار داده شده است فرايند پیشپردازش و آمادهسازی دادهها به سرعت قابل انجام است. برای کسانی که تجربه کار با نرمافزارهای متنوع را دارند سادگی استفاده از امکانات tidyverse کاملا ملموس خواهد بود. در این دوره 12 ساعته یک آموزش ساده و گامبهگام در مورد آمادهسازی دادهها با کتابخانه قدرتمند Tidyverse را آموزش خواهیم داد. این دوره بر ضروریترین دستورات و عملکردهای این کتابخانه که اغلب مورد استفاده قرار میگیرند متمرکز است.
مدت زمان: 12 ساعت
پیش نیاز: آشنایی مقدماتی با نرمافزار R، مد یریت دادهها با نرمافزار R مقدماتی
هدف: آشنایی با بستههاي Tidyverse، تبدیل، خلاصه سازي، تغییر شکل و اتصال دادهها، ارتباط با منابع دادهاي دیگر، دادههاي آشیانی و تکرارها
منبع: کتاب R براي علم دادهها، نوشته هادلی ویکهام ،2023.
سرفصل:
· مرور دوره مدیریت دادهها مقدماتی
· وارد کردن و صادر کردن دادهها از (به) انواع منابع:csv با readr، اکسل با readxl، نرمافزارهاي آماري با haven، دادهاي وب با rvest
· کار با انواع دادهها: رشتهاي با stringr، عبارات با قاعده، فاکتورها با forcats، تاریخ و زمان با lubridate، مقادیر گم شده
· ارتباط با پایگاههاي داده
· دادههاي آشیانی و ستونهاي لیستی
· تکرارها با : purrr برنامه نویسی تابعی، ویرایش چند ستون، خواندن و کار با چند فایل، کار با دادههاي آشیانی
· تبدیل خروجی مدلهاي آماري به جدولهاي منظم با broom
· برنامه نویسی با Tidyverse