کلاس و دوره آموزشی نیمه خصوصی مدیریت داده ها با نرم افزار R دوره مقدماتی با استاد محمدرضا نوربخش
ثبت نام در کلاس آنلاین نیمه خصوصی مدیریت داده ها با نرم افزار R دوره مقدماتی با قیمت مناسب که استاد محمدرضا نوربخش برگزار می کند.
برگزار کننده: استاد محمدرضا نوربخش زمان ثبت نام: 1403/08/16 00:00 - 1403/08/30 23:59 زمان برگزاری: 1403/09/01 18:00 - 1403/09/30 20:00 روزهای برگزاری: پنج شنبه و جمعه ها ساعت 8 تا 10- توضیحات دوره
- سرفصل ها
- نظرات
R یک زبان برنامهنویسی در جامعه علمی است که دارای محیط آماری برای تحلیل دادهها، مدلسازی، تجزیه و تحلیل آماری و تصویرسازی دادهها است که به صورت رایگان در دسترس قرار دارد و این اجازه را به کاربران میدهد تا با استفاده از کتابخانههای آماری و گرافیکی مختلف، به تحلیل دادههای خود بپردازند. در حالی که اکثریت قریب به اتفاق مردم از اکسل برای تجزیه و تحلیل و مدیریت داده ها استفاده می کنند،R مزایای بی شماری دارد از جمله:
۱- هزینه استفاده از R رایگان است!
۲- تحقیق قابل تکرار (مستند سازی، تکرار)
· تکرار
· کد + خروجی در یک سند
· دفعه بعدی راحت تر
· بسیاری از داستان های ترسناک اکسل از مطالعات علمی اشتباه وجود دارد
· مقیاس پذیری: قابل استفاده برای مسائل کوچک یا بزرگ
۳- R در انجمن ها
· R User Groups (شامل گروه های R-Ladies)
· Stack Overflow
۴- منابع یادگیری (کمی و کیفی)
· کتاب های R
· R Books که به صورت آنلاین و رایگان است.
۵- R در حال تبدیل شدن به قدرت جدیدی است. “اگر ما این چالش ها را نپذیریم، افراد دیگری که صلاحیت کمتری دارند، چالش را می پذیرند.”
چرا از نرم افزار R استفاده کنیم؟
علم داده در حال شکل دادن به روشی است که شرکت ها کسب و کار خود را اداره می کنند. بدون شک دور ماندن از هوش مصنوعی و ماشین باعث شکست این شرکت خواهد شد. سوال بزرگ این است که از کدام ابزار/زبان باید استفاده کنید؟ آن ها ابزارهای زیادی برای انجام تجزیه و تحلیل داده ها در بازار موجود هستند. یادگیری یک زبان جدید نیاز به سرمایه گذاری زمانی دارد. تصویر زیر منحنی یادگیری را در مقایسه با قابلیت تجاری یک زبان نشان می دهد. رابطه منفی به این معنی است که ناهار رایگان وجود ندارد. اگر میخواهید بهترین بینش را از دادهها به دست آورید، باید مدتی را صرف یادگیری ابزار مناسب کنید که R است.
وقتی صحبت از تجسم داده ها (DataViz) می شود، احتمالاً در مورد Tableau شنیده اید. Tableau بدون شک ابزاری عالی برای کشف الگوها از طریق نمودارها است. علاوه بر این، یادگیری Tableau زمان بر نیست. یکی از مشکلات بزرگ تجسم داده ها این است که ممکن است در نهایت هرگز الگوی پیدا نکنید یا فقط نمودارهای بی فایده زیادی ایجاد کنید. Tableau ابزار خوبی برای تجسم سریع داده ها یا هوش تجاری است. وقتی صحبت از آمار و ابزار تصمیم گیری می شود، R مناسب تر است. در علم داده، دو ابزار با یکدیگر رقابت می کنند. R و Python احتمالاً زبان برنامه نویسی هستند که علم داده را تعریف می کنند. R به دلیل استفاده از یک CPU در یک زمان مورد انتقاد قرار میگرفت. اکنون بستههای موازی به شما امکان می دهد وظایف را در هسته های مختلف دستگاه انجام دهید. به طور خلاصه، R یک ابزار عالی برای کاوش و بررسی داده ها است. تجزیه و تحلیل دقیق مانند خوشه بندی، همبستگی و کاهش دادهها با R انجام میشود. این مهمترین بخش است، بدون مهندسی ویژگی و مدل خوب، استقرار یادگیری ماشین نتایج معنی داری به همراه نخواهد داشت.
مدت زمان: 12 ساعت
پیش نیاز: آشنایی مقدماتی با نرمافزار R
هدف: آشنایی با بستههاي Tidyverse، تبدیل، خلاصه سازي، تغییر شکل و اتصال دادهها، ارتباط با منابع دادهاي دیگر، دادههاي آشیانی و تکرارها
منبع: کتاب R براي علم دادهها، نوشته هادلی ویکهام ،2023. (فایل کتاب در کارگاه در اختیار دانش پذیران قرار خواهد گرفت.)
سرفصل:
· مرور مقدماتی نرم افزار R
· مدیریت دادهها و ارتباط آن با بستههاي Tidyverse
· تبدیل دادهها با dplyr
· تبدیلات سطري: فیلتر کردن دادهها، مرتب سازي دادهها، انتخاب ردیفهاي یکتا
· تبدیلات ستونی: افزودن، انتخاب، تغییر نام و جابجایی متغیرها
· عملگر پایپ
· گروهبندي و خلاصه سازي
· دادههاي مرتب با tibble و tidyr
· تغییر شکل و چرخاندن دادهها
· وارد کردن و صادر کردن دادهها
· کار با انواع دادهها: منطقی، عددي، رشتهاي با stringr، عبارات با قاعده
· دادههاي رابطهاي با dplyr: تشخیص کلید اصلی
· پیوند دادهها: پیوندهاي جهشی، پیوندهاي فیلتري، پیوندهاي ناهمسان، عملگرهاي مجموعهاي