آموزش محاسبه واریانس در پایتون

محاسبه واریانس در پایتون یکی از مهم‌ترین مفاهیم در تحلیل داده و آمار توصیفی است. واریانس نشان می‌دهد که داده‌ها تا چه اندازه از مقدار میانگین فاصله دارند و پراکندگی آن‌ها چگونه است. در واقع، واریانس به ما کمک می‌کند میزان نوسان داده‌ها را بهتر درک کنیم.

برای محاسبه واریانس در پایتون معمولاً از کتابخانه pandas استفاده می‌کنیم که علاوه بر واریانس، محاسبه انحراف معیار و چولگی (Skewness) را نیز به‌سادگی انجام می‌دهد.

اندازه گیری انحراف معیار در پایتون

انحراف معیار، ریشه دوم واریانس است. واریانس برابر است با میانگین مربع اختلاف هر مقدار در مجموعه داده از میانگین کل. در پایتون، این مقدار را با تابع std() از کتابخانه pandas محاسبه می‌کنیم:

خروجی کد بالا به صورت زیر است:

اندازه گیری چولگی در پایتون (Skewness)

چولگی معیاری است که نشان می‌دهد داده‌ها متقارن هستند یا به یک سمت متمایل شده‌اند.

  • اگر مقدار شاخص بین -1 و 1 باشد، توزیع داده‌ها متقارن است.

  • اگر مقدار شاخص کمتر یا مساوی -1 باشد، توزیع به سمت چپ متمایل است.

  • اگر مقدار شاخص بیشتر یا مساوی 1 باشد، توزیع به سمت راست متمایل است.

خروجی کد بالا به صورت زیر است:
در این مثال، توزیع Rating تقریباً متقارن است، اما توزیع Age به سمت راست متمایل می‌باشد.

با استفاده از pandas در پایتون، می‌توانیم به‌راحتی واریانس، انحراف معیار و چولگی داده‌ها را محاسبه کنیم. محاسبه واریانس به ما کمک می‌کند تا درک بهتری از میزان پراکندگی داده‌ها داشته باشیم و در کنار آن، با محاسبه انحراف معیار و چولگی، تحلیل کامل‌تری از داده‌ها ارائه دهیم.

به این مطلب امتیاز دهید

راستی! برای دریافت مطالب جدید در کانال تلگرام یا پیج اینستاگرام سورس باران عضو شوید.

دوره آموزش طراحی فروشگاه اینترنتی بدون کد نویسی در 8 ساعت
  • انتشار: ۲۱ مرداد ۱۴۰۴

دسته بندی موضوعات

آخرین محصولات فروشگاه

مشاهده همه

نظرات

بازخوردهای خود را برای ما ارسال کنید