محاسبه واریانس در پایتون یکی از مهمترین مفاهیم در تحلیل داده و آمار توصیفی است. واریانس نشان میدهد که دادهها تا چه اندازه از مقدار میانگین فاصله دارند و پراکندگی آنها چگونه است. در واقع، واریانس به ما کمک میکند میزان نوسان دادهها را بهتر درک کنیم.
برای محاسبه واریانس در پایتون معمولاً از کتابخانه pandas استفاده میکنیم که علاوه بر واریانس، محاسبه انحراف معیار و چولگی (Skewness) را نیز بهسادگی انجام میدهد.
اندازه گیری انحراف معیار در پایتون
انحراف معیار، ریشه دوم واریانس است. واریانس برابر است با میانگین مربع اختلاف هر مقدار در مجموعه داده از میانگین کل. در پایتون، این مقدار را با تابع std()
از کتابخانه pandas محاسبه میکنیم:
1 2 3 4 5 6 7 8 9 10 11 12 13 |
import pandas as pd #Create a Dictionary of series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack', 'Lee','Chanchal','Gasper','Naviya','Andres']), 'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])} #Create a DataFrame df = pd.DataFrame(d) # Calculate the standard deviation print df.std() |
خروجی کد بالا به صورت زیر است:
1 2 3 |
Age 7.265527 Rating 0.661628 dtype: float64 |
اندازه گیری چولگی در پایتون (Skewness)
چولگی معیاری است که نشان میدهد دادهها متقارن هستند یا به یک سمت متمایل شدهاند.
-
اگر مقدار شاخص بین
-1
و1
باشد، توزیع دادهها متقارن است. -
اگر مقدار شاخص کمتر یا مساوی
-1
باشد، توزیع به سمت چپ متمایل است. -
اگر مقدار شاخص بیشتر یا مساوی
1
باشد، توزیع به سمت راست متمایل است.
1 2 3 4 5 6 7 8 9 10 11 |
import pandas as pd #Create a Dictionary of series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack', 'Lee','Chanchal','Gasper','Naviya','Andres']), 'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])} #Create a DataFrame df = pd.DataFrame(d) print df.skew() |
1 2 3 |
Age 1.443490 Rating -0.153629 dtype: float64 |
با استفاده از pandas در پایتون، میتوانیم بهراحتی واریانس، انحراف معیار و چولگی دادهها را محاسبه کنیم. محاسبه واریانس به ما کمک میکند تا درک بهتری از میزان پراکندگی دادهها داشته باشیم و در کنار آن، با محاسبه انحراف معیار و چولگی، تحلیل کاملتری از دادهها ارائه دهیم.
راستی! برای دریافت مطالب جدید در کانال تلگرام یا پیج اینستاگرام سورس باران عضو شوید.
- انتشار: ۲۱ مرداد ۱۴۰۴
دسته بندی موضوعات
- آموزش ارز دیجیتال
- آموزش برنامه نویسی
- آموزش متنی برنامه نویسی
- اطلاعیه و سایر مطالب
- پروژه برنامه نویسی
- دوره های تخصصی برنامه نویسی
- رپورتاژ
- فیلم های آموزشی
- ++C
- ADO.NET
- Adobe Flash
- Ajax
- AngularJS
- apache
- ARM
- Asp.Net
- ASP.NET MVC
- AVR
- Bootstrap
- CCNA
- CCNP
- CMD
- CSS
- Dreameaver
- EntityFramework
- HTML
- IOS
- jquery
- Linq
- Mysql
- Oracle
- PHP
- PHPMyAdmin
- Rational Rose
- silver light
- SQL Server
- Stimulsoft Reports
- Telerik
- UML
- VB.NET&VB6
- WPF
- Xml
- آموزش های پروژه محور
- اتوکد
- الگوریتم تقریبی
- امنیت
- اندروید
- اندروید استودیو
- بک ترک
- بیسیک فور اندروید
- پایتون
- جاوا
- جاوا اسکریپت
- جوملا
- دلفی
- دوره آموزش Go
- دوره های رایگان پیشنهادی
- زامارین
- سئو
- ساخت CMS
- سی شارپ
- شبکه و مجازی سازی
- طراحی الگوریتم
- طراحی بازی
- طراحی وب
- فتوشاپ
- فریم ورک codeigniter
- فلاتر
- کانستراکت
- کریستال ریپورت
- لاراول
- معماری کامپیوتر
- مهندسی اینترنت
- هوش مصنوعی
- یونیتی
- کتاب های آموزشی
- Android
- ASP.NET
- AVR
- LINQ
- php
- Workflow
- اچ تی ام ال
- بانک اطلاعاتی
- برنامه نویسی سوکت
- برنامه نویسی موبایل
- پاسکال
- پایان نامه
- پایتون
- جاوا
- جاوا اسکریپت
- جی کوئری
- داده کاوی
- دلفی
- رباتیک
- سئو
- سایر کتاب ها
- سخت افزار
- سی اس اس
- سی پلاس پلاس
- سی شارپ
- طراحی الگوریتم
- فتوشاپ
- مقاله
- مهندسی نرم افزار
- هک و امنیت
- هوش مصنوعی
- ویژوال بیسیک
- نرم افزار و ابزار برنامه نویسی
- وردپرس