آموزش محاسبه گرایش به مرکز در پایتون

در ریاضیات، گرایش به مرکز (Central Tendency) یعنی اندازه‌گیری نقطه مرکزی یا محل تمرکز مقادیر در یک مجموعه داده. این مفهوم به ما نشان می‌دهد که مقدار میانگین داده‌ها چه عددی است و همچنین مشخص می‌کند که مقادیر تا چه حد در مجموعه پراکنده شده‌اند. با این تحلیل می‌توان احتمال قرار گرفتن یک ورودی جدید در مجموعه داده‌های موجود را بررسی کرد و در نتیجه، شانس موفقیت آن را سنجید.

سه شاخص اصلی برای سنجش گرایش به مرکز وجود دارد که با استفاده از متدهای موجود در کتابخانه pandas پایتون می‌توان آن‌ها را محاسبه کرد:

  1. میانگین (Mean): میانگین برابر است با حاصل تقسیم مجموع تمام مقادیر بر تعداد آن‌ها.

  2. میانه (Median): میانه مقداری است که پس از مرتب‌کردن داده‌ها به ترتیب صعودی یا نزولی، در وسط توزیع قرار می‌گیرد.

  3. مد (Mode): مد مقداری است که بیشترین تعداد تکرار را در یک توزیع دارد.

محاسبه میانگین و میانه با کتابخانه pandas

در کتابخانه pandas می‌توان با استفاده از توابع داخلی، این مقادیر را مستقیماً محاسبه کرد:

خروجی کد بالا به صورت زیر است:

محاسبه مد در پایتون (Mode)

وجود یا عدم وجود مد در یک توزیع به این بستگی دارد که داده‌ها پیوسته باشند یا خیر و این که آیا مقداری در داده‌ها بیشترین تکرار را دارد یا نه. در مثال زیر یک توزیع ساده داریم که در آن یک مقدار با بیشترین فراوانی وجود دارد و آن را به‌عنوان مد شناسایی می‌کنیم:

خروجی کد بالا به صورت زیر است:

محاسبه مد برای سنجش گرایش به مرکز در پایتون

در این خروجی، مقدار 25 به‌عنوان مد در ستون Age شناسایی شده است، زیرا بیشترین تکرار را دارد. ستون Name شامل چندین مقدار است که همه آن‌ها فراوانی یکسان و بالاترین را در این ستون دارند، بنابراین به‌صورت چند مد (Multimodal) نمایش داده شده‌اند.

5/5 - (1 امتیاز)

راستی! برای دریافت مطالب جدید در کانال تلگرام یا پیج اینستاگرام سورس باران عضو شوید.

دوره صفر تا صد آموزش بین المللی لینوکس
  • انتشار: ۲۱ مرداد ۱۴۰۴

دسته بندی موضوعات

آخرین محصولات فروشگاه

مشاهده همه

نظرات

بازخوردهای خود را برای ما ارسال کنید