آموزش آماده سازی داده ها در پایتون: ادغام، گروه بندی و اتصال

پردازش داده یا Data Wrangling شامل آماده سازی و تغییر داده‌ها در قالب های مختلف مانند ادغام (merging)، گروه بندی (grouping)، اتصال (concatenating) و سایر روش ها است تا بتوان آن ها را تحلیل کرد یا برای استفاده در کنار مجموعه داده‌های دیگر آماده نمود. زبان پایتون ابزارهای داخلی متعددی برای اجرای این روش ها روی انواع مجموعه داده‌ها دارد تا به اهداف تحلیلی برسیم. در این بخش، چند مثال عملی برای توضیح این روش ها بررسی می کنیم.

ادغام داده‌ها (Merging Data)

کتابخانه Pandas در پایتون یک تابع واحد به نام merge را به عنوان نقطه ورود برای همه عملیات استاندارد اتصال پایگاه داده بین اشیای DataFrame ارائه می دهد:

در مثال زیر، دو DataFrame مختلف ایجاد می کنیم و عملیات ادغام را روی آن ها انجام می دهیم:

کد بالا خروجی زیر را تولید می کند:

گروه بندی داده‌ها (Grouping Data)

گروه بندی داده‌ها یک نیاز رایج در تحلیل داده است، زمانی که بخواهیم نتایج را بر اساس گروه های مختلف موجود در مجموعه داده مشاهده کنیم. Pandas توابع داخلی برای تقسیم داده به گروه های مختلف دارد.

در مثال زیر، داده‌ها را بر اساس سال گروه بندی می کنیم و سپس داده‌های مربوط به یک سال خاص را استخراج می کنیم:

کد بالا خروجی زیر را تولید می کند:

اتصال داده‌ها (Concatenating Data)

Pandas ابزارهای متنوعی برای ترکیب آسان Series، DataFrame و Panel ارائه می دهد. در مثال زیر، تابع concat عملیات اتصال را در امتداد یک محور انجام می دهد.

کد بالا خروجی زیر را تولید می کند:
 

5/5 - (1 امتیاز)

راستی! برای دریافت مطالب جدید در کانال تلگرام یا پیج اینستاگرام سورس باران عضو شوید.

آموزش پروژه محور طراحی سایت با پایتون و جنگو مختص بازار کار
  • انتشار: ۱۹ مرداد ۱۴۰۴

دسته بندی موضوعات

آخرین محصولات فروشگاه

مشاهده همه

نظرات

بازخوردهای خود را برای ما ارسال کنید