آموزش عملیات داده در پایتون

پایتون برای مدیریت داده‌ها در فرمت‌های مختلف، عمدتاً از دو کتابخانه Pandas و NumPy استفاده می‌کند. در بخش‌های قبل، ویژگی‌های مهم این دو کتابخانه را معرفی کردیم. در ادامه، برای درک بهتر مفهوم عملیات داده در پایتون، به بررسی چند مثال پایه‌ای از کتابخانه‌های Pandas و NumPy می‌پردازیم. این مثال‌ها به‌صورت عملی نشان می‌دهند چگونه می‌توان داده‌ها را پردازش و مدیریت کرد.

عملیات داده‌ای در NumPy

مهم‌ترین شیء تعریف‌شده در کتابخانه NumPy، نوع آرایه N-بعدی با نام ndarray است. این نوع آرایه مجموعه‌ای از عناصر با نوع داده یکسان را توصیف می‌کند. برای دسترسی به عناصر این مجموعه، از ایندکس‌گذاری صفر‌پایه استفاده می‌شود. نمونه‌ای از کلاس ndarray را می‌توان با استفاده از روش‌های مختلفی که در ادامه آموزش معرفی خواهند شد، ایجاد کرد. ساده‌ترین روش برای ایجاد این آرایه استفاده از تابع array در NumPy است که ساختار آن به صورت زیر است:

در ادامه، چند مثال کاربردی از نحوه مدیریت داده‌ها با استفاده از NumPy را بررسی می‌کنیم:

مثال 1: آرایه چند‌بعدی

نتیجه اجرای کد به شکل زیر خواهد بود:

[[1 2] [3 4]]

مثال 2: حداقل تعداد ابعاد

اجرای کد منجر به تولید خروجی زیر خواهد شد:

[[1 2 3 4 5]]

مثال 3: تعیین نوع داده

پس از اجرای کد، خروجی زیر را دریافت می‌کنیم:

[1.+0.j 2.+0.j 3.+0.j]

عملیات داده‌ای در Pandas

کتابخانه Pandas برای مدیریت داده‌ها از سه ساختار اصلی استفاده می‌کند: Series، DataFrame و Panel. در این بخش، نحوه عملکرد هرکدام را با ذکر مثال بررسی می‌کنیم.

Series در Pandas

ساختار Series در Pandas نوعی آرایه یک‌بعدی است که هر عنصر آن دارای یک برچسب (Index) اختصاصی است. این ساختار می‌تواند انواع مختلفی از داده‌ها مانند اعداد صحیح، رشته‌ها، اعداد اعشاری و حتی اشیای پایتون را نگهداری کند. ایندکس، مجموعه‌ای از برچسب‌هاست که برای شناسایی عناصر این آرایه به‌کار می‌رود.

برای ایجاد یک Series، می‌توان از سازنده (constructor) زیر استفاده کرد:

مثال: ایجاد Series از آرایه NumPy

نتیجه اجرای کد به شکل زیر خواهد بود:

DataFrame در Pandas

ساختار DataFrame یک جدول دوبعدی است که داده‌ها را به‌صورت ردیف‌ها و ستون‌ها نمایش می‌دهد. این ساختار برای تحلیل داده‌های ساخت‌یافته بسیار پرکاربرد است. برای ساخت یک DataFrame می‌توان از سازنده زیر استفاده کرد:

برای درک بهتر ساختار DataFrame، در این بخش مثالی با آرایه و ایندکس پیاده‌سازی می‌کنیم:
نمایش نهایی داده‌ها پس از اجرای کد به شکل زیر خواهد بود:

Panel در Pandas

در کتابخانه Pandas، Panel به‌عنوان یک ساختار سه‌بعدی برای نگهداری داده‌ها شناخته می‌شود. Panel Data مفهومی است که از اقتصادسنجی وارد حوزه تحلیل داده شده است. واژه pandas نیز از ترکیب حروف ابتدایی pan(el)-da(ta)-s شکل گرفته است.

برای ایجاد یک Panel، می‌توان از سازنده (constructor) زیر استفاده کرد:

در مثال زیر، یک Panel با استفاده از دیکشنری شامل دو شیء DataFrame ایجاد می‌کنیم. هر DataFrame به عنوان یکی از آیتم‌های Panel در نظر گرفته می‌شود:

نتیجه اجرای کد به صورت زیر خواهد بود:

5/5 - (1 امتیاز)

راستی! برای دریافت مطالب جدید در کانال تلگرام یا پیج اینستاگرام سورس باران عضو شوید.

دوره آموزش پروژه محور طراحی وب سایت پزشک یاب با بوت استرپ
  • انتشار: ۱۶ مرداد ۱۴۰۴

دسته بندی موضوعات

آخرین محصولات فروشگاه

مشاهده همه

نظرات

بازخوردهای خود را برای ما ارسال کنید