آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون 

3 سال پیش
آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون 

آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون 

در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون خواهیم پرداخت.

پیشنهاد ویژه : پکیج آموزش صفر تا صد پایتون

هر زمان هر سازمانی نظرسنجی انجام می دهد، آنها سعی می کنند هرچه بیشتر اطلاعات را از مشتری جمع کنند، با این ایده که این اطلاعات در یک زمان دیگر برای سازمان مفید باشد. برای حل مشکل فعلی، ما باید اطلاعاتی را که مستقیماً با مشکل ما مرتبط هستند، جمع آوری کنیم.

نمایش تمام زمینه ها

اکنون بیایید ببینیم که چگونه می توان فیلدهای داده ای را که برای ما مفید هستند، انتخاب کرد. عبارت زیر را در ویرایشگر کد اجرا کنید.
In [6]: print(list(df.columns))

 

خروجی زیر را مشاهده خواهید کرد –
['age', 'job', 'marital', 'education', 'default', 'housing', 'loan', 
'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays', 
'previous', 'poutcome', 'emp_var_rate', 'cons_price_idx', 'cons_conf_idx', 
'euribor3m', 'nr_employed', 'y']

 

خروجی نام تمام ستون های پایگاه داده را نشان می دهد. ستون آخر “y” یک مقدار بولی است که نشان می دهد این مشتری سپرده مدت دار نزد بانک دارد یا خیر. مقادیر این قسمت یا “y” یا “n” است. می توانید شرح و هدف هر ستون را در پرونده bank-name.txt که به عنوان بخشی از داده بارگیری شده است ، بخوانید.

حذف زمینه های ناخواسته

با بررسی نام ستون ها ، خواهید فهمید که برخی از فیلدها هیچ اهمیتی برای مشکل موجود ندارند. به عنوان مثال، زمینه هایی مانند ماه ، روز_هفته ، کمپین و غیره هیچ فایده ای برای ما ندارد. ما این زمینه ها را از پایگاه داده خود حذف خواهیم کرد. برای رها کردن یک ستون، از دستور drop مانند شکل زیر استفاده می کنیم –
In [8]: #drop columns which are not needed.
   df.drop(df.columns[[0, 3, 7, 8, 9, 10, 11, 12, 13, 15, 16, 17, 18, 19]], 
   axis = 1, inplace = True)

 

این دستور می گوید که ستون شماره ۰ ، ۳ ، ۷ ، ۸ و غیره را رها کنید. برای اطمینان از اینکه فهرست به درستی انتخاب شده است ، از عبارت زیر استفاده کنید –
In [7]: df.columns[9]
Out[7]: 'day_of_week'

 

این نام ستون را برای فهرست داده شده چاپ می کند.
پس از رها کردن ستونهایی که لازم نیست، داده ها را با عبارت head بررسی کنید. خروجی صفحه در اینجا نشان داده شده است –
In [9]: df.head()
Out[9]:
      job   marital  default  housing  loan  poutcome    y
۰     blue-collar    married  unknown yes no nonexistent 0
۱     technician     married  no    no    no nonexistent 0
۲     management     single   no    yes   no success     1
۳     services       married  no    no    no nonexistent 0
۴     retired        married  no    yes   no success     1

 

اکنون، ما فقط زمینه هایی را داریم که احساس می کنیم برای تجزیه و تحلیل و پیش بینی داده های ما مهم هستند. اهمیت Data Scientist در این مرحله نمایان می شود. دانشمند داده ها باید ستون های مناسب را برای ساخت مدل انتخاب کند.
در درس بعدی، داده های خود را برای ساخت مدل آماده می کنیم.

لیست جلسات قبل آموزش رگرسیون لجستیک در پایتون

  1.  آموزش رگرسیون لجستیک در پایتون
  2. معرفی رگرسیون لجستیک در پایتون 
  3. آموزش مطالعه موردی رگرسیون لجستیک در پایتون 
  4. آموزش راه اندازی یک پروژه رگرسیون لجستیک در پایتون
  5. آموزش دریافت داده ها رگرسیون لجستیک در پایتون 
  6. آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون 
  7. آموزش آماده سازی داده ها رگرسیون لجستیک در پایتون
  8. آموزش تقسیم داده ها رگرسیون لجستیک در پایتون
  9. آموزش طبقه بندی کننده ساختمان رگرسیون لجستیک در پایتون 
  10. آموزش تست رگرسیون لجستیک در پایتون
  11. محدودیت های رگرسیون لجستیک در پایتون 
0
برچسب ها :
نویسنده مطلب erfan molaei

دیدگاه شما

بدون دیدگاه