آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون

5 سال پیش

امتیاز دهید post

آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون

در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون خواهیم پرداخت.

پیشنهاد ویژه : پکیج آموزش صفر تا صد پایتون

هر زمان هر سازمانی نظرسنجی انجام می دهد، آنها سعی می کنند هرچه بیشتر اطلاعات را از مشتری جمع کنند، با این ایده که این اطلاعات در یک زمان دیگر برای سازمان مفید باشد. برای حل مشکل فعلی، ما باید اطلاعاتی را که مستقیماً با مشکل ما مرتبط هستند، جمع آوری کنیم.

نمایش تمام زمینه ها

اکنون بیایید ببینیم که چگونه می توان فیلدهای داده ای را که برای ما مفید هستند، انتخاب کرد. عبارت زیر را در ویرایشگر کد اجرا کنید.

In [6]: print(list(df.columns))

1	In [6]: print(list(df.columns))

خروجی زیر را مشاهده خواهید کرد –

['age', 'job', 'marital', 'education', 'default', 'housing', 'loan', 
'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays', 
'previous', 'poutcome', 'emp_var_rate', 'cons_price_idx', 'cons_conf_idx', 
'euribor3m', 'nr_employed', 'y']

['age', 'job', 'marital', 'education', 'default', 'housing', 'loan',

'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays',

'previous', 'poutcome', 'emp_var_rate', 'cons_price_idx', 'cons_conf_idx',

'euribor3m', 'nr_employed', 'y']

خروجی نام تمام ستون های پایگاه داده را نشان می دهد. ستون آخر “y” یک مقدار بولی است که نشان می دهد این مشتری سپرده مدت دار نزد بانک دارد یا خیر. مقادیر این قسمت یا “y” یا “n” است. می توانید شرح و هدف هر ستون را در پرونده bank-name.txt که به عنوان بخشی از داده بارگیری شده است ، بخوانید.

حذف زمینه های ناخواسته

با بررسی نام ستون ها ، خواهید فهمید که برخی از فیلدها هیچ اهمیتی برای مشکل موجود ندارند. به عنوان مثال، زمینه هایی مانند ماه ، روز_هفته ، کمپین و غیره هیچ فایده ای برای ما ندارد. ما این زمینه ها را از پایگاه داده خود حذف خواهیم کرد. برای رها کردن یک ستون، از دستور drop مانند شکل زیر استفاده می کنیم –

In [8]: #drop columns which are not needed.
   df.drop(df.columns[[0, 3, 7, 8, 9, 10, 11, 12, 13, 15, 16, 17, 18, 19]], 
   axis = 1, inplace = True)

In [8]: #drop columns which are not needed.

df.drop(df.columns[[0, 3, 7, 8, 9, 10, 11, 12, 13, 15, 16, 17, 18, 19]],

axis = 1, inplace = True)

این دستور می گوید که ستون شماره 0 ، 3 ، 7 ، 8 و غیره را رها کنید. برای اطمینان از اینکه فهرست به درستی انتخاب شده است ، از عبارت زیر استفاده کنید –

In [7]: df.columns[9]
Out[7]: 'day_of_week'

1 2	In [7]: df.columns[9] Out[7]: 'day_of_week'

این نام ستون را برای فهرست داده شده چاپ می کند.

پس از رها کردن ستونهایی که لازم نیست، داده ها را با عبارت head بررسی کنید. خروجی صفحه در اینجا نشان داده شده است –

In [9]: df.head()
Out[9]:
      job   marital  default  housing  loan  poutcome    y
0     blue-collar    married  unknown yes no nonexistent 0
1     technician     married  no    no    no nonexistent 0
2     management     single   no    yes   no success     1
3     services       married  no    no    no nonexistent 0
4     retired        married  no    yes   no success     1

In [9]: df.head()

Out[9]:

job marital default housing loan poutcome y

0 blue-collar married unknown yes no nonexistent 0

1 technician married no no no nonexistent 0

2 management single no yes no success 1

3 services married no no no nonexistent 0

4 retired married no yes no success 1

اکنون، ما فقط زمینه هایی را داریم که احساس می کنیم برای تجزیه و تحلیل و پیش بینی داده های ما مهم هستند. اهمیت Data Scientist در این مرحله نمایان می شود. دانشمند داده ها باید ستون های مناسب را برای ساخت مدل انتخاب کند.

در درس بعدی، داده های خود را برای ساخت مدل آماده می کنیم.

منبع.

لیست جلسات قبل آموزش رگرسیون لجستیک در پایتون

امتیاز دهید post

برچسب ها : آموزش برنامه نویسی پایتون آموزش رگرسیون لجستیک در پایتون

نویسنده مطلب saber

آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون

آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون

نمایش تمام زمینه ها

حذف زمینه های ناخواسته

لیست جلسات قبل آموزش رگرسیون لجستیک در پایتون

دیدگاه شما

بدون دیدگاه

آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون

نمایش تمام زمینه ها

حذف زمینه های ناخواسته

لیست جلسات قبل آموزش رگرسیون لجستیک در پایتون

دیدگاه شما

برای صرف‌نظر کردن از پاسخ‌گویی اینجا را کلیک نمایید.

بدون دیدگاه