آموزش تقسیم داده ها رگرسیون لجستیک در پایتون

5 سال پیش

امتیاز دهید post

آموزش تقسیم داده ها رگرسیون لجستیک در پایتون

در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش تقسیم داده ها رگرسیون لجستیک در پایتون خواهیم پرداخت.

پیشنهاد ویژه : پکیج آموزش طراحی وب سایت با پایتون

ما حدود چهل و یک هزار رکورد عجیب داریم. اگر از کل داده ها برای ساخت مدل استفاده کنیم ، هیچ داده ای برای آزمایش باقی نمی ماند. بنابراین به طور کلی، ما کل مجموعه داده ها را به دو قسمت تقسیم می کنیم ، مثلاً 70/30 درصد. ما از 70٪ داده ها برای ساخت مدل و مابقی برای آزمایش دقت در پیش بینی مدل ایجاد شده استفاده می کنیم. بنا به نیاز خود ممکن است از نسبت تقسیم متفاوت استفاده کنید.

ایجاد ویژگی های آرایه

قبل از اینکه داده ها را تقسیم کنیم ، داده ها را به دو آرایه X و Y جدا می کنیم. آرایه X شامل تمام ویژگی هایی (ستون داده) است که می خواهیم تجزیه و تحلیل کنیم و آرایه Y یک آرایه تک بعدی از مقادیر بولی است که خروجی آن است پیش بینی برای درک این موضوع ، اجازه دهید برخی از کدها را اجرا کنیم.

ابتدا دستور Python زیر را برای ایجاد آرایه X اجرا کنید –

In [17]: X = data.iloc[:,1:]

1	In [17]: X = data.iloc[:,1:]

برای بررسی محتویات X برای چاپ چند رکورد اولیه از head استفاده کنید. صفحه زیر محتویات آرایه X را نشان می دهد.

In [18]: X.head ()

1	In [18]: X.head ()

Initial Records

آرایه دارای چندین ردیف و 23 ستون است.

بعد ما آرایه خروجی ایجاد خواهیم کرد که شامل مقادیر “y” است.

ایجاد آرایه خروجی

برای ایجاد یک آرایه برای ستون مقدار پیش بینی شده ، از عبارت Python زیر استفاده کنید –

In [19]: Y = data.iloc[:,0]

1	In [19]: Y = data.iloc[:,0]

با فراخوانی head محتوای آن را بررسی کنید. خروجی صفحه زیر نتیجه را نشان می دهد –

In [20]: Y.head()
Out[20]: 0   0
1    0
2    1
3    0
4    1
Name: y, dtype: int64

In [20]: Y.head()

Out[20]: 0 0

1 0

2 1

3 0

4 1

Name: y, dtype: int64

اکنون داده ها را با استفاده از دستور زیر تقسیم کنید –

In [21]: X_train, X_test, Y_train, Y_test = train_test_split(X, Y, random_state=0)

1	In [21]: X_train, X_test, Y_train, Y_test = train_test_split(X, Y, random_state=0)

با این کار چهار آرایه به نام های X_train ، Y_train ، X_test و Y_test ایجاد می شود. مانند قبل ، شما می توانید با استفاده از دستور head محتوای این آرایه ها را بررسی کنید. ما برای آموزش مدل خود از آرایه های X_train و Y_train و از آرایه های X_test و Y_test برای آزمایش و اعتبار سنجی استفاده خواهیم کرد.

اکنون ما آماده ساخت طبقه بندی خود هستیم. در درس بعدی به بررسی آن خواهیم پرداخت.

منبع.

لیست جلسات قبل آموزش رگرسیون لجستیک در پایتون

امتیاز دهید post

برچسب ها : آموزش برنامه نویسی پایتون آموزش رگرسیون لجستیک در پایتون

نویسنده مطلب saber

آموزش تقسیم داده ها رگرسیون لجستیک در پایتون

آموزش تقسیم داده ها رگرسیون لجستیک در پایتون

ایجاد ویژگی های آرایه

ایجاد آرایه خروجی

لیست جلسات قبل آموزش رگرسیون لجستیک در پایتون

دیدگاه شما

بدون دیدگاه

آموزش تقسیم داده ها رگرسیون لجستیک در پایتون

ایجاد ویژگی های آرایه

ایجاد آرایه خروجی

لیست جلسات قبل آموزش رگرسیون لجستیک در پایتون

دیدگاه شما

برای صرف‌نظر کردن از پاسخ‌گویی اینجا را کلیک نمایید.

بدون دیدگاه