آموزش تقسیم داده ها رگرسیون لجستیک در پایتون

3 سال پیش
آموزش تقسیم داده ها رگرسیون لجستیک در پایتون

آموزش تقسیم داده ها رگرسیون لجستیک در پایتون

 

در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش تقسیم داده ها رگرسیون لجستیک در پایتون خواهیم پرداخت.

پیشنهاد ویژه : پکیج آموزش طراحی وب سایت با پایتون

ما حدود چهل و یک هزار رکورد عجیب داریم. اگر از کل داده ها برای ساخت مدل استفاده کنیم ، هیچ داده ای برای آزمایش باقی نمی ماند. بنابراین به طور کلی، ما کل مجموعه داده ها را به دو قسمت تقسیم می کنیم ، مثلاً ۷۰/۳۰ درصد. ما از ۷۰٪ داده ها برای ساخت مدل و مابقی برای آزمایش دقت در پیش بینی مدل ایجاد شده استفاده می کنیم. بنا به نیاز خود ممکن است از نسبت تقسیم متفاوت استفاده کنید.

 

ایجاد ویژگی های آرایه

قبل از اینکه داده ها را تقسیم کنیم ، داده ها را به دو آرایه X و Y جدا می کنیم. آرایه X شامل تمام ویژگی هایی (ستون داده) است که می خواهیم تجزیه و تحلیل کنیم و آرایه Y یک آرایه تک بعدی از مقادیر بولی است که خروجی آن است پیش بینی برای درک این موضوع ، اجازه دهید برخی از کدها را اجرا کنیم.

ابتدا دستور Python زیر را برای ایجاد آرایه X اجرا کنید –

 

In [17]: X = data.iloc[:,1:]

 

برای بررسی محتویات X برای چاپ چند رکورد اولیه از head استفاده کنید. صفحه زیر محتویات آرایه X را نشان می دهد.

 

In [18]: X.head ()

 

Initial Records

 

آرایه دارای چندین ردیف و ۲۳ ستون است.

 

بعد ما آرایه خروجی ایجاد خواهیم کرد که شامل مقادیر “y” است.

 

ایجاد آرایه خروجی

برای ایجاد یک آرایه برای ستون مقدار پیش بینی شده ، از عبارت Python زیر استفاده کنید –

 

In [19]: Y = data.iloc[:,0]

 

با فراخوانی head محتوای آن را بررسی کنید. خروجی صفحه زیر نتیجه را نشان می دهد –

 

In [20]: Y.head()
Out[20]: 0   0
۱    ۰
۲    ۱
۳    ۰
۴    ۱
Name: y, dtype: int64

 

اکنون  داده ها را با استفاده از دستور زیر تقسیم کنید –

 

In [21]: X_train, X_test, Y_train, Y_test = train_test_split(X, Y, random_state=0)

 

با این کار چهار آرایه به نام های X_train ، Y_train ، X_test و Y_test ایجاد می شود. مانند قبل ، شما می توانید با استفاده از دستور head محتوای این آرایه ها را بررسی کنید. ما برای آموزش مدل خود از آرایه های X_train و Y_train و از آرایه های X_test و Y_test برای آزمایش و اعتبار سنجی استفاده خواهیم کرد.

 

اکنون ما آماده ساخت طبقه بندی خود هستیم. در درس بعدی به بررسی آن خواهیم پرداخت.

 

منبع.

 

لیست جلسات قبل آموزش رگرسیون لجستیک در پایتون

  1.  آموزش رگرسیون لجستیک در پایتون
  2. معرفی رگرسیون لجستیک در پایتون 
  3. آموزش مطالعه موردی رگرسیون لجستیک در پایتون 
  4. آموزش راه اندازی یک پروژه رگرسیون لجستیک در پایتون
  5. آموزش دریافت داده ها رگرسیون لجستیک در پایتون 
  6. آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون 
  7. آموزش آماده سازی داده ها رگرسیون لجستیک در پایتون
  8. آموزش تقسیم داده ها رگرسیون لجستیک در پایتون
  9. آموزش طبقه بندی کننده ساختمان رگرسیون لجستیک در پایتون 
  10. آموزش تست رگرسیون لجستیک در پایتون
  11. محدودیت های رگرسیون لجستیک در پایتون 
0
برچسب ها :
نویسنده مطلب erfan molaei

دیدگاه شما

بدون دیدگاه