آموزش انواع داده در زبان R

به‌طور کلی، هنگام برنامه نویسی در هر زبان، باید از متغیرهای مختلف برای ذخیره اطلاعات گوناگون استفاده کنید. متغیرها در واقع فضای مشخصی در حافظه را رزرو می‌کنند تا مقادیر را نگهداری کنند. این یعنی وقتی متغیری ایجاد می‌کنید، بخشی از حافظه را رزرو کرده‌اید. در ادامه انواع داده در زبان R را بررسی میکنیم.

ممکن است بخواهید اطلاعاتی از انواع داده‌ای مانند کاراکتر، کاراکتر گسترده، عدد صحیح (Integer) و عدد اعشاری (Floating Point) ذخیره کنید. همچنین ممکن است نیاز به ذخیره عدد اعشاری دابل (Double Floating Point)، بولین (Boolean) و انواع دیگر داشته باشید. سیستم‌عامل بر اساس نوع داده متغیر، حافظه اختصاص می‌دهد و تعیین می‌کند چه مواردی را می‌توان در آن ذخیره کرد.

انواع داده در زبان R

برخلاف زبان‌هایی مانند C و Java، در R متغیرها را به‌عنوان یک نوع داده مشخص اعلام نمی‌کنیم. در R، ما متغیرها را با R-Objects مقداردهی می‌کنیم و نوع داده متغیر همان نوع R-Objects خواهد بود. R-Objects انواع مختلفی دارند. پرکاربردترینِ آن‌ها عبارت‌اند از:

  • بردارها (Vectors)

  • لیست‌ها (Lists)

  • ماتریس‌ها (Matrices)

  • آرایه‌ها (Arrays)

  • فاکتورها (Factors)

  • چارچوب‌های داده (Data Frames)

ساده‌ترینِ این اشیاء شیء بردار است. بردارهای اتمی شش نوع داده دارند؛ به این شش نوع، شش کلاس بردار نیز می‌گویند. بردارهای اتمی، پایه ساخت سایر R-Objects را تشکیل می‌دهند.

نوع داده مثال Verify
منطقی (Logical) TRUE, FALSE خروجی
عددی (Numeric) 12.3, 5, 999 خروجی
عدد صحیح (Integer) 2L, 34L, 0L خروجی
مختلط (Complex) 3 + 2i خروجی
کاراکتر (Character) ‘a’ , ‘”good”, “TRUE”, ‘23.4’ خروجی
خام (Raw) “Hello” is stored as 48 65 6c 6c 6f خروجی

در زبان برنامه نویسی R، ابتدایی‌ترین نوع داده، R-objects بردارها (Vectors) هستند که عناصر مربوط به کلاس‌های مختلف را در خود نگه می‌دارند. توجه داشته باشید که تعداد کلاس‌ها در R محدود به شش نوعی که پیش‌تر گفته شد نیست. به عنوان نمونه، می‌توانیم با استفاده از بردارهای اتمی مختلف یک آرایه (Array) بسازیم و در این حالت، کلاس آن شیء به صورت آرایه تعریف می‌شود.

بردارها (Vectors)

هنگامی که بخواهید یک بردار با بیش از یک عنصر ایجاد کنید، باید از تابع c() استفاده کنید. این تابع عناصر را با هم ترکیب کرده و یک بردار می‌سازد.

کد بالا، خروجی زیر را نشان می‌دهد:

لیست ها (Lists)

لیست یک R-object است که می‌تواند عناصر بسیار متنوعی را در خود نگه دارد. این عناصر ممکن است شامل بردارها، توابع و حتی یک لیست دیگر باشند.

کد بالا، خروجی زیر را نشان می‌دهد:

ماتریس ها (Matrices)

ماتریس یک مجموعه داده مستطیلی دو بعدی است. برای ایجاد یک ماتریس می‌توانید از یک بردار به عنوان ورودی در تابع matrix() استفاده کنید.

کد بالا، خروجی زیر را نشان می‌دهد:

آرایه ها (Arrays)

در حالی که ماتریس‌ها محدود به دو بُعد هستند، آرایه‌ها می‌توانند هر تعداد بُعد داشته باشند. تابع array() یک ویژگی به نام dim می‌گیرد که تعداد ابعاد موردنیاز را مشخص می‌کند.

در مثال زیر یک آرایه ایجاد می‌کنیم که شامل دو ماتریس ۳×۳ است:

کد بالا، خروجی زیر را نشان می‌دهد:

فاکتورها (Factors)

فاکتورها R-object هستند که با استفاده از یک بردار ایجاد می‌شوند. آن‌ها بردار ورودی را همراه با مقادیر متمایز عناصر به‌عنوان برچسب (Label) ذخیره می‌کنند. برچسب‌ها همیشه از نوع کاراکتر هستند، چه عناصر ورودی عددی، کاراکتری یا بولی باشند. فاکتورها در مدل‌سازی آماری بسیار کاربرد دارند.

برای ایجاد فاکتور از تابع factor() استفاده می‌کنیم. تابع nlevels() تعداد سطوح (Levels) فاکتور را برمی‌گرداند.

کد بالا، خروجی زیر را نشان می‌دهد:

چارچوب‌های داده (Data Frames)

چارچوب‌های داده (Data Frames) اشیاء جدولی در R هستند. برخلاف ماتریس، هر ستون در یک چارچوب داده می‌تواند نوع داده متفاوتی داشته باشد. برای مثال، ستون اول می‌تواند عددی باشد، ستون دوم کاراکتری و ستون سوم بولی. در واقع، Data Frame فهرستی از بردارهای هم‌طول است.

برای ایجاد چارچوب داده از تابع data.frame() استفاده می‌کنیم.

کد بالا، خروجی زیر را نشان می‌دهد:
5/5 - (1 امتیاز)

راستی! برای دریافت مطالب جدید در کانال تلگرام یا پیج اینستاگرام سورس باران عضو شوید.

پکیج جامع و پروژه محور ASP.NET MVC + طراحی فروشگاه اینترنتی فروش فایل
  • انتشار: ۱۵ شهریور ۱۴۰۴

دسته بندی موضوعات

آخرین محصولات فروشگاه

مشاهده همه

نظرات

بازخوردهای خود را برای ما ارسال کنید