آموزش کار با webdata در زبان R

بسیاری از وب‌سایت‌ها داده‌هایی را برای استفاده کاربران خود ارائه می‌دهند. به‌عنوان نمونه، سازمان جهانی بهداشت (WHO) گزارش‌هایی در زمینه سلامت و اطلاعات پزشکی در قالب فایل‌های CSV، txt و XML منتشر می‌کند. با استفاده از برنامه‌های R می‌توان این داده‌ها را به‌صورت برنامه‌نویسی‌شده استخراج کرد. برخی از بسته‌های R که برای جمع‌آوری داده‌ها از وب به‌کار می‌روند عبارت‌اند از: "RCurl", "XML" و "stringr". این بسته‌ها امکان اتصال به آدرس‌های اینترنتی (URLs)، شناسایی لینک‌های موردنیاز برای فایل‌ها و دانلود آن‌ها در محیط محلی را فراهم می‌کنند.

نصب بسته‌های R

بسته‌های زیر برای پردازش آدرس‌ها و لینک‌های فایل‌ها لازم هستند. اگر این بسته‌ها در محیط R شما نصب نشده‌اند، می‌توانید با استفاده از دستورات زیر آن‌ها را نصب کنید:

داده ورودی

در این مثال، به وب‌سایت داده‌های آب‌وهوا مراجعه کرده و فایل‌های CSV مربوط به سال 2015 را با استفاده از R دانلود می‌کنیم.

مثال webdata در زبان R

ابتدا از تابع getHTMLLinks() برای جمع‌آوری لینک‌های موجود در صفحه وب استفاده می‌کنیم. سپس با کمک تابع download.file() فایل‌ها را در سیستم محلی ذخیره خواهیم کرد. از آنجا که همین کد را برای چندین فایل به‌کار می‌بریم، یک تابع تعریف می‌کنیم تا چندین بار فراخوانی شود. نام فایل‌ها نیز در قالب یک شیء لیست (list) در R به این تابع ارسال می‌شوند.

تأیید دانلود فایل‌ها

پس از اجرای کد بالا، می‌توانید فایل‌های زیر را در دایرکتوری کاری فعلی R بیابید:

5/5 - (1 امتیاز)

راستی! برای دریافت مطالب جدید در کانال تلگرام یا پیج اینستاگرام سورس باران عضو شوید.

پکیج آموزش پروژه محور لاراول و طراحی وب سایت کانون قلم چی
  • انتشار: ۲۵ شهریور ۱۴۰۴

دسته بندی موضوعات

آخرین محصولات فروشگاه

مشاهده همه

نظرات

بازخوردهای خود را برای ما ارسال کنید