سفارش تبلیغ
صبا ویژن

داده های وب در زبان برنامه نویسی آر

وب سایت های بسیاری هستند که داده هایی را برای مصرف کاربران شان فراهم می نند. برای مثال؛ سازمان سلامت جهانی (WHO) گزارش هایی در مورد اطلاعات سلامت و پزشکی را به شکل فایل های CSV، txt و XML ارائه می دهد. با استفاده از برنامه های R می توانیم داده های خاصی را از این نوع وب سایت ها با کمک برنامه نویسی استخراج کنیم. برخی بسته ها در R هستند که برای استخراج داده ها از وب استفاده می شوند؛ از جمله آنها می توان به “RCurl”، “XML” و “stringer” اشاره کرد. آنها برای اتصال به URL، مشخص کردن لینک های مورد نیاز برای فایل ها و دانلود آنها به محیط محلی استفاده می شوند.

نصب بسته های آر
بسته های زیر برای پردازش URL و لینک هایی به فایل مقصد مورد نیاز هستند. اگر این بسته هادر محیط آر شما در دسترس نباشد؛ شما می توانید آنها را با استفاده از فرمان های زیر نصب بکنید:

install.packages(“RCurl”)

install.packages(“XML”)

install.packages(“stringr”)

install.packages(“plyr”)

داده های ورودی
ما داده های هواشناسی URL را مشاهده خواهیم کرد و فایل های CSV را با استفاده از R برای سال 2015 دانلود می کنیم.

مثال
ما از تابع ()getHTMLLinks استفاده خواهیم کرد تا URLهای فایل ها را جمع آوری کنیم. سپس ما از تابع ()download.file برای ذخیره سازی فایل ها در سیستم محلی استفاده می کنیم. از آنجایی که می خواهیم یک کد مشابه را دوباره و دوباره برای چندین فایل اعمال کنیم؛ یک تابع ایجاد خواهیم کرد تا چندین بار فراخوانی شود. نام فایل ها به شکل پارامترهایی به فرم شیء لیست آر به این تابع منتقل می شوند.

ادامه مطلب.....