Ievads statistiskajā programmēšanā ar R

Satura rādītājs
R ir statistikas programmēšanas valoda, tā ir bezmaksas un atvērtā koda. To galvenokārt izmanto operācijām datu ieguve vai statistika, tas viss ar mērķi izveidot lietojumprogrammas liela apjoma datu analīzei.
Komandrindas saskarne R Sākumā tas var būt nedaudz biedējoši, taču tas tiek aizēnots, kad esam novērtējuši valodas piedāvātās iespējas un iespējas dalīties un reproducēt informācijas analīzi.
R To var lejupielādēt bez maksas visām bezmaksas platformām, kas pastāv šodien, mums ir iespēja to instalēt Windows, Linux un pat Mac.
Šīs apmācības nolūkos mēs izmantosim versiju Windows ko mēs varam atrast projekta oficiālajā lapā šajā saitē. Pēc lejupielādes un instalēšanas mums būs mūsu funkcionālā kopija R, ja mēs to izpildīsim, mums būs sākuma ekrāns R kam vajadzētu izskatīties šādi:

R Tas ļauj mums ātri un efektīvi strādāt ar datiem, tomēr tā noklusējuma interfeiss nav ideāls šim uzdevumam. Viena no problēmām ir tā, ka viss atveras atsevišķos logos, kas apgrūtina darbu, kā arī komandrindas saskarne nav vienāda visās operētājsistēmās.
Lai gan šīs problēmas risināšanai ir daudz saskarņu, šajā apmācībā mēs to izmantosim RSudio kas ir pieejams visām platformām, taču ir svarīgi pieminēt, ka tas ir nepieciešams R pirms instalēšanas, lai iegūtu versiju Windows mēs ejam uz šo saiti un lejupielādējam atbilstošo versiju.
Pēc instalēšanas mēs izpildām RSudio un mums vajadzētu redzēt galveno saskarni:

RSudio sniedz mums visu logu organizāciju R vienā panelī un papildus dod mums piekļuvi funkcijām, kuras var būt grūti atrast, turklāt mēs varam pieminēt arī citas papildu priekšrocības:
  • Sadalīsim savu darbu Projekti kur katram no tiem būs savs darba direktorijs, vēsture un avota faili.
  • Integrācija ar GitHub.
  • Ļauj grafiski saglabāt stāstu.
  • Jūs varat eksportēt grafikas dažādos formātos un izmēros.
  • Tas ļauj mums aizpildīt kodu ar tabulas taustiņu.
  • Pateicoties noteiktām pakotnēm, varat izveidot interaktīvas diagrammas.
Kā redzam RSudio ir diezgan optimāls veids, kā strādāt RTomēr tirgū ir arī citi risinājumi, katras personas ziņā ir tos izpētīt un izvērtēt, vai tie ir labāk pielāgoti katras personas vajadzībām.
Ir vairāki veidi, kā strādāt R kur vispirms mēs pievērsīsimies R konsoleNeskatoties uz to, ka šeit veikto darbu mēs nevaram uzglabāt, ir diezgan noderīgi pārbaudīt dažas funkcijas un sākt iepazīt valodu.
Darbs ar konsoli ir diezgan vienkāršs, mēs ievadām komandu un pēc tam R dod mums tās izvadi, izmēģināsim vienkāršu pievienošanas darbību, piemēram:
> 10 + 7

Mēs spiežam Ievadiet un automātiski R Nākamajā rindiņā tas sniedz mums atbildi uz mūsu darbību:

Kā redzams attēlā, pirmajā rindā ir komanda ar mūsu darbību, ir svarīgi to pieminēt R lai pabeigtu līniju, nav nepieciešams izmantot semikolu vai citu operatoru, kas beidzas. Mēs varam redzēt otrajā rindā pirms atbildes [1] tas norāda veidu, kādā R veic aritmētiskās darbības un izmanto vektors, viens nozīmē vektora pirmā elementa indeksu, kur mēs varam uzsvērt, ka daudzas citas valodas apstrādā indeksus no nulles, bet R dara to no viena.
Kā jau minējām iepriekš, konsole ir diezgan noderīga, taču ar to nav labākais strādāt, galvenokārt tāpēc, ka tai nav iespēju saglabāt mūsu komandas un iespēju vienlaikus ievadīt tikai vienu komandu, kaut kas līdzīgs notiek ar Python, bet kopš tā laika mums nevajadzētu uztraukties RSudio dod mums skripta logs kas atrodas mūsu konsoles augšējā daļā, ja mēs to neatrodam, dodamies uz Fails> Jauns fails> R skripts vai nospiediet Shift + Command + N.
Būtībā R skripts ir vienkāršs teksts ar paplašinājumu .R. Lai redzētu, kā tas darbojas, mēs varam atjaunot savu aritmētisko darbību no iepriekšējā piemēra, izveidojot jaunu skriptu un pievienojot vairākas papildu komandrindas.
 10 + 7 1:50 izdruka ("Sveika pasaule") 

A R skripts jūs varat palaist rindu pa rindai, izmantojot opciju, kas mums ir augšējā izvēlnē ar nosaukumu Palaist un mēs redzēsim tā paša rezultātu konsolē, redzēsim atbildi uz katru mūsu skripta rindu:

Kā mēs varam redzēt, ka pirmā rinda dod mums iepriekš iegūto rezultātu, otrā rinda izveido skaitļu sarakstu no 1 līdz 50, kur iekavās norādītais skaitlis ir šīs rindas pirmais indekss, un visbeidzot mums rodas iespaids par klasisko Sveika pasaule.
Ieraudzījuši veidus, kā mēs varam strādāt ar valodu, mēs pāriesim pie vairāk teorētiskiem jēdzieniem, lai labāk izprastu, kas mums ir pieejams valodā, lai strādātu un īstenotu mūsu projektus.
Tāpat kā visās programmēšanas valodās, mainīgie ir viens no vissvarīgākajiem aspektiem, lai tos izveidotu R Mums tikai jāraksta tā nosaukums, nenosakot veidu. Mēs izmantojam uzdevumu operators lai mainīgajam piešķirtu vērtību.
SvarīgsMēs varam piešķirt mainīgā vērtību ar vienādības zīmi, taču tā ir slikta prakse R, lai veiktu pareizo uzdevumu, izmantojiet operatoru <-.
Apskatīsim, kā mainīgajam piešķirt vērtību un pēc tam to izdrukāt:
 x <- 58 x 

Mēs varam arī piešķirt vairākas vērtības mūsu mainīgajiem ar salikšanas funkciju:
y <- c (5, 2, 11, 28, 17)

Ja mēs izpildām piemēru, labajā panelī redzēsim, kā mums ir vērtība x un tam piešķirtais ciparu saraksts Y:

PALIELINĀT

Turklāt, lai noņemtu mainīgo no darbvietas, mums vienkārši jāizmanto šī funkcija rm, mēs pat varam iztīrīt visu darbvietu, redzēsim, kā mēs to darām:
 rm (x) rm (saraksts = ls ()) 

Ar pirmo rindu mēs izslēdzam mainīgo un ar otro rindu visu atstarpi.
Valodā mums ir četras datu struktūras, kuras atpazīst R:
Karikatūras vektorsVektors ir viendimensiju masīvs, kurā visiem tajā esošajiem datiem jābūt viena veida, veseliem skaitļiem, rakstzīmēm utt., Turklāt ir svarīgi atzīmēt, ka šis ir pamata datu objekts R.
Masīvi un matricasMatrica ir līdzīga vektoram, kur datiem jābūt vienāda veida, tomēr matricai ir divas dimensijas, un informācija ir sakārtota rindās un kolonnās. Masīvs ir līdzīgs masīvam, taču tam var būt vairāk nekā divas dimensijas.
Datu rāmjiDatu rāmji ir vienāda garuma vektoru kolekcija, tas ir līdzīgs matricai, taču šāda veida struktūras īpatnība ir tāda, ka tie var būt jauktu datu tipi, kur vektoriem var būt pat nosaukumi.
SarakstiVisizplatītākais struktūras veids R, saraksts ir jebkuras klases, garuma vai struktūras elementu kolekcija, mums var būt pat citi saraksti.
Tālāk, R Tam ir vairākas funkcijas, kas ļauj mums pārveidot viena veida struktūru citā, apskatīsim:
as.vector ()Šī funkcija ļauj pārvērst matricas par viendimensionāliem vektoriem.
kā.matrica ()Jūs varat pārvērst datu struktūras masīvā.
as.data.frame ()Jūs varat pārvērst datu struktūras par datu rāmjiem.
as.list ()Datu struktūras varat pārvērst sarakstos.
Viena no stiprajām pusēm R ir tas, ka jūs varat pievienot paketes, kas ļauj mums paplašināt valodas funkcionalitāti. Citās valodās šie spraudņi ir bibliotēkās, bet R bibliotēka ir vieta, kur tiek glabāti visi iepakojumi.
iepakojumiem no R var nākt no divām dažādām vietām, dažas nāk ar R pēc noklusējuma, bet tie nav aktīvi, un citus var atrast tiešsaistes krātuvēs.
Lai redzētu pašlaik instalētās vai ielādētās paketes, mēs varam izpildīt šādas funkcijas:
 bibliotēka () meklēšana () 

Funkcija bibliotēka () piedāvā sarakstu ar pašlaik instalētajām pakotnēm. Apskatīsim daļu no tā, ko tas mums rada, izpildot šo rindu:

Funkcija Meklēt () No otras puses, tas ar konsoles palīdzību parāda mums ielādētās pakotnes. Tālāk redzamajā attēlā redzēsim, kuras paketes esam ielādējuši:

Turklāt, lai instalētu paketes, mēs to varam izdarīt vairākos veidos, pirmais ir, izmantojot augšējās izvēlnes opciju Rīki> Instalēt pakotnes un tad mums ir valodas funkcijas, pēdējo mēs iesakām, jo ​​tādējādi tā var būt daļa no mūsu skripta.
Lai instalētu mūsu izmantoto pakotni instalēt.paketes, pēc tam mums tas jāiekļauj, mēs varam izmantot bibliotēka vai pieprasīt Tomēr šim nolūkam vislabāk ir izmantot pēdējo, lai izvairītos no sajaukšanas ar funkciju apjomu, redzēsim, kā mēs instalējam un iekļaujam paketi ggplot2:
 install.packages ("ggplot2") nepieciešams ("ggplot2") 

Visbeidzot, lai izdzēstu paketi, kuru mēs varam izmantot noņemt.iepakojumus, redzēsim, kā tas tiek izmantots:
remove.packages ("ggplot2")

Ar to mēs beidzam šo apmācību, ar kuru mums jau ir priekšstats par to, kā strādāt RPapildus precizētiem jautājumiem, piemēram, mainīgajiem un datu struktūrām, ir svarīgi aspekti, kas mums jāzina, lai pilnībā izmantotu šīs spēcīgās un efektīvās valodas priekšrocības.Vai jums patika šī apmācība un palīdzējāt tai?Jūs varat apbalvot autoru, nospiežot šo pogu, lai sniegtu viņam pozitīvu punktu

Jums palīdzēs attīstību vietā, daloties lapu ar draugiem

wave wave wave wave wave