R Programiranje: započnite s statističkim programiranjem

Objava: Vaša podrška pomaže održavanju web mjesta! Naplaćujemo naknadu za preporuku za neke usluge koje preporučamo na ovoj stranici.


R je programski jezik i razvojno okruženje koji se koristi za statističku analizu i stvaranje vizualizacija podataka o kvaliteti objavljivanja. R je potpuno besplatan, otvorenog koda, dio je GNU projekta, a podržava ga Zaklada R za statističko računanje..

Odakle R?

R su 1992. godine zamislili dva profesora sa Sveučilišta u Aucklandu na Novom Zelandu: Ross Ihaka i Robert Gentleman. Prva verzija jezika objavljena je 1994. Međutim, proći će još šest godina prije nego što je stabilna beta verzija R-a javnosti dostupna u veljači 2000..

R je implementacija programskog jezika S koji su izvorno razvili 1970-ih John Chambers i drugi u uglednoj laboratoriji Bell. R i S-PLUS, vlasnički jezik u vlasništvu TIBCO-a, dvije su moderne implementacije programskog jezika S.

Danas je R najpopularniji programski jezik statističke analize i koriste ga divovi u industriji, poput Facebooka i Googlea. Zanimljivo je da je izvorni tvorac S-a, John Chambers, sada dio temeljnog tima za razvoj R-a, koji ima zadatak kontinuiranog razvoja R. Znači da je R duhovni nastavak programskog jezika S, čak i ako nije izravni potomak.

Što se R koristi za danas?

Otprilike polovina svih znanstvenika podataka koristi R za rudarjenje podataka i statističku analizu – to je programski jezik odabira u prilično maglovitoj industriji velikih podataka o kojoj stalno slušate. R uključuje ugrađene funkcije i varijable dizajnirane za olakšavanje statističkih analiza, a također nudi alate za grafičku generaciju koji proizvode vizualizaciju podataka o kvaliteti objavljivanja..

R je vrlo proširiv i postoje mnogi paketi za rješavanje određenih zadataka i problema s analizom podataka. Dio popularnosti duguje statusu otvorenog koda, što znači da svatko može koristiti R i imati pristup svjetskim alatima za statističku analizu.

R je dizajniran za rad na gotovo bilo kojoj platformi i može se izvoditi na sustavima s operativnim sustavom Unix, Linux, Windows ili Mac OS..

GUI-ji za R

Standardu R pristupa se preko naredbenog retka. Međutim, korisnici koji više vole grafičko korisničko sučelje koje se lako koristi (GUI) imaju sreće. Za R postoji mnogo GUI-ja, od kojih su neki besplatni i s otvorenim kodom.

Ako želite saznati više o R GUI-ima, evo šest najpopularnijih opcija:

  • RStudio Open Source verzija
  • Klepet
  • Deducer
  • RKWard
  • JGR (izgovara se “Jaguar” i zalaže se za “JAva Gui za R„)
  • R zapovjednik

Programiranje sa stilom

Programiranje je prilično slobodan medij. U slučaju većine programskih jezika, prijelom linija i uvlačenja potpuno su neobavezna i zanemarit će ih stroj koji tumači kôd, a malo je konvencija imenovanja kojih se morate pridržavati.

Međutim, samo zato što možete pisati kôd koristeći bilo koji stil koji vam se sviđa ne znači da bi trebalo. Način na koji stil kodove ima veliku važnost iz najmanje tri razloga:

  • Loše stilizirani kôd teško je pročitati i razumjeti.
  • Budući da je teško pročitati i razumjeti, loše stilizirani kôd može biti frustrirajuće za proširenje.
  • Pored toga, ako je kôd teško čitati i nije oblikovan radi jasnoće, tada će biti teže nego ispraviti pogrešku.

Iz tog razloga, kako stilizirate kod u R-u, drugobitno je samo pitanje radi li kôd ili ne. Da biste vam pomogli da započnete na desnoj nozi, evo tri najbolje stilske preporuke koje biste trebali slijediti pri pisanju koda u R:

  • Unesite svoj kôd: Ništa više ne pomaže jasnoću koda osim pravilnog uvlačenja. U R-u nikad ne upotrebljavate jezičke za uvlačenje, već umjesto toga koristite četiri razmaka za svaku razinu uvlačenja.
  • Koristite jasna i jedinstvena imena varijabli i funkcija: Nikada ne imenujte varijablu ili funkciju ponovo upotrebljavajući ime koje se već koristi i potrudite se da izbjegnete zbunjivanje imena. Pri uklanjanju pogrešaka s kodnim mjesecima ili kad netko drugi pročita vaš kôd, trebalo bi biti lako odabrati varijable i funkcije koje ste stvorili.
  • Koristiti <- a ne =: Znak jednakosti ne smije se koristiti za dodjeljivanje vrijednosti funkciji ili varijabli. Umjesto toga, kombinirajte simbol manje i manje crtice (<-) za ovu svrhu. Dok će suvremeni R sustav prihvatiti znak jednake vrijednosti, njegova upotreba tehnički je pogrešna, a djeluje samo zato što je R bio prilagođen slabih sintaktičkih praksi novih programera. Učinite to kako treba. Koristiti <-.

R stil je sporna tema i teško da je to moguće učiniti u par stotina riječi. Dok smo pokušavali postići tri najvažnija poena, ima još puno toga za naučiti o ovoj temi. Ako želite ovladati stilom R programiranja i izgledate kao da znate što radite kad pišete R, provjerite R Stil: Reheološki komentar (PDF) Paul E Johnson, kao i Googleov vodič za R stil.

Resursi

Iako smo vam mnogo rekli o R programiranju, nismo vas naučili kako programirati u R. To ne možemo učiniti na ovom forumu, ali možemo vas usmjeriti na najbolju edukaciju o R programiranju koju ćete pronaći na mreža. Ako ste naučili dovoljno o R-u i spremni ste započeti pisati neki kôd i drobiti neke brojeve, evo najboljih R programskih resursa koje web može ponuditi.

Tutoriali

Web nudi puno R udžbenika koje možete koristiti za učenje R programiranja. Međutim, mislimo da su ova dva najbolje:

  • R za ljubitelje mačaka i mačaka: zabavan uvod u R koji preskače R instalaciju, ali ne pretpostavlja prethodno iskustvo u programiranju. Inspiriran JavaScriptom za mačke, ovaj besplatni udžbenik pokriva samo osnove. Ako ste potpuno novi u programiranju znanstvenih podataka, ovaj će vam vodič pomoći da dobijete svoje ležajeve prije nego što prijeđete na zahtjevnije materijale..
  • Uvod u R: Ovaj je uvod samo lagan i osnovni. Ne uskačite u ovaj tutorial a da vam prvo ne zaglave živci i ne postavite raspored dugoročnog studija. R temeljnim timom i temeljitim uvodom upravlja R Core tim, što znači da vas stručnjaci educiraju dok prolazite kroz više od 30 000 riječi sadržaja. Ako već znate malo R-a i samo želite prijeći na određene teme, ovaj vodič također sadrži korisni indeks funkcija i varijabli, kao i indeks koncepta.

Interaktivni udžbenici

Ako radije učite radeći, interaktivni vodič može biti upravo ono što tražite. Ovdje su tri opcije koje treba razmotriti:

  • Pokušajte s R iz škole Code: kratak interaktivni uvod u sintaksu R i osnovno programiranje s R. Zamislite to kao interaktivnu verziju R za mačke, ali s manje mačjih referenci.
  • DataCamp Uvod u R: Osnovni interaktivni uvod u R programiranje koji pokriva izvedbu aritmetike i rad sa varijablama te uvodi osnovne tipove podataka.
  • Kovitlaj: ovo je zapravo R paket. To znači da ćete proći kroz interaktivne tutorijale s R instaliranim upravo u vašem sustavu. Na raspolaganju su tečajevi vrtloga koji će vas provesti kroz sve, počevši od instalacije. Pored toga, postoji nekoliko dodatnih tečajeva izvan uvodnog tečaja s naslovima kao što su “R programiranje”, “Analiza podataka” i “Regresijski modeli”.

knjige

Ako doista želite naučiti kako provoditi statističku analizu s R, nema formalne zamjene za formalne udžbenike. S obzirom na uporabu R-a u industriji i akademskim krugovima, ne nedostaje kvalitetnih R tekstova. Međutim, izdvojili smo vrijeme da razvrstamo nerede i odredimo pet najpoželjnijih i najviše ocijenjenih tekstova R programiranja koji su danas dostupni:

  • R in Action (2015) Roberta Kabacoffa: jedan od najčešće proučavanih R tekstova na tržištu, predstavlja programski jezik R i pokazuje uporabu R za rješavanje poslovnih problema.
  • Praktična nauka podataka s R (2014) Zumel and Mount: baš kao što i ime sugerira, ovaj tekst podučava teoriju statističke analize s R, ali se usredotočuje na praktičnu primjenu teorije u stvarnim problemima. Napisao par impresivno kvalificiranih znanstvenika iz privatnog sektora, ako ste pročitali samo jedan tekst na R-u, učinite to ovim.
  • Otkrivanje statistike pomoću R (2012) Field, i dr.: Ovaj nevaljali tekst univerzalno se smatra najzabavnijim uvodima u statističku analizu s R. Osim toga, tekst pruža solidnu tehničku osnovu. Ako mrzite udžbenike, ali razumijete potrebu za čitanjem, ovo je udžbenik koji tražite.
  • Programiranje umjetnosti R (2011) Normana Matloffa: ovaj obilazak primijenjenog R programa provodi čitatelja kroz scenarije iz stvarnog svijeta u kojima se R koristi svakodnevno. Ovaj tekst je pogodan za početnike i iskusne programere kako bi proširio vašu percepciju o tome što analiza podataka može učiniti istodobno podučavajući temeljno R programiranje.
  • R Cookbook (2011), Paul Teetor: ako se više bavite rješavanjem određenih problema nego učenjem teorije iza R programskog jezika i statističke analize, ova će vam kuharica iz O’Reilly pomoći da brzo riješite probleme i stvorite rezultate.

Zaključak

R je besplatan i otvorenog koda, što omogućava bilo kome pristup pristupu svjetskim alatima za statističku analizu. Široko se koristi u akademskim i privatnim sektorima i danas je najpopularniji programski jezik statističke analize. Učenje R nije lako – da jest, znanstvenici za podatke ne bi bili tako velika potražnja. Međutim, ne nedostaje kvalitetnih resursa koje možete koristiti za učenje R ako ste spremni uložiti vrijeme i trud.

Daljnje čitanje i izvori

Imamo više vodiča, vodiča i infografika vezanih uz programiranje i statistiku:

  • Programi za resurse S-PLUS: standardni komercijalni jezik.
  • SAS Programiranje Uvod i resursi: SAS je vodeći na tržištu u analizi podataka.
  • Programiranje statičkih podataka: Stata je čitavo razvojno okruženje za analizu podataka.

Koji kôd treba naučiti?

Zbunjeni u koji programski jezik treba naučiti kodirati? Pogledajte našu infografiku. Koji kôd treba naučiti? Ne samo da raspravlja o različitim aspektima jezika, već odgovara i na važna pitanja poput: “Koliko ću novca zaraditi programiranje Java za život?”

Koji kôd treba naučiti?
Koji kôd treba naučiti?

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map