R programozás: Kezdje el a statisztikai programozást

Közzététel: Támogatása segít fenntartani a webhely működését! Az ezen az oldalon javasolt szolgáltatások némelyikén referenciadíjat keresünk.


Az R egy programozási nyelv és fejlesztői környezet, amelyet statisztikai elemzéshez és publikációs minőségű adatmegjelenítések létrehozásához használnak. Az R teljesen ingyenes, nyílt forráskódú, a GNU projekt része, és az R Statisztikai Számítástechnikai Alapítvány támogatja.

Honnan jött R??

Az R-t először 1992-ben az új-zélandi Aucklandi Egyetem két professzora alkotta: Ross Ihaka és Robert Gentleman. A nyelv legelső verziója 1994-ben jelent meg. Azonban még hat évvel később az R stabil béta verzióját 2000 februárjában elérhetővé teszik a nyilvánosság számára..

Az R az S programozási nyelv megvalósítása, amelyet eredetileg az 1970-es években fejlesztettek ki John Chambers és mások a tiszteletreméltó Bell laboratóriumokban. Az R és az S-PLUS, a TIBCO tulajdonában lévő nyelv, az S programozási nyelv két modern megvalósítása..

Manapság az R a legnépszerűbb statisztikai elemzési programozási nyelv, amelyet olyan ipari óriások használnak, mint a Facebook és a Google. Érdekes módon az S eredeti alkotója, John Chambers az R Fejlesztési Csapat részét képezi, amelynek feladata az R. folyamatos fejlesztése. Ez azt jelenti, hogy R az S programozási nyelv szellemi folytatása, még akkor is, ha nem közvetlen leszármazott.

Mi az a R, amelyet manapság használnak??

Az összes adattudós körülbelül a fele R-t használ az adatbányászathoz és a statisztikai elemzéshez – ez a választott programozási nyelv a meglehetősen homályos „nagy adat” iparban, amelyről folyamatosan hall. Az R beépített funkciókat és változókat tartalmaz, amelyek megkönnyítik a statisztikai elemzést, és olyan grafikus generációs eszközöket is kínál, amelyek publikációs minőségű adatmegjelenítéseket eredményeznek.

Az R nagyon kiterjeszthető, és számos csomag létezik az egyes adatelemzési feladatok és problémák kezelésére. Népszerűségének egy részét a nyílt forráskódú státusza köti, ami azt jelenti, hogy bárki használhatja az R-t és hozzáférhet a világminőségi statisztikai elemző eszközökhöz.

Az R szinte bármilyen platformon működik, és Unix, Linux, Windows vagy Mac OS operációs rendszerrel futtatható..

GUI az R számára

Az R szabványt a parancssoron keresztül lehet elérni. Azon felhasználóknak azonban szerencséje van, akik inkább az egyszerűen használható grafikus felhasználói felületet (GUI) részesítik előnyben. Az R számára számos GUI érhető el, ezek közül néhány ingyenes és nyílt forráskódú.

Ha többet szeretne megtudni az R GUI-król, íme a hat legnépszerűbb lehetőség:

  • RStudio nyílt forráskódú verzió
  • Csörgő
  • Deducer
  • RKWard
  • JGR („Jaguar” kiejtéssel és „JAva Gui érte R„)
  • R parancsnok

Programozás stílusban

A programozás meglehetősen szabad formájú közeg. A legtöbb programozási nyelv esetében a sortörések és a behúzások teljesen opcionálisak, és a kódot értelmező gép figyelmen kívül hagyja azokat, és kevés elnevezési konvenciót kell betartani..

Az a tény azonban, hogy bármilyen stílus használatával írhat kódot, nem azt jelenti, hogy kellene. Legalább három okból nagyon fontos az, hogy hogyan alakítja a stíluskódot:

  • A rossz stílusú kódot nehéz olvasni és megérteni.
  • Mivel nehéz olvasni és megérteni, a rosszul megírt kód frusztráló lehet a kiterjesztése.
  • Ezen túlmenően, ha a kódot nehéz olvasni, és annak stílusa nem egyértelmű, akkor nehezebb lesz a hibakeresés.

Ez az oka annak, hogy hogyan formázza a kódot az R-ben, az a másodlagos fontosság, hogy a kód ténylegesen működik-e vagy sem. A jobb láb elindításának elősegítése érdekében a következő három első tipikus ajánlást kell követni, amikor kódot írunk R-ben:

  • Behúzza a kódot: Semmi nem segíti a kód egyértelműségét, csak a megfelelő behúzás. Az R-ben soha nem használunk füleket a behúzáshoz, hanem négy üres helyet használunk minden behúzási szinthez.
  • Használjon tiszta és egyedi változó- és függvényneveket: Soha nevezze meg a változót vagy a funkciót egy már használt név újbóli felhasználásával, és mindent megtesz a nevek zavarásának elkerülése érdekében. Ha már több hónapos hibakeresést végez, vagy ha valaki más olvassa el az Ön kódját, akkor könnyűnek kell lennie a létrehozott változók és funkciók kiválasztására..
  • Használat <- helyett =: Az egyenlőségjelet nem szabad értékhez rendelni egy funkcióhoz vagy egy változóhoz. Ehelyett egyesítsen egy kevesebb szimbólumot és kötőjelet (<-) erre a célra. Noha a modern R rendszer elfogadja az egyenlőségjelet, használata műszakilag helytelen, és csak azért működik, mert az R-t hozzáigazították az új programozók gyenge szintaktikai gyakorlatához. Csináld jól. Használat <-.

Az R stílus vitatott téma, és alig tudunk pár száz szóval igazságosságot tenni. Miközben három csúcspontot próbáltunk elérni, még sok minden van a témáról. Ha szeretné elsajátítani az R programozási stílust, és úgy néz ki, mintha tudnád, mit csinálsz az R írásakor, akkor nézd meg az R Stílus: Paul E Johnson Régészeti kommentár (PDF), valamint a Google R stílus útmutatóját..

Erőforrások

Bár sokat mondtunk neked az R programozásról, még nem tanítottuk meg, hogyan kell programozni R nyelven. Ezt a fórumon nem tehetjük meg, de a legfinomabb R programozási oktatáshoz irányíthatjuk Önt a web. Ha eleget tudott az R-ről, és készen áll valamilyen kód írására és néhány szám megrágására, itt találja meg a legjobb R programozási erőforrásokat, amelyeket a web kínál.

oktatóanyagok

Az internet számos R oktatóanyagot kínál, amelyek segítségével megtanulhatja az R programozást. Úgy gondoljuk azonban, hogy ez a kettő a legjobb:

  • R macskák és macska szerelmesek számára: Az R szórakoztató bevezetése, amely átugorja az R telepítést, de nem feltételezi, hogy korábban programozott volna. A macskákról szóló JavaScript ihlette, ez az ingyenes bemutató csak az alapokat tartalmazza. Ha újonnan ismeri az adattudomány programozását, ez az útmutató segít megszerezni csapágyait, mielőtt továbblépne a nagyobb kihívásokkal járó anyagokba..
  • Bevezetés az R-hez: Ez a bevezetés nem más, mint egyszerű és alapvetõ. Ne ugorjon ebbe az oktatóanyagba anélkül, hogy először az idegeit megkezdené és hosszú távú tanulmányi ütemtervet állítana össze. Az R mélyreható és alapos bevezetését az R Core Team kezeli, ami azt jelenti, hogy a szakértők továbbképzik, ahogy több mint 30 000 szótartalommal dolgozik. Ha már ismeri egy kicsit az R-ről, és csak konkrét témákra szeretne ugrani, ez az útmutató tartalmaz egy hasznos funkciók és változók indexét, valamint egy fogalom-mutatót.

Interaktív oktatóanyagok

Ha inkább cselekedetekkel tanul, inkább egy interaktív bemutató lehet, amit keres. Itt van három fontolóra vehető lehetőség:

  • Próbáld ki az R-t a Code School-ból: R-szintaxis és interaktív rövid interaktív bevezetés R-vel. Gondolj rá, mint az R macskák interaktív változatára, de kevesebb macska-referenciával.
  • DataCamp bevezetés az R-be: Az R programozás alapvető interaktív bevezetése, amely leírja a számtani elvégzését és a változókkal való munkát, valamint bemutatja az alaptípusokat.
  • Örvény: ez valójában egy R csomag. Ez azt jelenti, hogy az interaktív útmutatókon keresztül jár, ahol az R közvetlenül a rendszerére van telepítve. Vannak örvénytanfolyamok, amelyek mindent átjárnak, kezdve a telepítéstől. Ezen túlmenően a bevezető kurzuson túl sok további kurzus található olyan címekkel, mint az „R programozás”, az „Adatelemzés” és a „Regressziós modellek”.

Könyvek

Ha valóban meg akarja tanulni, hogyan kell statisztikai elemzést végezni az R segítségével, akkor a hivatalos tankönyvek nem helyettesíthetők. Figyelembe véve az R használatát az iparban és a tudományos életben, nem hiányzik a minőségi R szöveg. Időt vettünk arra, hogy átgondoljuk a rendetlenséget, és pontosan meghatározzuk a jelenleg elérhető öt legelterjedtebb és legjobban értékelt R programozási szöveget:

  • Robert Kabacoff „R in Action” (2015): a piacon az egyik legszélesebb körben tanulmányozott R szöveg, bemutatja az R programozási nyelvet és bemutatja az R használatát az üzleti problémák megoldására.
  • Gyakorlati adattudomány R (2014) -vel: Zumel és Mount: ahogy a neve is sugallja, ez a szöveg a statisztikai elemzés elméletét tanítja R-rel, de az elmélet gyakorlati alkalmazására összpontosít a valós problémákra. Írta: egy pár lenyűgözően képzett magánszektorbeli tudós, ha csak egy szöveget olvas az R-n, tedd ezt.
  • Statisztikák felfedezése R (2012) segítségével, Field és munkatársai szerint: ezt az irreverens szöveget általánosságban tekintik a statisztikai elemzés legszórakoztatóbb bevezetésének R.-vel. Ezenkívül a szöveg szilárd technikai alapot nyújt. Ha utálod a tankönyveket, de megérted, hogy el kell olvasni azokat, ez a tankönyv, amelyet keres.
  • Az R programozás művészete (2011), Norman Matloff: az alkalmazott R programozás ezen turnéja valós forgatókönyveken végigvezeti az olvasót, ahol az R minden nap használatos. A kezdőknek és a tapasztalt fejlesztőknek egyaránt alkalmas. Ez a szöveg arra szolgál, hogy meghosszabbítsa annak észlelését, hogy mit lehet végezni az adatelemzés során, miközben egyszerre tanítja az alapvető R programozást..
  • Paul Teetor R szakácskönyve (2011): Ha inkább konkrét problémák megoldásával foglalkozik, mint az R programozási nyelv mögötti elmélet megtanulásával és a statisztikai elemzéssel, akkor ez az O’Reilly szakácskönyve segít a problémák megoldásában és gyors eredményt hoz..

Következtetés

Az R ingyenes és nyílt forráskódú, így bárki hozzáférhet világszínvonalú statisztikai elemző eszközökhöz. Széles körben használják az egyetemi és a magánszektorban, és ma a legnépszerűbb statisztikai elemzési programozási nyelv. Az R tanulása nem könnyű – ha igen, az adattudósoknak nem lenne ilyen nagy igényük. Ugyanakkor nem hiányzik a minőségi erőforrások, amelyek felhasználhatók az R megtanulására, ha hajlandó rátenni időt és energiát.

További olvasmányok és források

További programozási és statisztikai útmutatókat, oktatóanyagokat és infografikákat találunk:

  • S-PLUS programozási források: a szokásos kereskedelmi nyelv.
  • A SAS programozásának bevezetése és források: A SAS az adatok elemzésének piacvezetője.
  • Stata programozás: A Stata az adatok elemzésének teljes fejlesztési környezete.

Milyen kódot kell megtanulnia?

Zavaros abban, hogy milyen programozási nyelvet kell megtanulnia a kódoláshoz? Nézze meg infográfunkat, Milyen kódot kell megtanulnia? Nemcsak a nyelvek különféle aspektusait tárgyalja, hanem olyan fontos kérdéseket is megválaszol, mint például: “Mennyit fogok pénzt keresni a Java megélhetéséhez?”

Milyen kódot kell megtanulnia?
Milyen kódot kell megtanulnia?

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me