05 Mag

Introduzione a R (Statistical programming)

R

R e’ un linguaggio di programmazione ideale per il computo statistico e la generazione di plot grafici.  R sta rapidamente diventando un riferimento per i data scientists. Questo articolo descrive brevemente le potenzialità di R e i suoi campi applicativi.

R in sintesi

R è un ambiente di sviluppo software libero indirizzato alla data analysis e alla statistical analysis. L’obbiettivo di R è quello di raccogliere una grande varietà di tecniche statistiche facilitandone il plotting grafico. La statistica è quella disciplina che studia quantitaivamente e qualitativamente un particolare fenomeno in modo non deterministico, ovvero senza conoscerne le cause a priori.

Lo sviluppo della piattaforma è gestito da una comunità molto attiva. La piattaforma offre strumenti per la data manipulation, il calcolo statistico e la grafica. L’ambiente puo’ essere esteso includendo packages esterni sviluppati dalla stessa comunity.

Vantaggi

  • R è open source e libero;
  • E’ semplice generare grafici da calcoli statistici;
  • Estesa riproducibilità attraverso gli scripts;
  • Sono disponibili svariate estensioni libere fornite dalla community (packages);
  • E’ possibile utilizzare una CLI implementata ad hoc per R.

Svantaggi

  • R è semplice da imparare ma alquanto complesso da “dominare”;
  • Per chi non è un programmatore esperto, la linea di comando puo’ incutere timore;
  • La velocità con la quale si possono generare scripts in R puo’ portare ad una difficile manutenzione;
  • Il codice, se mal scritto, puo’ risultare lento in esecuzione.

Riferimenti e risorse

  1. The R Project for Statistical Computing
  2. Quick R
  3. R-bloggers
  4. Programming with Big Data in R

IDE and tools

  1. R Studio
  2. R Open
  3. Orange
  4. Rattle
  5. Deploy R

Online editors

  1. Coding Ground R
  2. R-Fiddle