Introduzione a R (Statistical programming)

R e’ un linguaggio di programmazione ideale per il computo statistico e la generazione di plot grafici. R sta rapidamente diventando un riferimento per i data scientists. Questo articolo descrive brevemente le potenzialità di R e i suoi campi applicativi.
R in sintesi
R è un ambiente di sviluppo software libero indirizzato alla data analysis e alla statistical analysis. L’obbiettivo di R è quello di raccogliere una grande varietà di tecniche statistiche facilitandone il plotting grafico. La statistica è quella disciplina che studia quantitaivamente e qualitativamente un particolare fenomeno in modo non deterministico, ovvero senza conoscerne le cause a priori.
Lo sviluppo della piattaforma è gestito da una comunità molto attiva. La piattaforma offre strumenti per la data manipulation, il calcolo statistico e la grafica. L’ambiente puo’ essere esteso includendo packages esterni sviluppati dalla stessa comunity.
Vantaggi
- R è open source e libero;
- E’ semplice generare grafici da calcoli statistici;
- Estesa riproducibilità attraverso gli scripts;
- Sono disponibili svariate estensioni libere fornite dalla community (packages);
- E’ possibile utilizzare una CLI implementata ad hoc per R.
Svantaggi
- R è semplice da imparare ma alquanto complesso da “dominare”;
- Per chi non è un programmatore esperto, la linea di comando puo’ incutere timore;
- La velocità con la quale si possono generare scripts in R puo’ portare ad una difficile manutenzione;
- Il codice, se mal scritto, puo’ risultare lento in esecuzione.
Riferimenti e risorse
IDE and tools
Online editors