R
R est un langage et environnement pour calculs statistiques et graphiques. Il s'agit d'un projet GNU semblable au langage et environnement S (on l'appelle aussi GNU-S). R peut être considéré comme une implémentation différente de S.
R procure une large gamme de techniques statistiques (modèles linéaires et non-linéaires, tests statistiques classiques, analyse de séries temporelles, classification...) et graphiques. Le langage S est souvent choisi en recherche statistique méthodologique.
L'une des forces de R est la facilité de production de graphiques de bonne qualité destinés à la publication, incluant des symboles mathématiques et formules si nécessaire. Un grand soin a été consacré au choix des options par défaut des graphiques, mais l'utilisateur garde le contrôle complet du design de ses graphiques.
À noter, si on s'intéresse à R et à la statistique en général, le site du pôle bioninformatique lyonnais de l'université Lyon 1 propose une masse impressionante de documentation sur le sujet. Il s'agit de présentations, supports de cours et TD présentant une approche progressive des stats, du débutant au thésard. Et, cerise sur le gâteau, tous les exemples sont donnés avec utilisation de R. Un sacré travail entièrement en accès libre!
(Extrait de "R pour les débutants", par Emmanuel Paradis, Institut des Sciences de l'Evolution, Univ. Montpellier II)
R est un système d'analyse statistique et graphique crée par Ross Ihaka et Robert Gentleman [1]. R est à la fois un logiciel et un langage qualifié de dialecte du langage S crée par ATT Bell Laboratories. S est disponible sous la forme du logiciel S-PLUS commercialise par la compagnie Insightful.
Il y a des différences importantes dans la conception de R et de S : ceux qui veulent en savoir plus sur ce point peuvent se reporter à l'article de Ihaka et Gentleman (1996) ou au R-FAQ (sur le site officiel) dont une copie est également distribuée avec le logiciel. R est distribué librement sous les termes de la GNU General Public Licence ; son développement et sa distribution sont assurés par plusieurs statisticiens rassemblés dans le R Development Core Team.
R est disponible sous plusieurs formes : le code écrit principalement en C (et certaines routines en Fortran), surtout pour les machines Unix et Linux, ou des executables precompiles pour Windows, Linux (Debian, Mandrake, RedHat, SuSe), Macintosh et Alpha Unix. Les fichiers pour installer R, à partir du code ou des executables, sont distribués à partir du site officiel où se trouvent aussi les instructions à suivre pour l'installation sur chaque système. En ce qui concerne les distributions de Linux (Debian, ...), les executables sont generalement disponibles pour les versions les plus récentes de ces distributions.
R comporte de nombreuses fonctions pour les analyses statistiques et les graphiques ; ceux-ci sont visualises immediatement dans une fenêtre propre et peuvent être exportés sous divers formats (jpg, png, bmp, ps, pdf, emf, pictex, xfig ; les formats disponibles peuvent dependre du système d'exploitation). Le langage R permet, par exemple, de programmer des boucles qui vont analyser successi- vement différents jeux de donnees. Il est aussi possible de combiner dans le même programme différentes fonctions statistiques pour réaliser des analyses plus complexes. Les utilisateurs de R peuvent bénéficier des nombreux programmes ecrits pour S et disponibles sur internet [2]], la plupart de ces programmes étant directement utilisables avec R.
De prime abord, R peut sembler trop complexe pour une utilisation par un non-specialiste. Ce n'est pas forcément le cas. En fait, R privilégie la flexibilité. Alors qu'un logiciel classique affichera directement les résultats d'une analyse, avec R ces resultats sont stockes dans un "objet", si bien qu'une analyse peut être faite sans qu'aucun résultat ne soit affiché. L'utilisateur peut être déconcerté par ceci, mais cette facilité se révèle xtrêmement utile. En effet, l'utilisateur peut alors extraire uniquement la portion des résultats qui l'interessent. Par exemple, si l'on doit faire une serie de 20 regressions et que l'on veuille comparer les coefficients des différentes regressions, R pourra afficher uniquement les coefficients estimés : les résultats tiendront donc sur une ligne, alors qu'un logiciel plus classique pourra ouvrir 20 fenêtres de resultats.
[1] Ihaka R. et Gentleman R. (1996), "R : a language for data analysis and graphics", Journal of Computational and Graphical Statistics 5 : 299-314
[2] Par exemple ici
Autre référence:
Fox, John and Andersen, Robert (January 2005). "Using the R Statistical Computing Environment to Teach Social Statistics Courses" (PDF). Department of Sociology, McMaster University (doc disponible çi-dessous)
Lien(s)
- R-project (Site officiel)
- Travaux pratiques par Christophe Pallier et Christophe Lalanne
- Quelques notes d'un utilisateur de R
- RKward (interface pour R)
Catégories
Classement des logiciels par activité- Suites bureautiques
- Ecrire
- Communiquer
- Bibliographies, références
- Naviguer
- Web et partage
- Langues anciennes
- Graphisme, présentations
- Cartographier
- Gérer son temps
- Statistiques
- Traitement des sources
- Distributions Linux