1  Généralités

R désigne à la fois un langage de programmation statistique, et le logiciel permettant de l’utiliser. Il s’agit d’un logiciel libre, gratuit et multiplateforme, développé par des bénévoles. R est utilisable en ligne de commande, ou via une interface graphique, R Commander (Fox, 2017), qui ne propose toutefois qu’une toute petite partie des possibilités du langage.

1.1 Obtenir de l’aide pour utiliser R

De nombreux manuels permettent de débuter efficacement en R : par exemple, Bertrand & Maumy-Bertrand (2023) ou Husson et al. (2018) en langue française.

Une des forces de R est sa très large communauté d’utilisateurs, que l’on peut notamment retrouver sur :

De plus, de la documentation technique et des tutoriels sont disponibles sur le CRAN, en Français et/ou Anglais. De nombreuses chaînes Youtube sont également à découvrir, par exemple celle de François Husson pour la statistique mutivariée.

Enfin, R est open source : le code des fonctions peut être consulté (simplement en tapant leur nom dans la console R !), et l’aide de chaque fonction fournit habituellement l’adresse électronique de son auteur.

1.2 La console R

1.2.1 Premières interactions avec la console R

R se présente basiquement comme une console. Le signe > (appelé prompt) en début de ligne indique que R est disponible pour recevoir une instruction.

Tester les commandes suivantes dans la console R (appuyer sur Entrée pour les exécuter) :

2+3
[1] 5
5^2 - 1
[1] 24

Plus exactement, vous devriez obtenir ceci dans la console R :

Figure 1.1: Calculs arithémtiques simples en R

Si la saisie d’une commande est interrompue en appuyant trop tôt sur la touche Entrée, la console R offre la possibilité de compléter la saisie sur la ligne suivante, qui commence alors par le symbole + (ce symbole indique que R attend la fin d’une instruction saisie plus haut) :

Figure 1.2: Saisie d’une instruction incomplète.

1.2.2 Fonctions R

Outre les opérations arithmétiques de base (+, -, *, /, ^), la façon usuelle d’intergair avec R est d’utiliser des fonctions. Par exemple, pour calculer un logarithme (par défaut en base \(e\)) :

log(100)
[1] 4.60517

Le comportement des fonctions R est dicté par leurs arguments (i.e., leurs options), possédant un nom, et dont la valeur par défaut est indiquée dans la documentation. Par exemple, pour changer la base du logarithme et passer en base 10 :

log(100, base = 10)
[1] 2

En R, on sépare les différents arguments d’une même fonction par des virgules. Le synopsis général d’appel à une fonction est donc de la forme :

fonction(argument1 = valeur1, argument2 = valeur2, ...)

1.3 Fonctions de base et packages R additionnels

R est livré avec une certaine collection de fonctions de base, permettant de réaliser les tâches les plus courantes (représentations graphiques usuelles, tests classiques, etc.).

Pour mettre en œuvre des méthodes “rares” ou spécifiques à une discipline, il existe près de 20000 packages additionnels sur le CRAN (en janvier 2025), dont on peut obtenir la liste complète grâce à la fonction install.packages().

Il n’est nécessaire de les installer qu’une seule fois, mais ils doivent ensuite être chargés à chaque démarrage du logiciel via la fonction library().

1.3.1 Quatre instructions essentielles

  • Trouver une fonction répondant à un besoin précis (accès Internet requis) : RSiteSearch(" "). Par exemple, pour rechercher en ligne toutes les fonctions associées au mot clé “Mantel” :

    RSiteSearch("mantel")
  • Installer un package additionnel : install.packages(" "). Par exemple, pour installer le package {vegan}, on exécutera :

    install.packages("vegan", dep = TRUE)
  • Charger un package additionnel : library(). Par exemple, pour charger le package {vegan}, on exécutera :

    library(vegan)
  • Obtenir de l’aide sur une fonction : help(). Par exemple, pour consulter l’aide de la fonction adonis(), on éxécutera :

    help(adonis)

1.3.2 Exercice : rechercher et installer un package

On se propose de :

  1. Rechercher de l’information sur un package et une fonction permettant de réaliser un test de normalité assez peu connu, le test d’Anderson-Darling.
  2. Installer un package additionnel permettant de réaliser ce test.
  3. Charger ce package.
  4. Consulter l’aide de la fonction correspondante.
  5. Exécuter (par un copier-coller dans la console R) les exemples figurant en bas de la page de l’aide de cette fonction.

1.4 Remarques sur la console R

  • Les flèches directionnelles et du clavier permettent de naviguer dans l’historique des lignes de commande déjà exécutées.
  • La touche Tabulation est liée aux fonctionnalités d’auto-complétion : elle permet de saisir dans la console seulement le début (non-ambigu) du nom d’une fonction ou d’un objet R, et de laisser R compléter automatiquement le reste de son nom (pouvez-vous citer les deux intérêts principaux de cette fonctionnalité ?).
  • La combinaison de touches Ctrl + L permet d’effacer le contenu actuellement affiché dans la console. Il ne s’agit que de nettoyer l’affichage : rien n’est supprimé dans l’opération, et tout l’historique reste accessible.