Formation
Manipulation de données (dplyr, tidyr, tidyverse, data.table)
La formation en quelques mots
Cette formation s'adresse à des personnes souhaitant découvrir le tidyverse, notamment les packages dplyr et tidyr, devenu la syntaxe de référence pour la manipulation de données sous R. Ils rationalisent, homogénéisent et rendent plus efficaces en termes de ressources toutes les opérations de transformation, création et manipulations de données.
Il ne s’agit pas d’une formation sur la méthodologie statistique mais d’une formation sur le logiciel R.
Pré-requis
Programme pédagogique simplifié
Cette formation s’adresse à des personnes souhaitant découvrir le tidyverse, notamment les packages dplyr et tidyr, devenu la syntaxe de référence pour la manipulation de données sous R.
Ils rationalisent, homogénéisent et rendent plus efficaces en termes de ressources toutes les opérations de transformation, création et manipulations de données. Il ne s’agit pas d’une formation sur la méthodologie statistique mais d’une formation sur le logiciel R.
Objectifs pédagogiques
A l’issue de cette formation, l’apprenant sera capable de :
- Savoir organiser son environnement de travail,
- Installer et charger un package,
- Utiliser R en mode console,
- Exécuter et exploiter des scripts simples,
- Obtenir de l’aide en ligne, rechercher des commandes permettant de réaliser l’action souhaitée,
- Créer et manipuler les objets suivants : vecteurs, facteurs, data frames,
- Filtrer un tableau de données, importer des données,
- Connaître les principes et les principaux composants du tidyverse,
- Lire et écrire des scripts basés sur les commandes dplyr,
- Comprendre la logique de sa syntaxe,
- Comprendre l’utilisation de l’opérateur de pipe « %>% »,
- Comprendre les gains en ressources et temps de calcul permis,
- Mettre en œuvre les manipulations de données, des plus élémentaires aux jointures de tables,
- Manipuler des chaînes de caractères,
- Manipuler des dates et des heures.