Construire des package sans peine avec devtools, Roxygen2 et testthat

La prochaine séance du groupe R aura lieu le 1er avril 2014 de 13:00 à 14:00 en salle 539 du bâtiment MK1 de l’INSEE, 18Bld Adolphe Pinard, 75014, Paris, accès par la rue Legrand à Malakoff, métro ligne 13, arrêt Porte de Vanves ou Malakoff plateau de Vanves. 

J’y présenterai le package devtools d’Hadley Wickham. Ce package apporte toute une série d’outils qui facilitent le processus de développement. Associé à Roxygen2 pour la documentation et testthat pour les tests, la création de package devient simple. Devtools contient également des outils pour faciliter la diffusion et l’installation de packages qui ne sont pas sur le CRAN.

Pour suivre la séance en visio : pour les INSEE, composer le 2493, pour les non INSEE, composer le 03 20 00 44 67 puis l’identifiant 2493
Pour suivre la séance en conf call : 01 58 72 75 02
Les slides seront mis à disposition sur ce post avant la séance.
A bientôt,
Jean-François Eudeline

Choisir le « meilleur » modèle de prévision sous R avec le package CARET

La prochaine séance du groupe R aura lieu le 7 mars de 13:00 à 14:00 en salle 539 du bâtiment MK1 de l’INSEE, 18Bld Adolphe Pinard, 75014, Paris, accès par la rue Legrand à Malakoff, métro ligne 13, arrêt Porte de Vanves ou Malakoff plateau de Vanves. 

Goulven Salic (Bluestone) nous présentera l’utilisation du package CARET.
Des centaines de packages existent sous R pour construire un modèle de prévision. Ces derniers peuvent présenter des différences dans la spécification des modèles. Le package caret (classification and regression training) est une boîte à outil qui permet d’uniformiser l’usage de ces packages dans les différentes étapes de la construction d’un modèle d’apprentissage : le traitement et le découpages des données, la sélection de variables, le « tuning » des paramètres par validation croisée ou encore la mesure de l’importance des variables. Il s’agit donc d’un outil qui rationalise le processus de choix du « meilleur » modèle dans une problématique de prévision.
Pour suivre la séance en visio : pour les INSEE, composer le 2143, pour les non INSEE, composer le 03 20 00 44 67 puis l’identifiant 2143
Les slides seront mis à disposition sur ce post avant la séance.
A bientôt,
Jean-François Eudeline