Construire des package sans peine avec devtools, Roxygen2 et testthat

La prochaine séance du groupe R aura lieu le 1er avril 2014 de 13:00 à 14:00 en salle 539 du bâtiment MK1 de l’INSEE, 18Bld Adolphe Pinard, 75014, Paris, accès par la rue Legrand à Malakoff, métro ligne 13, arrêt Porte de Vanves ou Malakoff plateau de Vanves. 

J’y présenterai le package devtools d’Hadley Wickham. Ce package apporte toute une série d’outils qui facilitent le processus de développement. Associé à Roxygen2 pour la documentation et testthat pour les tests, la création de package devient simple. Devtools contient également des outils pour faciliter la diffusion et l’installation de packages qui ne sont pas sur le CRAN.

 

Pour suivre la séance en visio : pour les INSEE, composer le 2493, pour les non INSEE, composer le 03 20 00 44 67 puis l’identifiant 2493
Pour suivre la séance en conf call : 01 58 72 75 02
Les slides seront mis à disposition sur ce post avant la séance.
A bientôt,
Jean-François Eudeline

Choisir le "meilleur" modèle de prévision sous R avec le package CARET

La prochaine séance du groupe R aura lieu le 7 mars de 13:00 à 14:00 en salle 539 du bâtiment MK1 de l’INSEE, 18Bld Adolphe Pinard, 75014, Paris, accès par la rue Legrand à Malakoff, métro ligne 13, arrêt Porte de Vanves ou Malakoff plateau de Vanves. 

Goulven Salic (Bluestone) nous présentera l’utilisation du package CARET.
Des centaines de packages existent sous R pour construire un modèle de prévision. Ces derniers peuvent présenter des différences dans la spécification des modèles. Le package caret (classification and regression training) est une boîte à outil qui permet d’uniformiser l’usage de ces packages dans les différentes étapes de la construction d’un modèle d’apprentissage : le traitement et le découpages des données, la sélection de variables, le "tuning" des paramètres par validation croisée ou encore la mesure de l’importance des variables. Il s’agit donc d’un outil qui rationalise le processus de choix du "meilleur" modèle dans une problématique de prévision.
Pour suivre la séance en visio : pour les INSEE, composer le 2143, pour les non INSEE, composer le 03 20 00 44 67 puis l’identifiant 2143
Les slides seront mis à disposition sur ce post avant la séance.
A bientôt,
Jean-François Eudeline

Python VS R

Le 3 octobre de 13:00 à 14:00 en salle 539 du bâtiment MK1 de l’INSEE, 18Bld Adolphe Pinard, 75014, Paris, accès par la rue Legrand à Malakoff, métro ligne 13, arrêt Porte de Vanves ou Malakoff plateau de Vanves.

Alexis Eidelman (Direction du Trésor) nous présentera une analyse comparative de Python et R.

Pour suivre la séance en conf call :  0158727502En visio : pour les INSEE, composer le 2303, pour les non INSEE, composer le 03 20 00 44 67 puis l’identifiant 2303

A jeudi

Comment dépasser la RAM sous R

La prochaine séance du groupe R aura lieu le 10 septembre de 13:00 à 14:00 en salle 539 du bâtiment MK1 de l’INSEE, 18Bld Adolphe Pinard, 75014, Paris, accès par la rue Legrand à Malakoff, métro ligne 13, arrêt Porte de Vanves ou Malakoff plateau de Vanves. 

Matthieu Cornec (CDiscount) nous présentera Comment dépasser la RAM sous R.

Les slides seront mis à disposition sur ce post avant la séance.
A bientôt,
Julyan Arbel

Big data sous R avec le package rmr

La prochaine séance du groupe R aura lieu le 18 juin de 13:00 à 14:00 en salle 539 du bâtiment MK1 de l’INSEE, 18Bld Adolphe Pinard, 75014, Paris, accès par la rue Legrand à Malakoff, métro ligne 13, arrêt Porte de Vanves ou Malakoff plateau de Vanves. 

Bastien Riera nous présentera une illustration de traitement de données massives sous R avec le package rmr
 
Si ce que sous-tend le terme "Big Data" vous échappe, nous vous proposons une séance pédagogique, avec bien sur des illustrations sous R. Le 18 juin, Bastien Riera nous présentera le travail qu’il avait réalisé chez Bluestone dans le cadre de son stage de fin d’étude à l’ENSAI :
- Rappel sur ce qu’est le Big Data
- Explication de la logique du MapReduce (cadre algorithmique des traitements Big Data)
- Illustration sous R avec le package "rmr"
- Le tout autour d’une analyse des tweets de la campagne présidentielle française de 2012
Il sera possible de suivre la prochaine réunion du groupe R depuis l’extérieur, de deux manières :
- en appelant par téléphone le 04 37 21 10 65 : avec le son mais sans l’image

- par visioconférence multipoints. Voici la procédure d’appel et les identifiants :

Pour les stations visioconférence de l’INSEE à partir de votre station, composer à l’aide de la télécommande le 6624 et lancez l’appel en IP.
Pour les stations extérieures (hors INSEE)Le site extérieur composera à l’aide de la télécommande le 0320161487##6624 et lancera l’appel.