Python VS R

Le 3 octobre de 13:00 à 14:00 en salle 539 du bâtiment MK1 de l’INSEE, 18Bld Adolphe Pinard, 75014, Paris, accès par la rue Legrand à Malakoff, métro ligne 13, arrêt Porte de Vanves ou Malakoff plateau de Vanves.

Alexis Eidelman (Direction du Trésor) nous présentera une analyse comparative de Python et R.

Pour suivre la séance en conf call :  0158727502En visio : pour les INSEE, composer le 2303, pour les non INSEE, composer le 03 20 00 44 67 puis l’identifiant 2303

A jeudi

Big data sous R avec le package rmr

La prochaine séance du groupe R aura lieu le 18 juin de 13:00 à 14:00 en salle 539 du bâtiment MK1 de l’INSEE, 18Bld Adolphe Pinard, 75014, Paris, accès par la rue Legrand à Malakoff, métro ligne 13, arrêt Porte de Vanves ou Malakoff plateau de Vanves. 

Bastien Riera nous présentera une illustration de traitement de données massives sous R avec le package rmr
 
Si ce que sous-tend le terme « Big Data » vous échappe, nous vous proposons une séance pédagogique, avec bien sur des illustrations sous R. Le 18 juin, Bastien Riera nous présentera le travail qu’il avait réalisé chez Bluestone dans le cadre de son stage de fin d’étude à l’ENSAI :
– Rappel sur ce qu’est le Big Data
– Explication de la logique du MapReduce (cadre algorithmique des traitements Big Data)
– Illustration sous R avec le package « rmr »
– Le tout autour d’une analyse des tweets de la campagne présidentielle française de 2012
Il sera possible de suivre la prochaine réunion du groupe R depuis l’extérieur, de deux manières :
– en appelant par téléphone le 04 37 21 10 65 : avec le son mais sans l’image

– par visioconférence multipoints. Voici la procédure d’appel et les identifiants :

Pour les stations visioconférence de l’INSEE à partir de votre station, composer à l’aide de la télécommande le 6624 et lancez l’appel en IP.
Pour les stations extérieures (hors INSEE)Le site extérieur composera à l’aide de la télécommande le 0320161487##6624 et lancera l’appel.

Exports vers Office

La séance du 10 avril 2013 (de 13h à 14h en salle 539, INSEE, bâtiment MK1, 15 Boulevard Gabriel Péri, 92245 MALAKOFF Métro : Malakoff/Plateau de Vanves) sera consacrée aux exports vers excel et vers word, avec en ligne de mire la possibilité de mettre en place des générations automatiques de documents (packages XLConnect, R2wd, RCOM). Cette présentation fait suite à d’autres séances du groupe consacrées à la génération automatique de documents. C’est François Marical (bluestone) qui assurera cette présentation.

Possibilité de suivre le séminaire en conf-call grâce au bons soins de Matthieu Cornec en appelant le 04 37 21 10 65

Les thèmes abordés lors des séances de mai et juin seront les suivants :

  • 17 Mai 2013 : séance consacrée à un exemple de mise en place de R dans une unité de production de l’INSEE (la division des enquêtes de conjonctures en l’occurence) afin d’illustrer les apports de R par rapport aux technologies qui préexistaient. Cet exemple est intéressant dans le sens où avant l’arrivée de R dans cette entité, de multiples technologies coexistaient (SAS, GAUSS, VBA) avec en outre un niveau d’automatisation des tâches répétitives assez faible et un morcellement de la connaissance des processus entre plusieurs personnes. La montée progressive de R en remplacement des autres technologies a réellement permis des gains de productivité. Cela ne veut pas dire que la même chose n’aurait pas pu être réalisée avec une autre technologie mais en tous les cas cela a fonctionné. Cette séance sera présentée par Jean-François Eudeline de la division des enquêtes de conjoncture de l’INSEE.
  • 18 Juin 2013 : la séance sera consacrée à un exemple d’étude en environnement « Big Data » sous R. Cet exemple permettra à Bastien Riera, consultant chez Bluestone, d’expliquer le MapReduce (cadre algorithmique du Big Data) et son implémentation en R