Introduction à la statistique avec R

Ce cours permet d’apprendre la statistique à l’aide du logiciel libre R.

  Présentation

Ce cours permet d’apprendre la statistique à l’aide du logiciel libre R.

Le recours aux mathématiques est minimal. L’objectif est de savoir analyser des données, de comprendre ce que l’on fait, et de pouvoir communiquer ses résultats.

Ce cours s’adresse aux étudiants et praticiens de toutes disciplines qui recherchent une formation pratique. Il sera utile à toute personne ayant le besoin d’analyser un jeu de données réel dans le cadre d’un enseignement, de son activité professionnelle ou de recherche, ou par simple curiosité d’analyser un jeu de données par soi-même (données du web, données publiques…).

Le cours s’appuie sur le logiciel libre R qui est un des logiciels de statistique les plus puissants disponibles actuellement.

Les méthodes abordées sont : les techniques descriptives, les tests, l’analyse de variance, les modèles de régression linéaire et logistique, les données censurées (de survie).

  Programme

Semaine 1
Introduction aux statistiques et à R,description d’une variable
  • Introduction
  • Chapitre 1 : Définitions
  • Chapitre 2 : Représentations graphiques
  • Chapitre 3 : Mesures de position et de dispersion : les principes
  • Chapitre 4 : Mesures de position et de dispersion : la pratique
  • Lab 1 : Introduction à R studio, manipulation des fichiers et des variables
Semaine 2
Intervalles de confiance, association entre variables
  • Chapitre 5 : Intervalles de confiance
  • Chapitre 6 : Coefficient de corrélation
  • Chapitre 7 : Risque relatif et odds-ratio
  • Lab 2 : Manipulation de données, résumés numériques et graphiques
  • Lab 3 : RMarkdown et rapport automatisé
Semaine 3
Tests statistiques et pratique des tests
  • Chapitre 8 : Tests statistiques : le “p”
  • Chapitre 9 : Tests statistiques : l’approche de Neyman et Pearson
  • Chapitre 10 : Comparaison de deux pourcentages
  • Chapitre 11 : Comparaison de deux moyennes
  • Chapitre 12 : Test de nullité d’une corrélation, divers
  • Lab 4 : Mesures d'association, tests statistiques, update sur RMarkdown
Semaine 4
Régression linéaire simple et multiple, régression logistique
  • Chapitre 13 : Régression linéaire simple
  • Chapitre 14 : Régression linéaire, corrélation et test t
  • Chapitre 15 : Régression linéaire multiple, analyse de variance
  • Chapitre 16 : Introduction à la régression logistique
  • Chapitre 17 : Régression logistique multiple
  • Lab 5 : Régression linéaire et logistique
Semaine 5
Données de survie (censurées), méthodes exploratoires multidimensionnelles
  • Chapitre 18 : Données de survie ou censurées
  • Chapitre 19 : Tests et modèles pour données censurées
  • Chapitre 20 : Introduction aux méthodes exploratoires multidimensionnelles
  • Chapitre 21 : Analyse en composantes principales
  • Chapitre 22 : Classification hiérarchique

  Déroulement

Le cours comprend deux volets :
  • des chapitres de cours abordant des notions de statistiques et des connaissances essentielles sur le logiciel R
  • des "labs": vidéos de pratique du logiciel R sous l’interface RStudio.

  Intervenants

BRUNO FALISSARD

Professeur de biostatistique à l'Université Paris-Sud, ancien élève de l'école polytechnique, pédopsychiatre et directeur du CESP/Inserm U1018 (Centre de Recherche en Épidémiologie et Santé des Populations).

CHRISTOPHE LALANNE

Ingénieur de recherche (Université Paris-Diderot, AP-HP)




Les Ecoles à la Une
HEPO Dakar

HEPO DAKAR – Ecole des Hautes Etudes Polytechniques de Dakar

Dakar

Neoma Business School

NEOMA Business School

Rouen-Reims-Paris

Ecole Supérieure Multinationale des Télécommunications

Ecole Supérieure Multinationale des Télécommunications – ESMT

Dakar

Blue Mountains International Hotel Management School

Blue Mountains International Hotel Management School

Sydney

HEC Montreal

HEC Montréal

Montréal