Introduction à la statistique avec R

Ce cours permet d’apprendre la statistique à l’aide du logiciel libre R.

  Présentation

Ce cours permet d’apprendre la statistique à l’aide du logiciel libre R.

Le recours aux mathématiques est minimal. L’objectif est de savoir analyser des données, de comprendre ce que l’on fait, et de pouvoir communiquer ses résultats.

Ce cours s’adresse aux étudiants et praticiens de toutes disciplines qui recherchent une formation pratique. Il sera utile à toute personne ayant le besoin d’analyser un jeu de données réel dans le cadre d’un enseignement, de son activité professionnelle ou de recherche, ou par simple curiosité d’analyser un jeu de données par soi-même (données du web, données publiques…).

Le cours s’appuie sur le logiciel libre R qui est un des logiciels de statistique les plus puissants disponibles actuellement.

Les méthodes abordées sont : les techniques descriptives, les tests, l’analyse de variance, les modèles de régression linéaire et logistique, les données censurées (de survie).

  Programme

Semaine 1

Introduction aux statistiques et à R,description d’une variable

  • Introduction
  • Chapitre 1 : Définitions
  • Chapitre 2 : Représentations graphiques
  • Chapitre 3 : Mesures de position et de dispersion : les principes
  • Chapitre 4 : Mesures de position et de dispersion : la pratique
  • Lab 1 : Introduction à R studio, manipulation des fichiers et des variables

Semaine 2

  • Intervalles de confiance, association entre variables
  • Chapitre 5 : Intervalles de confiance
  • Chapitre 6 : Coefficient de corrélation
  • Chapitre 7 : Risque relatif et odds-ratio
  • Lab 2 : Manipulation de données, résumés numériques et graphiques
  • Lab 3 : RMarkdown et rapport automatisé
  • Semaine 3

    Tests statistiques et pratique des tests

  • Chapitre 8 : Tests statistiques : le “p”
  • Chapitre 9 : Tests statistiques : l’approche de Neyman et Pearson
  • Chapitre 10 : Comparaison de deux pourcentages
  • Chapitre 11 : Comparaison de deux moyennes
  • Chapitre 12 : Test de nullité d’une corrélation, divers
  • Lab 4 : Mesures d'association, tests statistiques, update sur RMarkdown
  • Semaine 4

    Régression linéaire simple et multiple, régression logistique

  • Chapitre 13 : Régression linéaire simple
  • Chapitre 14 : Régression linéaire, corrélation et test t
  • Chapitre 15 : Régression linéaire multiple, analyse de variance
  • Chapitre 16 : Introduction à la régression logistique
  • Chapitre 17 : Régression logistique multiple
  • Lab 5 : Régression linéaire et logistique
  • Semaine 5

    Données de survie (censurées), méthodes exploratoires multidimensionnelles

  • Chapitre 18 : Données de survie ou censurées
  • Chapitre 19 : Tests et modèles pour données censurées
  • Chapitre 20 : Introduction aux méthodes exploratoires multidimensionnelles
  • Chapitre 21 : Analyse en composantes principales
  • Chapitre 22 : Classification hiérarchique
  •   Déroulement

    Le cours comprend deux volets :

    • des chapitres de cours abordant des notions de statistiques et des connaissances essentielles sur le logiciel R
    • des "labs": vidéos de pratique du logiciel R sous l’interface RStudio.

      Intervenants

    BRUNO FALISSARD

    Professeur de biostatistique à l'Université Paris-Sud, ancien élève de l'école polytechnique, pédopsychiatre et directeur du CESP/Inserm U1018 (Centre de Recherche en Épidémiologie et Santé des Populations).

    CHRISTOPHE LALANNE

    Ingénieur de recherche (Université Paris-Diderot, AP-HP)




    Les Ecoles à la Une
    Neoma Business School

    NEOMA Business School

    Rouen-Reims-Paris

    Ecole Supérieure Multinationale des Télécommunications

    Ecole Supérieure Multinationale des Télécommunications – ESMT

    Dakar

    BEM Dakar

    BEM Dakar

    Dakar

    Blue Mountains International Hotel Management School

    Blue Mountains International Hotel Management School

    Sydney

    HEC Montreal

    HEC Montréal

    Montréal