

Introduction à la statistique avec R
Ce cours permet d’apprendre la statistique à l’aide du logiciel libre R.
Présentation
Ce cours permet d’apprendre la statistique à l’aide du logiciel libre R.
Le recours aux mathématiques est minimal. L’objectif est de savoir analyser des données, de comprendre ce que l’on fait, et de pouvoir communiquer ses résultats.
Ce cours s’adresse aux étudiants et praticiens de toutes disciplines qui recherchent une formation pratique. Il sera utile à toute personne ayant le besoin d’analyser un jeu de données réel dans le cadre d’un enseignement, de son activité professionnelle ou de recherche, ou par simple curiosité d’analyser un jeu de données par soi-même (données du web, données publiques…).
Le cours s’appuie sur le logiciel libre R qui est un des logiciels de statistique les plus puissants disponibles actuellement.
Les méthodes abordées sont : les techniques descriptives, les tests, l’analyse de variance, les modèles de régression linéaire et logistique, les données censurées (de survie).
Programme
Semaine 1
Introduction aux statistiques et à R,description d’une variable
- Introduction
- Chapitre 1 : Définitions
- Chapitre 2 : Représentations graphiques
- Chapitre 3 : Mesures de position et de dispersion : les principes
- Chapitre 4 : Mesures de position et de dispersion : la pratique
- Lab 1 : Introduction à R studio, manipulation des fichiers et des variables
Semaine 2
Intervalles de confiance, association entre variables
- Chapitre 5 : Intervalles de confiance
- Chapitre 6 : Coefficient de corrélation
- Chapitre 7 : Risque relatif et odds-ratio
- Lab 2 : Manipulation de données, résumés numériques et graphiques
- Lab 3 : RMarkdown et rapport automatisé
Semaine 3
Tests statistiques et pratique des tests
- Chapitre 8 : Tests statistiques : le “p”
- Chapitre 9 : Tests statistiques : l’approche de Neyman et Pearson
- Chapitre 10 : Comparaison de deux pourcentages
- Chapitre 11 : Comparaison de deux moyennes
- Chapitre 12 : Test de nullité d’une corrélation, divers
- Lab 4 : Mesures d'association, tests statistiques, update sur RMarkdown
Semaine 4
Régression linéaire simple et multiple, régression logistique
- Chapitre 13 : Régression linéaire simple
- Chapitre 14 : Régression linéaire, corrélation et test t
- Chapitre 15 : Régression linéaire multiple, analyse de variance
- Chapitre 16 : Introduction à la régression logistique
- Chapitre 17 : Régression logistique multiple
- Lab 5 : Régression linéaire et logistique
Semaine 5
Données de survie (censurées), méthodes exploratoires multidimensionnelles
- Chapitre 18 : Données de survie ou censurées
- Chapitre 19 : Tests et modèles pour données censurées
- Chapitre 20 : Introduction aux méthodes exploratoires multidimensionnelles
- Chapitre 21 : Analyse en composantes principales
- Chapitre 22 : Classification hiérarchique
Déroulement
Le cours comprend deux volets :
- des chapitres de cours abordant des notions de statistiques et des connaissances essentielles sur le logiciel R
- des "labs": vidéos de pratique du logiciel R sous l’interface RStudio.
Intervenants
BRUNO FALISSARD
Professeur de biostatistique à l'Université Paris-Sud, ancien élève de l'école polytechnique, pédopsychiatre et directeur du CESP/Inserm U1018 (Centre de Recherche en Épidémiologie et Santé des Populations).CHRISTOPHE LALANNE
Ingénieur de recherche (Université Paris-Diderot, AP-HP)
- Pré-requis Aucun prérequis n’est nécessaire
- Début du cours 09 sep 2019
- Fin du cours 20 oct 2019
- Effort estimé 02:00 à 08:00 h/semaine
- Coût Gratuit
- Disciplines Mathématiques et Statistiques
- Langue Français
- Organisateur Université Paris Sud
- Plateforme Fun Mooc
Les Ecoles à la Une

HEPO DAKAR – Ecole des Hautes Etudes Polytechniques de Dakar
Dakar

NEOMA Business School
Rouen-Reims-Paris

Ecole Supérieure Multinationale des Télécommunications – ESMT
Dakar

Blue Mountains International Hotel Management School
Sydney

HEC Montréal
Montréal