DataBioSciences
objectifs
organisation
documents_classe
datafiles
Data Sciences
analyse statistique
Un peu de R
Data Base
Machine_Learning
jeux
defis
projets
je_vous_recommande
curieux
coin_des_cracks
divers
autoformation
autoformationdb
Analyse Statistique

Description

Cette page s'alimente au fil de l'eau des documents et des vidéos relatifs aux Ateliers d'Analyse Statistique

qcm1 Corpus 1 - Traitement et analyse des données
 

Les informations contenues dans une base de données sont destinées à être explotées. Dans cette partie nous allons développer plus spécifiquement l'analyse univariée et multivariée et verrons leur importancei dans l'univers de la data science. A cet effet, nous utiliserons l'outil R (interface Rcmdr). Vos projets devront s'en inspirer.

Types des Variables : tout ce qu'il faut savoir (vidéo mp4 de 11 minutes)
Fiche résumé sur les types de variables (fichier pdf)
La Statistique Descriptive, qu'est-ce que c'est ? (apprentissage vidéo de 10 minutes)
Fiche de synthèse sur la statistique descriptive ( fichier pdf)
Calcul des paramètres statistiques et de leurs estimations ( fichier pdf)
Une petite introduction à la Statistique Inférentielle (apprentissage vidéo de 2 minutes 20sec)
Un peu de vocabulaire (fichier pdf)
La Pvalue : l'élément incontournable des statistiques inférentielles (fichier pdf)
Fondements de l'analyse multivariée (fichier pdf)

Les ATELIERS en ANALYSE STATISTIQUE

Cette section est composée de 6 ateliers qui vont vous permettre de vous former en data science en ayant les mains à la pâte. Dans les séances ateliers nous allons nous familiariser avec l'analyse statistique mais également réaliser par étapes une base de données (voir onglet Base de Données) sur la gestion et l'entretien d'arbres répartis en parcelles (Brain storming, Modèle conceptuel des données, Modèle Logique des Données, version ACCESS fonctionnelle, interface...).

Vos projets avanceront en parallèle au fil de ces ateliers.

  Atelier 1 - Travail sur un jeu de données
  Première prise de contact avec un jeu de données (data set) va nous permettre d'installer une stratégie de préparation, de formatage et d'analyse de données en essayant d'en tirer le maximum d'information et en devinant celles qui sont cachées derrière ce fichier.
Fichier "arbres" utilisé lors de cet atelier d'introduction (fichier csv)
Synthèse des informations extraites du fichier arbres.csv (structure, contenu, données manquantes,...) (pdf)

 

  Atelier 2 - La part des logiciels ( > se repoter à la page "Un peu d'R")
  Cette section est composée de petits ateliers qui vont vous permettre de vous former à quelques uns des logiciels employés par les data scientistes.

 

  Atelier 3 - Modèle de Régression Linéaire
  Section consacrée à la regression linéaire simple et multiple. Vous trouverez dans le diaporama l'essentiel concernant la modélisation statistique par régression linéaire (illustré de nombreux schémas) ainsi que des copies d'écran permettant de passer à la pratique avec Rcmdr (analyse du fichier mesure_biotope.csv)
Diaporama cadran la première séance consacrée à la Régression Linéaire Simple (pdf)
Fichier "mesures_biotope" utilisé pour le modèle de Régression Linéaire Simple et Multiple (fichier csv)
Régression Linéaire : quelques repères & pratique avec R (vidéo de 34 minutes)

Les Fiches des Toqué(e)s

Dans cette section, vous retrouverez les fiches-recettes concoctées spécialemnt pour vous pour prendre en main le logiciel R et réaliser vos analyse en toute facilité.

  Devenez une(e) chef(ffe) en quelques minutes
  Première fiche cuisine vous permettant de mijoter une bonne ANOVA avec R. Evidemment, tous les cas ne sont pas traités dans cette fiche. Il vous restera à vous lancer et improviser pour réaliser des recettes encore plus performantes (ANOVA à deux facteurs, ANOVA à mesures répétées, ANCOVA, Test non paramétrique de KRUSKAL-WALLIS, etc...)
La recette de l'ANOVA à un facteur (fichier pdf)