DataBioSciences
objectifs
organisation
documents_classe
datafiles
Data Sciences
analyse statistique
Un peu de R
Data Base
Machine_Learning
jeux
defis
projets
je_vous_recommande
curieux
coin_des_cracks
divers
autoformation
autoformationdb

Fichiers et jeux de Données utilisés

dans le parcours de l'UE Data Science en Biologie [L3S6]

Cette liste n'est pas exhaustive.

Espace Numérique de Travail (ENT) - Le coin des data

ENT - Le coin des data. Cette liste n'est pas exhaustive >>> D'autres données pourront être utilisées ou envoyées par mail aux étudiants.

[dernière mise à jour le 22/01/2025]

Les Fichiers de Données

Fichier de données "échantillon d'arbres" (fichier csv)
Jeu de données d'un échantillon d'arbres un peu plus fourni et plus cohérent (fichier csv)
Fichier de données "fruits" (fichier csv)
Fichier de données "fruits4" plus complet "(fichier csv)
Fichier "mesures_biotope" utilisé pour le modèle de Régression Linéaire Simple et Multiple (fichier csv)

 

Fichier au format CSV (Comma-Separated Values) : les enregistrements sont découpés en champs; les valeurs sont séparées par des points virgules. Le format est typiquement texte (ASCII étendu). Ce type de fichier est importable dans tous les logiciels (fichier universel par excellence) et peut être lu directement par EXCEL qui détecte automatiquement les colonnes grâce au séparateur par défaut. Attention au format anglo-saxon qui n'est pas le même que le nôtre : séparateur=virgule et point décimal. Nous verrons que l'encodage est également un élément à considérer.

Organisation du travail : vous allez comprendre au fil du temps que la meilleure façon de procéder est de créer un répertoire où vous rangerez vos scripts R, un autre pour vos scripts python, un autres ou vous rangerez vos données brutes, un autre répertoire pour les résultats et enfin un répertoire pour sauvegarder les fichiers images résultant de l'analyse graphique, sans oublier un répertoire pour les documents de type résumé ou rapport.

< De nouveaux documents seront proposés au fil du temps>