Fichiers et jeux de Données utilisés
dans le parcours de l'UE Data Science en Biologie [L3S6]
Cette liste n'est pas exhaustive.
Espace Numérique de Travail (ENT) - Le coin des data ENT - Le coin des data. Cette liste n'est pas exhaustive >>> D'autres données pourront être utilisées ou envoyées par mail aux étudiants.
[dernière mise à jour le 22/01/2025]
Les Fichiers de Données
Fichier au format CSV (Comma-Separated Values) : les enregistrements sont découpés en champs; les valeurs sont séparées par des points virgules. Le format est typiquement texte (ASCII étendu). Ce type de fichier est importable dans tous les logiciels (fichier universel par excellence) et peut être lu directement par EXCEL qui détecte automatiquement les colonnes grâce au séparateur par défaut. Attention au format anglo-saxon qui n'est pas le même que le nôtre : séparateur=virgule et point décimal. Nous verrons que l'encodage est également un élément à considérer.
Organisation du travail : vous allez comprendre au fil du temps que la meilleure façon de procéder est de créer un répertoire où vous rangerez vos scripts R, un autre pour vos scripts python, un autres ou vous rangerez vos données brutes, un autre répertoire pour les résultats et enfin un répertoire pour sauvegarder les fichiers images résultant de l'analyse graphique, sans oublier un répertoire pour les documents de type résumé ou rapport.
< De nouveaux documents seront proposés au fil du temps>