DataBioSciences
objectifs
organisation
documents_classe
datafiles
Data Sciences
analyse statistique
Un peu de R
Data Base
Machine_Learning
jeux
defis
projets
je_vous_recommande
curieux
coin_des_cracks
divers
autoformation
autoformationdb
Machine Learning

Description

Cette page s'alimentera des documents et de vidéos concernant spécifiquement le Machine Learning, l'algorithmique, le langage Python et la programmation en Python..

Téléchargement de Logiciels et installation de configurations

Fichier d'installation d'environnement et d'éditeurs de code python user friendly, dont JupyterLab > Winpython
Fichier d'installation d'environnement et d'éditeurs de code python user friendly, dont JupyterLab > Anaconda

Prise en main de l'environnement et du langage python

(analyse du fichier Arbres.csv)

Etape de prise en main de Python : un peu de stats descriptives sur les données du fichier Arbres.

Deux mots concernant la formation en Machine Learning et Python
Dias "mains à la pâte" - Premiers pas et prise en main de Python
Jeu de données d'un échantillon d'arbres : Sample_Tree_TS254G.csv (fichier csv)
Notre premier programme en python (terminaison ipynb avec le résultat de l'exécution des cellules > Jupyter)
Notre premier programme en python (terminaison .py)
Notre deuxième programme en python (terminaison .ipynb) avec des commentaires détaillés

Algorithme & programmation informatique

A propos d'algorithme et de programmation informatique

Fiche de l'algorithme au programme informatique
Algorithme pour réaliser une analyse ANOVA complète (réalisé au tableau en classe)
Le programme (script) écrit en langage R permettant de réaliser une analyse ANOVA complète

Machine Learning / Apprentissage Automatique

> Reconnaissance de fruits

(fichier fruits.csv - training set)

Détéction automatique de fruits en utilisant un fichier de descripteurs de ces fruits

Nous allons comprendre ce qu'est le Machine Learning en travaillant par étapes, les mains à la pâte. Soyez patients, Paris ne s'est pas fait en un jour!

Etape 1 - On découvre, on réfléchit et on démarre l'algorithme de reconnaissance des fruits (en faisant bien la différence entre algorithme et programme Python); l'algorithme est ensuite traduit sans effort en Python. Pour cette première étape on commence par caractériser les oranges. Cette première étape consiste en une reconnaissance sous contrainte mais nous construisons tout de même ainsi notre première IA.

Qu'est-ce que le Machine learning (apprentissage automatique) ?
Dias Premiers pas en apprentissage automatique ("mains à la pâte")
Diaporama support des sénces de machine learning du cahier des charges au prg optimisé (fichier pdf)
Jeu de données d'un échantillon de fruits à reconnaître (fichier csv)
Dias de l'algo au prg python (fichier pptx)
Première version du programme de reconnaissance des oranges avec des commentaires détaillés
Vidéo conseillée sur le Machine Learning

 

Diaporama de cadrage (fichier pptx)
Première version du programme de reconnaissance des oranges (fichier .py)

 

Etape 2 - Comment évaluer les performances de l'algorithme d'apprentissage (ici : apprentissage supervisé); nous allons faire appel à la matrice de confusion et au fameux paramètre "accurancy" pour évaluer la performance de l'algorithme.

Document cadrant la suite de l'apprentissage automatique
Deuxième version du programme : reconnaissance des oranges; matrice de confusion et accuracy
Deuxième version du programme : reconnaissance des oranges; matrice de confusion et accuracy (.py file)

 

Etape 3 - L'algorithme apprend progressivement à reconnaître tous les fruits; au passage on voit comment générer un graphique et réaliser un diagramme en secteur (ou cammenbert ou pie)

Version du programme tentant de reconnaître tous les fruits (essayez de le commenter et de l'améliorer)

Etape 4 - L'apprentissage automatique commence à apparître > l'IA que vous réalisez va se servir des données du dataframe pour construire l'intervalle de fluctuation du diamétre des oranges (cette démarche peut ensuite aisément s'étendre aux autres fruits). Dans un deuxiéme temps, nous allons apprendre à scinder en deux le dataset : le jeu d'apprentissage sur lequel sera échafaudé notre modéle de détection des fruits et le jeu test permettant de confirmer les performaces de l'IA.

Diaporama introduisant la construction de l'intervalle de fluctuation du diamétre des oranges (pdf)
Version construisant l'intervalle de fluctuation du diamétre des oranges à partir des données du dataframe
Scission du dataset en jeu d'apprentissage et jeu test, le modele étant construit sur le jeu d'apprentissage

Etape 5 - A vous de jouer, étudiez cette version et découvrez comment le pgr exploite les données du dataframe pour apprendre (par lui même) à reconnaître (au mieux) les fruits (vous pouvez vous reporter au coin des cracks)