BioDataScience-Course
diff --git a/‎inst/tutorials/C01Lb_lda/C01Lb_lda.Rmd‎
Lines changed: 205 additions & 0 deletions b/‎inst/tutorials/C01Lb_lda/C01Lb_lda.Rmd‎
Lines changed: 205 additions & 0 deletions
@@ -0,0 +1,205 @@
+---
+title: "Analyse discriminante linéaire"
+author: "Guyliann Engels & Philippe Grosjean"
+description: "**SDD III** Exercices sur l'ADL"
+tutorial:
+  id: "C01Lb_lda"
+  version: 1.0.0/5
+output:
+  learnr::tutorial:
+    progressive: true
+    allow_skip: true
+runtime: shiny_prerendered
+---
+
+```{r setup, include=FALSE}
+BioDataScience3::learnr_setup()
+SciViews::R()
+library(mlearning)
+
+read("biometry", package = "BioDataScience") %>.%
+  select(., gender, weight, height, wrist) %>.%
+  drop_na(.) -> bio
+
+# Prepare learn test and set test
+n <- nrow(bio)
+n_learning <- round(n * 2/3)
+set.seed(164)
+learning <- sample(1:n, n_learning)
+
+bio_learn <- bio[learning, ]
+bio_test <- bio[-learning, ]
+
+bio_lda <- mlLda(formula = gender ~ ., data = bio_learn)
+```
+
+```{r, echo=FALSE}
+BioDataScience3::learnr_banner()
+```
+
+```{r, context="server"}
+BioDataScience3::learnr_server(input, output, session)
+```
+
+----
+
+## Objectifs
+
+- Réalisez une analyse discriminante linéaire.
+
+```{r, message=FALSE, warning=FALSE}
+# exercice 1 : résolution
+read("biometry", package = "BioDataScience") %>.%
+  select(., gender, weight, height, wrist) %>.%
+  drop_na(.) -> bio
+
+# Prepare learn test and set test
+n <- nrow(bio)
+n_learning <- round(n * 2/3)
+set.seed(164)
+learning <- sample(1:n, n_learning)
+
+bio_learn <- bio[learning, ]
+bio_test <- bio[-learning, ]
+
+bio_lda <- mlLda(formula = gender ~ ., data = bio_learn)
+bio_conf <- confusion(predict(bio_lda, bio_test), bio_test$gender)
+conf_tab <- summary(bio_conf)
+```
+
+## Création de votre modèle
+
+
+Vous avez à votre disposition le jeu de données `bio` dont un résumé est proposé ci-dessous. 
+
+```{r, echo = TRUE}
+skimr::skim(bio)
+```
+
+Ce tableau comprend `r ncol(bio)` variables. La variable `gender` est une variable facteur avec 2 niveaux : M (men), W (Women). Il y a également 3 variables numérique qui sont les attributs sur les items :  
+
+- weight : la masse en kg
+- height : la taille en cm
+- wrist : la circonférence du poignet en mm
+
+Cet tableau est divisé en un set d'apprentissage et un set de test. Le set d'apprentissage comprend 2/3 du tableau principal. Ce tableau nommé  `bio_learn` comprend `r nrow(bio_learn)` 
+
+```{r, echo=TRUE}
+table(bio_learn$gender)
+```
+
+Le tableau de test se nomme `bio_test` et comprend `r nrow(bio_test)`.
+
+```{r}
+table(bio_test$gender)
+```
+
+Réalisez un modèle avec le set d'apprentissage. Prédisez la variable `gender` à l'aide des 3 variables numériques. 
+
+```{r lda1_h2, exercise = TRUE}
+bio_lda <- mlLda(formula = ___ ~ ___, data = ___)
+summary(bio_lda)
+```
+
+```{r lda1_h2-hint-1}
+bio_lda <- mlLda(formula = ___ ~ ___, data = bio_learn)
+summary(bio_lda)
+```
+
+```{r lda1_h2-solution}
+bio_lda <- mlLda(formula = gender ~ ., data = bio_learn)
+summary(bio_lda)
+```
+
+```{r lda1_h2-check}
+grade_code("Votre premier modèle est une réussite.")
+```
+
+*La formule doit être écrite sous sa forme condensée*
+
+## Performance de votre modèle.
+
+Vous venez de créer votre outils de classification qui se nomme `bio_lda`. Vous devez maintenant tester les performances de votre modèle.
+
+```{r lda2_h2, exercise = TRUE}
+# prédiction sur le set de test
+bio_pred <- predict(___, ___)
+# matrice de confusion
+bio_conf <- confusion(___, ___$___)
+# analyse du résultat 
+bio_conf
+summary(bio_conf)
+```
+
+```{r lda2_h2-hint-1}
+# prédiction sur le set de test
+bio_pred <- predict(bio_lda, bio_test)
+# matrice de confusion
+bio_conf <- confusion(bio_pred, ___$___)
+# analyse du résultat 
+bio_conf
+summary(bio_conf)
+```
+
+```{r lda2_h2-solution}
+# prédiction sur le set de test
+bio_pred <- predict(bio_lda, bio_test)
+# matrice de confusion
+bio_conf <- confusion(bio_pred, bio_test$gender)
+# analyse du résultat 
+bio_conf
+summary(bio_conf)
+```
+
+```{r lda2_h2-check}
+grade_code("Vous venez de réaliser vos premiers tests de performance.")
+```
+
+Analysez vos premiers tests de performance 
+
+```{r lda_qu}
+quiz(
+  question("Combien d'items du set de test sont correctement classé ?",
+    answer(sprintf("%1.f", sum(conf_tab$TP)), correct = TRUE),
+    answer(sprintf("%1.f", sum(conf_tab$Auto))),
+    answer(sprintf("%1.f", conf_tab$Manu[1])),
+    answer(sprintf("%1.f", conf_tab$TN[2])),
+    answer("Aucune des réponses proposées"),
+    allow_retry = TRUE,
+    incorrect = "Mauvaise réponse. Recommencez afin de trouver la bonne réponse",
+    correct = "Bravo, c'est correct !"
+    ),
+  question("Quel est le taux d'erreur global (en %) ?",
+    answer(sprintf("%.1f", 100*(1-(sum(conf_tab$TP)/sum(conf_tab$Auto)))), correct = TRUE),
+    answer(sprintf("%.1f", 100*(sum(conf_tab$TP)/sum(conf_tab$Auto)))),
+  answer(sprintf("%3.f", sum(conf_tab$Auto)-sum(conf_tab$TP))),
+    answer(sprintf("%3.f", conf_tab$TN[2])),
+    answer("Aucune des réponses proposées"),
+    allow_retry = TRUE,
+    incorrect = "Mauvaise réponse. Recommencez afin de trouver la bonne réponse",
+    correct = "Bravo, c'est correct !"
+    ),
+  question("Quel est le taux de vrai positif pour les hommes (M) ?",
+    answer(sprintf("%.3f", conf_tab[row.names(conf_tab) == "M", ]$Recall), correct = TRUE),
+    answer(sprintf("%.3f", conf_tab[row.names(conf_tab) == "M", ]$Fscore)),
+    answer(sprintf("%3.f", sum(conf_tab$Auto)-sum(conf_tab$TP))),
+    answer(sprintf("%.3f", conf_tab[row.names(conf_tab) == "W", ]$Recall)),
+    answer("Aucune des réponses proposées"),
+    allow_retry = TRUE,
+    incorrect = "Mauvaise réponse. Recommencez afin de trouver la bonne réponse",
+    correct = "Bravo, c'est correct !"
+    )
+  )
+```
+
+## Conclusion
+
+```{r comm_noscore, echo=FALSE}
+question_text(
+  "Laissez-nous vos impressions sur cet outil pédagogique",
+  answer("", TRUE, message = "Pas de commentaires... C'est bien aussi."),
+  incorrect = "Vos commentaires sont enregistrés.",
+  placeholder = "Entrez vos commentaires ici...",
+  allow_retry = TRUE
+)
+```