Projects with this topic
-
Le projet est réalisé par ALVAREZ Océane et IBRAHIM Benita, étudiantes en M1 Bio-informatique parcours BBS (Bio-informatique et biologie des Systèmes) de l'Université de Toulouse. Ce projet de fouille de données est un projet réalisé dans le cadre de l'UE : Fouille de données, dirigée par Mr. Roland Barriot : @rbarriot.
Durant cette étude des analyses seront effectuées sur R en fonction d'un dataset choisi. Le projet se décomposera en trois parties : La première consistera en une analyse exploratoire complète du jeu de données enfin d'en comprendre la structure. La seconde correspondra à la phase de conception, durant laquelle une réflexion sera menée sur les méthodes d’analyse à mettre en œuvre et sur les objectifs à poursuivre. Enfin, la troisième partie portera sur la mise en œuvre des analyses choisies, accompagnée d'une évaluation des résultats qui seront obtenus et d'une discussion sur de potentielles améliorations.
En raison d'une appétence particulière pour le domaine de la santé, le choix s'est orienté sur un dataset relatif aux maladies cardiovasculaires. Pour plus d’informations sur les données, consultez la section dédiée et le README.md explicatif : https://gitlab.com/alvarez_oceane/fouille-projet/-/tree/master/data
L'objectif de notre étude est d'obtenir et d’identifier une ou plusieurs méthodes de classification supervisée capables de prédire correctement le type de douleur thoracique à partir des variables cliniques disponibles dans le dataset. Plusieurs méthodes seront comparées comme Naive Bayes, K-NN, LDA et Random Forest. L’obtention d’un ou plusieurs modèles fiables pour prédire correctement la classe des patients à partir des variables explicatives est attendu. Tout comme la visualisation des performances des modèles et la sélection du modèle final le plus pertinent.
Les codes, le rapport et chaque Rmd utilisé lors de l'étude sont disponibles sur ce git.
Updated -
This is an academical project
Updated -
Implementation of Association Rule Mining concept in Machine Learning, which is used for applications in Data Mining
Updated -
Homework code for assignment 3 : K-Means Clustering
Updated -
Vous trouverez toutes les images et icônes de l'application Discord
UpdatedUpdated -
Analyze the gender distribution of leading positions of persons in companies registered to handelsregister.
Updated