Certificat d’université : Junior data analyst
Université Catholique de Louvain
ODB-1002008
op: 1 september 2020
Deze opleiding komt in aanmerking voor
- Opleidingscheques
- Vlaams opleidingsverlof
Aantal studiepunten: 20
Eindbeoordeling voorzien: ja
Blended leren: nee
Mentoropleiding: nee
Extra informatie: https://uclouvain.be/prog-jdai2fcopent in nieuw venster
Doelgroep
(i) Les travailleurs intégrés dans différents secteurs d’activités faisant face, au sein de leur entreprise, aux évolutions technologiques et aux nouveaux besoins en termes d’analyse de données et de communication qui en découlent.
(ii) Les demandeurs d’emploi inoccupés avec un diplôme de niveau master, voire même docteur, notamment dans le domaine des sciences humaines et sociales.
(iii) Les personnes venant d’obtenir un master notamment dans le domaine des sciences humaines et sociales et qui ont reçu une formation théorique de qualité mais ne possèdent que très peu de pratique des techniques enseignées en analyse de données.
Conditions d'admission :
Les candidats / candidates doivent avoir réussi l’équivalent de minimum 10 crédits de formation de base en statistique et/ou domaines liés et être diplômés de l’enseignement supérieur (baccalauréat ou master).
Voorwaarden
Specifieke voorwaarden per opleidingsincentive
Elke opleidingsincentive heeft zijn eigen specifieke voorwaarden om te bepalen of u recht heeft. Kijk na of u voldoet aan de voorwaarden van de opleidingsincentive waarvan u gebruik wil maken (Vlaams opleidingsverlof, Vlaams opleidingskrediet en opleidingscheques voor werknemers
Opleidingscheques: beperkende voorwaarde opleidingsniveau
Deze opleiding kan u betalen met een opleidingscheque. Bent u hooggeschoold (u behaalde een graduaats-, bachelor- of masterdiploma)? Dan kan dat enkel als u een ‘attest loopbaanbegeleiding’ heeft van maximaal 6 jaar oud. In dit attest verklaart een loopbaanbegeleider dat de opleiding noodzakelijk is voor de uitvoering van uw persoonlijk ontwikkelplan (POP).
Verhoogde tegemoetkoming 1
Als u geen diploma secundair onderwijs hebt, kan u voor deze opleiding een opleidingscheque aanvragen waarvan de subsidie gelijk is aan het factuurbedrag, met een maximum van 250 euro per schooljaar.
Inhoud van de opleiding
Module 1 : Préparer les données pour prendre des décisions.
Contenu: Excel, Business Intelligence (dashboards), nettoyage de données.
Ce module vise l'acquisition de compétences en gestion et visualisation de données à travers des séances principalement appliquées, où les participants s'exercent directement dans les logiciels présentés. Le nettoyage de données sera abordé en Excel et via un deuxième outil (R). La visualisation est abordée via la création de dashboards en Excel et l'apprentissage d'un outil "Business Intelligence" dédié à la visualisation et au dashboarding. Les participants maîtriseront la gestion des données comme partie intégrante du processus de traitement statistique, du nettoyage des données à leur visualisation.
Module 2 : Comprendre et combattre l’incertitude
Contenu: rappels et renforcements en probabilité et statistique
Ce module couvre les statistiques descriptives (types de variable, mesures de tendance centrale et de
dispersion, etc.), les probabilités (variables aléatoires, distributions de probabilité, etc.) et l'inférence statistique (intervalles de confiance, tests d'hypothèse, p-valeurs, etc.). L'objectif de ce module est de revoir et approfondir des concepts déjà connus des participants.
Module 3 : Coder
Contenu: programmation en R pour la gestion de données et les analyses statistiques
Ce module aborde les bases de la programmation à travers le logiciel libre R (https://cran.rproject.org/).(opent in nieuw venster).) Les sujets suivants sont abordés: bases de R et types d'objets, graphiques, boucles et fonctions et notions d'algorithmique. L'apprentissage durant les séances en présentiel est complété par des travaux personnels et l'usage de R pour les projets intermédiaire et final et pour certaines autres séances. L'objectif est que les participants puissent utiliser R pour la gestion et l'analyse de données au quotidien et aient les bases nécessaires pour continuer à s'auto-former aux applications plus avancées du logiciel et à ses évolutions.
Module 4 : Explorer, modéliser, classifier, et prédire
Contenu: régression linéaire simple et multiple, régression logistique, analyses multivariées exploratoires (analyse en composantes principales, clustering)
Ce module aborde les modèles de régression (simple, multiple et logistique), à la fois d'un point de vue théorique et pratique. Les participants seront capables d'identifier le type de modèle le plus approprié pour des données, de les modéliser et d'évaluer la qualité et la pertinence des modèles obtenus. La partie sur les analyses multivariées exploratoires couvre les analyses factorielles (analyse en composantes principales) ainsi que le clustering, d'un point de vue théorique et pratique. Les participants mettront en œuvre les méthodes apprises à l'aide du logiciel R.
Module 5 : Kaléidoscope - Sujets d'ouverture
Contenu: analyse de réseau, Customer Relationship Management (CRM), Data Mining, Structured Query Language (SQL), enquêtes
Ce module présente un kaléidoscope d'approches et techniques liées à l'analyse de données et utiles dans un contexte professionnel. Chaque sujet fait l'objet d'une introduction d'un jour afin que les participants maîtrisent les concepts de base du domaine.
La séance sur l'analyse de réseau aborde les techniques permettant de traiter des données liées aux réseaux sociaux, de les visualiser et les quantifier. La séance sur le CRM aborde les concepts-clés du CRM avant de les mettre en œuvre sur une base de données typique du domaine. La séance Data Mining aborde les modèles de classification. La séance SQL aborde les bases du langage SQL via la gestion et l'analyse d'une base de données dans un format approprié. La séance enquête aborde les différentes étapes d'une enquête, entre autres l'échantillonnage, le design de questionnaire et les marges d'erreur.