Cours n°1 : Introduction à la Data Science. Vous allez Rencontrer des professionnels de la Data Science, Explorer quelques définitions de la Data Science, Découvrir la Data Science dans un contexte business, et Découvrir quelques cas pratiques de projets en Data Sciences. Inscrivez-vous ici
Cours n°2 : Découverte des outils open-source utilisés en Data Science. Vous découvrirez Jupyter Notebooks, Apache Zeppelin, RStudio IDE, Seahorse avec Apache Spark, OpenRefine, et la particularité de chacun d'eux. Inscrivez-vous ici
Cours n°3 : Méthodologie de travail en Data Science. Vous allez apprendre les principales étapes nécessaires à la résolution d'un problème en Data Science et comment réfléchir à chaque niveau. Il s'agit principalement de Définir le problème commercial, Collecter et analyser de données, Construire le modèle et le déployer, puis le Feedback. Inscrivez-vous ici
Intermédiaire : Les bases de la Statistique
Il n'y a point de data science sans une connaissance basique en Statistique. C'est à cet effet que nous avons choisi ce quatrième cours sur les notions de base en Statistique. Vous allez apprendre entre autres, ce qu'est la Statistique descriptive, la Variance, une Probabilité, la Correlation, la Visualisation de données, et comment implémenter chacune d'elles. Ce cours est accompagné d'un exercice pratique entièrement guidé explorant le sujet : les beaux/belles professeurs obtiennent-ils de meilleures évaluations dans l’enseignement ? Le logiciel statistique SPSS est utilisé pour les cas pratiques. Inscrivez-vous ici
Nous enchaînons dès ici une étape technique dans l'apprentissage. Il s'agit d'une initiation aux 3 principales langages de programmation en Data-Science : Python, R, et Scala. Vous êtes encouragés à suivre les cours d'initiation des 3 langages pour les raisons suivantes :
- Certaines entreprises imposent le langage dans lequel la solution que vous leur proposez doit être développée, et ces 3 langages sont les plus utilisés sur le marché.
- Vous avez assez d'éléments de jugement pour choisir objectivement celui dans lequel vous vous spécialiserez.
Le premier langage à étudier est
Python. A cet effet, un document a été conçu afin de vous aider à mettre en place votre espace de travail. Vous pouvez le consulter
ici sur notre drive.
Cours n°5 : Introduction au langage Python. Vous allez apprendre ce qu'est Python et quelle est son utilité, l'application de Python, comment définir des variables, les ensembles et instructions conditionnelles, le but d'avoir des fonctions en Python, comment utiliser des fichiers pour lire et écrire des données, et comment utiliser Pandas; une librairie indispensable pour quiconque tente une analyse de données en Python. Inscrivez-vous ici
Cours n°6 : Analyse des données avec Python. Vous allez apprendre comment Importer des ensembles de données, Nettoyer et préparer les données pour analyse, Manipuler des pandas DataFrame, Résumer les données, Construire des modèles d'apprentissage automatique en utilisant scikit-learn, etConstruire des pipelines de données. Inscrivez-vous ici
Cours n°7 : Visualisation des données avec Python. Vous allez apprendre certaines meilleures pratiques pour la visualisation des données et la création de figures, l’histoire et l’architecture de Matplotlib, comment générer différentes visualisation à l'aide de Matplotlib, Seaborn; une autre librairie de visualisation de données en Python, et son utilisation pour créer des graphiques statistiques attrayants, puis comment utiliser Folium pour créer des cartes et visualiser des données géospatiales. Inscrivez-vous ici
Cours n°8 : Machine Learning avec Python. Vous allez découvrir, entre autres, Comment la modélisation statistique se rapporte au Machine Learning et la différence entre les deux, des cas pratiques de Machine Learning et comment cela impacte la société, Quels sont les algorithmes populaires (pour la Regression, une Classification, le Clustering), Comment construire des modèles (avec le découpage Train/Test, Gradient Descent, MSE...), etc. Inscrivez-vous ici