Mohammed EL MOUATASSIM - Data Scientist

Profil professionnel

Professionnel doté de 17 années d'expérience dans le domaine Java/JEE, combinées à une solide formation dans le domaine de Data Science et une forte aptitude à acquérir de nouvelles connaissances. Capable à la fois de travailler en équipe et de fonctionner de manière autonome.

Vue d'ensemble

18

years of professional experience

3

years of post-secondary education

Expérience

Data Scientist

OpenClassRooms

Paris

2020.09 - 2024.03

Analyser des données de systèmes éducatifs :

➢ Valider la qualité du jeu de données (données manquantes, dupliquées) / Décrire les informations contenues dans le jeu de données / Sélectionner les informations qui semblent pertinentes.

➢ Déterminer des ordres de grandeurs des indicateurs statistiques classiques pour les différentes zones géographiques et pays du monde.

Concevoir une application au service de la santé publique : Attribuer un nutri-score aux produits alimentaires selon leurs apports nutritifs :

➢ Automatiser les opérations de nettoyage
➢ Description et analyse univariée des différentes variables importantes avec les visualisations associées
➢ Analyse multivariée et les résultats statistiques associés
➢ Préparation des données d’entrainement, de validation et de test pour les modèles de classification
➢ Entrainements et réglage de leurs hyperparamétres / Sélection du meilleur modèle

Anticiper les besoins en consommation de bâtiments : Prédire les émissions de CO2 et la consommation d'énergie de bâtiments non destinés à l'habitation :

➢ Analyse exploratoire / Feature engineering
➢ Entranement de plusieurs modèles de prédictions pour émissions de CO2 et consommation totale d’énergie

➢ Identification du modèle final pour chaque tache

Segmenter les clients d'un site e-commerce : Comprendre les différents types d'utilisateurs en utilisant des
méthodes non supervisées pour regrouper des clients de profils similaires. Ces catégories vont être utilisées par l’équipe Marketing pour mieux communiquer :

➢ Nettoyage et analyse exploratoire
➢ Élaboration du modèle de segmentation des clients
➢ Détermination de la fréquence à laquelle la segmentation doit être mise à jour pour rester pertinente, afin de pouvoir effectuer un devis de contrat de maintenance.

Classifier automatiquement des biens de consommation : Étude de faisabilité d'un moteur de classification d'articles, basé sur une image et une description, pour l'automatisation de l'attribution de la catégorie de l'article :

➢ Prétraitement des données texte et image / Extraction de features
➢ Réduction en 2 dimensions , afin de projeter les produits sur un graphique 2D, sous la forme de points dont la couleur correspondra à la catégorie réelle.
➢ Analyse du graphique afin d’en déduire ou pas, à l’aide de descriptions ou des images, la faisabilité de regrouper automatiquement des produits de même catégorie
➢ Calcul d'une mesure de similarité entre les catégories réelles et les catégories issues d’une segmentation en cluster

Implémenter un modèle de scoring : Mise en œuvre d'un outil de 'scoring crédit' pour calculer la probabilité qu'un client rembourse son crédit, puis classifie la demande en crédit accordé ou refusé :

➢ Construire un modèle de scoring qui donnera une prédiction sur la probabilité de faillite d'un client de façon automatique

➢ Construire un dashboard interactif à destination des gestionnaires de la relation client permettant d'interpréter les prédictions faites par le modèle, et d’améliorer la connaissance client des chargés de
relation client
➢ Mettre en production le modèle de scoring de prédiction à l’aide d’une API, ainsi que le dashboard interactif qui appelle l’API pour les prédictions

Déployer des modèles dans le cloud(AWS) : Mettre à disposition du grand public une application mobile qui permettrait aux utilisateurs de prendre en photo un fruit et d'obtenir des information sur ce fruit

➢ Mise en place d'une architecture Big Data (EMR, S3, IAM)
➢ Développement des scripts en PySpark pour le traitement de diffusion des poids du modèle Tensorflow sur les clusters et réduction de dimension type PCA

Ingenieur d'études Java/JEE

GFI

Saint-Ouen

2011.02 - 2020.09

Conception, développent et deploiement de divers applications java/jee.

Ingenieur d'études Java/JEE

Prenium

Ivry-sur-Seine

2006.03 - 2011.01

Conception, développent et deploiement de divers applications java/jee.

Formation

Certification - Data Science

OpenClassRooms

Paris

/2022 - /2023

Certificat - Data Science

Ecole Polytechnique Executive Education

Palaiseau

/2018 - /2019

Concepteur Développeur - Java/J2EE

CyberLog

Paris

/2006 - /2006

Maîtrise - Informatique

Université Pierre Marie Curie

Paris

1992.09 - 1995.06

Compétences

Langages : Python / Java / JavaScript
Librairies : Pandas / Numpy / Matplotlib /Seaborn
Machine Learning : Scikit-learn
Deep learning : TensorFlow/Keras
Cloud : AWS (IAM, EMR, EC2, S3)
Outils de Big Data : Hadoop / Spark
Dashboard : Tableau / Streamlit
BDD : Oracle / MangoDB
OS : Linux / Windows
Environnements : Anaconda (Jupyter, Spyder) / IntelliJ / Eclipse
CI/CD : GitHub / GitLab / MLFlow / Jenkins
Tests Unitaires : PyTest(Evidently) / JUnit

Informations complémentaires

Lecture
Sport

Langues

Français

Bilingue

Anglais

Opérationnel

Arabe

Langue maternelle

Affiliations professionnelles

➢ Clients : Cerner France - Accor Service - SNCF - OFII - GENERALI - PSA - ACOSS - ASIP Santé
➢ Sécteurs d'activités : Transport - Assurance - Tourisme - Santé - Immigration - Automobile - Import/Export

Chronologie

Data Scientist

OpenClassRooms

2020.09 - 2024.03

Ingenieur d'études Java/JEE

GFI

2011.02 - 2020.09

Ingenieur d'études Java/JEE

Prenium

2006.03 - 2011.01

Maîtrise - Informatique

Université Pierre Marie Curie

1992.09 - 1995.06

Certification - Data Science

OpenClassRooms

/2022 - /2023

Certificat - Data Science

Ecole Polytechnique Executive Education

/2018 - /2019

Concepteur Développeur - Java/J2EE

CyberLog

/2006 - /2006