Profil professionnel
Vue d'ensemble
Expérience
Formation
Compétences
Informations complémentaires
Langues
Affiliations professionnelles
Chronologie
Generic
Mohammed EL MOUATASSIM

Mohammed EL MOUATASSIM

Data Scientist

Profil professionnel

Professionnel doté de 17 années d'expérience dans le domaine Java/JEE, combinées à une solide formation dans le domaine de Data Science et une forte aptitude à acquérir de nouvelles connaissances. Capable à la fois de travailler en équipe et de fonctionner de manière autonome.

Vue d'ensemble

18
18
years of professional experience
3
3
years of post-secondary education

Expérience

Data Scientist

OpenClassRooms
Paris
09.2020 - 03.2024
  • Analyser des données de systèmes éducatifs :

➢ Valider la qualité du jeu de données (données manquantes, dupliquées) / Décrire les informations contenues dans le jeu de données / Sélectionner les informations qui semblent pertinentes.

➢ Déterminer des ordres de grandeurs des indicateurs statistiques classiques pour les différentes zones géographiques et pays du monde.

  • Concevoir une application au service de la santé publique : Attribuer un nutri-score aux produits alimentaires selon leurs apports nutritifs :

➢ Automatiser les opérations de nettoyage
➢ Description et analyse univariée des différentes variables importantes avec les visualisations associées
➢ Analyse multivariée et les résultats statistiques associés
➢ Préparation des données d’entrainement, de validation et de test pour les modèles de classification
➢ Entrainements et réglage de leurs hyperparamétres / Sélection du meilleur modèle

  • Anticiper les besoins en consommation de bâtiments : Prédire les émissions de CO2 et la consommation d'énergie de bâtiments non destinés à l'habitation :

➢ Analyse exploratoire / Feature engineering
➢ Entranement de plusieurs modèles de prédictions pour émissions de CO2 et consommation totale d’énergie

➢ Identification du modèle final pour chaque tache

  • Segmenter les clients d'un site e-commerce : Comprendre les différents types d'utilisateurs en utilisant des
    méthodes non supervisées pour regrouper des clients de profils similaires. Ces catégories vont être utilisées par l’équipe Marketing pour mieux communiquer :

➢ Nettoyage et analyse exploratoire
➢ Élaboration du modèle de segmentation des clients
➢ Détermination de la fréquence à laquelle la segmentation doit être mise à jour pour rester pertinente, afin de pouvoir effectuer un devis de contrat de maintenance.

  • Classifier automatiquement des biens de consommation : Étude de faisabilité d'un moteur de classification d'articles, basé sur une image et une description, pour l'automatisation de l'attribution de la catégorie de l'article :

➢ Prétraitement des données texte et image / Extraction de features
➢ Réduction en 2 dimensions , afin de projeter les produits sur un graphique 2D, sous la forme de points dont la couleur correspondra à la catégorie réelle.
➢ Analyse du graphique afin d’en déduire ou pas, à l’aide de descriptions ou des images, la faisabilité de regrouper automatiquement des produits de même catégorie
➢ Calcul d'une mesure de similarité entre les catégories réelles et les catégories issues d’une segmentation en cluster

  • Implémenter un modèle de scoring : Mise en œuvre d'un outil de 'scoring crédit' pour calculer la probabilité qu'un client rembourse son crédit, puis classifie la demande en crédit accordé ou refusé :

➢ Construire un modèle de scoring qui donnera une prédiction sur la probabilité de faillite d'un client de façon automatique

➢ Construire un dashboard interactif à destination des gestionnaires de la relation client permettant d'interpréter les prédictions faites par le modèle, et d’améliorer la connaissance client des chargés de
relation client
➢ Mettre en production le modèle de scoring de prédiction à l’aide d’une API, ainsi que le dashboard interactif qui appelle l’API pour les prédictions

  • Déployer des modèles dans le cloud(AWS) : Mettre à disposition du grand public une application mobile qui permettrait aux utilisateurs de prendre en photo un fruit et d'obtenir des information sur ce fruit

➢ Mise en place d'une architecture Big Data (EMR, S3, IAM)
➢ Développement des scripts en PySpark pour le traitement de diffusion des poids du modèle Tensorflow sur les clusters et réduction de dimension type PCA

Ingenieur d'études Java/JEE

GFI
Saint-Ouen
02.2011 - 09.2020
  • Conception, développent et deploiement de divers applications java/jee.

Ingenieur d'études Java/JEE

Prenium
Ivry-sur-Seine
03.2006 - 01.2011
  • Conception, développent et deploiement de divers applications java/jee.



Formation

Certification - Data Science

OpenClassRooms
Paris
/2022 - /2023

Certificat - Data Science

Ecole Polytechnique Executive Education
Palaiseau
/2018 - /2019

Concepteur Développeur - Java/J2EE

CyberLog
Paris
/2006 - /2006

Maîtrise - Informatique

Université Pierre Marie Curie
Paris
09.1992 - 06.1995

Compétences

    Langages : Python / Java / JavaScript
    Librairies : Pandas / Numpy / Matplotlib /Seaborn
    Machine Learning : Scikit-learn
    Deep learning : TensorFlow/Keras
    Cloud : AWS (IAM, EMR, EC2, S3)
    Outils de Big Data : Hadoop / Spark
    Dashboard : Tableau / Streamlit
    BDD : Oracle / MangoDB
    OS : Linux / Windows
    Environnements : Anaconda (Jupyter, Spyder) / IntelliJ / Eclipse
    CI/CD : GitHub / GitLab / MLFlow / Jenkins
    Tests Unitaires : PyTest(Evidently) / JUnit

Informations complémentaires

  • Lecture
  • Sport

Langues

Français
Bilingue
Anglais
Opérationnel
Arabe
Langue maternelle

Affiliations professionnelles

➢ Clients : Cerner France - Accor Service - SNCF - OFII - GENERALI - PSA - ACOSS - ASIP Santé
➢ Sécteurs d'activités : Transport - Assurance - Tourisme - Santé - Immigration - Automobile - Import/Export

Chronologie

Data Scientist

OpenClassRooms
09.2020 - 03.2024

Ingenieur d'études Java/JEE

GFI
02.2011 - 09.2020

Ingenieur d'études Java/JEE

Prenium
03.2006 - 01.2011

Maîtrise - Informatique

Université Pierre Marie Curie
09.1992 - 06.1995

Certification - Data Science

OpenClassRooms
/2022 - /2023

Certificat - Data Science

Ecole Polytechnique Executive Education
/2018 - /2019

Concepteur Développeur - Java/J2EE

CyberLog
/2006 - /2006
Mohammed EL MOUATASSIMData Scientist