thomas@mebarki: ~/portfolio

# status: disponible · 2026 · remote

whoami# qui suis-je

Thomas Mebarki

ML Engineer · Entrepreneur

cat manifesto.txt# ma philosophie

« Je construis des modèles qui servent le business, pas l'inverse. »

Fondateur d'EGIR, Grada et JobScout. J'amène le ML jusqu'en production, là où il crée de la valeur.

ls projects/# mes projets — cliquables

open _# me contacter

// approche

Entre la recherche et le produit, je choisis ce qui marche en production.

01

De la donnée à la prod

Je ne m'arrête pas au notebook. Pipelines, déploiement, monitoring : le modèle tourne en conditions réelles.

02

ML orienté valeur

Une métrique business avant une métrique de papier. Le bon modèle est celui qui change une décision.

03

Fondateur produit

EGIR, Grada, JobScout : je conçois, je code et je livre des produits complets, pas seulement des POC.

$ ls ~/projects

Projets

01

EGIR

SaaS pour restaurateurs avec IA

Plateforme de gestion analytique pour restaurateurs. Fiches techniques assistées par IA, propagation automatique des coûts, dashboard de rentabilité. Freemium 79€-119€/mois, pilote collectivité avec la Mairie de Gravelines.

SaaSML

En lancement

Statut

79€/mois

Offre lancement

Gravelines

Pilote B2G

02

Grada Trading

Trading Bitcoin automatisé, on-chain via dHEDGE

Stratégie de trading systématique sur Bitcoin, exécutée automatiquement on-chain via une vault dHEDGE publiquement auditable sur Polygon. Phase d'expérimentation en conditions réelles — performance vérifiable en direct.

MLTime Series

Expérimentation

Statut

On-chain

Exécution

Polygon

Réseau

03

JobScout

Agent autonome de recherche d'emploi

Agent IA qui scrape 9 plateformes, score les offres via pipeline 3-tier (pgvector + LLM DeepSeek), et envoie digests email. Notion sync bidirectionnelle. 140+ tests, déployé sur VPS OVH.

AutomationML

9 scrapers

Sources

pgvector + LLM

Scoring

140+

Tests

04

Schneider Energy

Prédiction de consommation énergétique

Modèle de prédiction de consommation énergétique et d'émissions CO₂ de bâtiments pour Schneider Electric. Random Forest (énergie) et XGBoost (CO₂) sur des caractéristiques de bâtiment (surface, ENERGY STAR, âge, type). R² = 0.80, +45% vs baseline linéaire.

ML

0.80

+45%

vs Baseline

1,650

Bâtiments

05

StackOverflow NLP

Suggestion de tags multi-label

Système de suggestion automatique de tags pour Stack Overflow. Comparaison TF-IDF, Word2Vec, USE, BERT fine-tuné. Précision@5 = 78%, -31% corrections modérateurs.

NLP

78%

Precision@5

62%

Recall@5

-31%

Corrections modérateurs

06

BackMarket Segmentation

Segmentation clients RFM avec KMeans

Segmentation automatisée sur 750k clients Back Market (périmètre France) par analyse RFM et clustering K-Means en 4 segments actionnables. +25% taux d'ouverture emails après personnalisation.

ML

~750k

Clients

4

Segments

0.49

Silhouette

07

SantéVet Dogs

Classification de races canines

Classificateur d'images 120 races pour SantéVet utilisant ResNet50V2 + SVM RBF avec calibration Platt scaling. Architecture CNN + classifieur pour probabilités fiables (pricing assurance).

CV

78%

Top-1 Accuracy

90%

Top-3 Accuracy

120

Races

$ ./contact

Un modèle à mettre en production ?

Missions ML, projets data, ou simplement échanger. La boîte de réception est ouverte.