Reinforcement learning contre LLMs : 937 M€ pour Ineffable Intelligence et la bifurcation stratégique de l'IA française
Un collègue qui travaille chez un fonds parisien m'a envoyé un message lapidaire fin avril : « Tu as vu le seed d'Ineffable ? 937 M€. En reinforcement learning. C'est plus gros que la Série B de Mistral. » Puis, après une pause : « Personne ne sait si c'est génial ou complètement dingue. »
Ce message résume assez bien l'état de confusion qui règne dans l'écosystème français de l'IA en ce printemps 2026. Les données du mois d'avril révèlent quelque chose de plus profond qu'une simple accumulation de gros chèques. Elles montrent une fracture technique : d'un côté, le reinforcement learning (RL) capte 937 M€ sur un seul deal. De l'autre, les LLMs — les modèles de langage type ChatGPT — ont sécurisé 385 M€ pour Mistral AI en janvier et 3,5 M€ pour Phospho en avril. Deux approches de l'intelligence artificielle. Deux visions du futur. Et la France qui finance les deux.
Ce deep-dive décortique cette bifurcation. Pas pour désigner un gagnant — ce serait malhonnête — mais pour comprendre ce qui se joue réellement derrière les chiffres.
Deux approches de l'IA que tout sépare (sauf le battage médiatique)
Avant d'aller plus loin, posons les bases. Parce que « IA » est devenu un fourre-tout qui recouvre des réalités techniques radicalement différentes.
Les LLMs — Large Language Models — sont les vedettes médiatiques. Mistral, GPT, Claude. Leur principe : ingérer des quantités astronomiques de texte, apprendre les patterns statistiques du langage, puis générer du texte cohérent. On leur donne une question, ils produisent une réponse. C'est de la prédiction de mots, poussée à une échelle absurde. Ça marche remarquablement bien pour traduire, résumer, coder, converser. Leur limite ? Ils ne « comprennent » rien. Ils prédisent.
Le reinforcement learning fonctionne autrement. Imaginez un enfant qui apprend à marcher. Il essaie, tombe, se relève, ajuste. Personne ne lui fournit un dataset de 10 millions de démarches humaines. Il apprend par essai-erreur, guidé par une récompense simple : rester debout. Le RL applique cette logique à des agents logiciels. Un algorithme explore un environnement, prend des décisions, reçoit un feedback (positif ou négatif), et s'améliore itérativement. C'est comme ça que DeepMind a battu les champions humains à Go en 2016. Pas en lisant des millions de parties, mais en jouant contre lui-même des centaines de millions de fois.
La différence fondamentale tient en une phrase. Les LLMs apprennent à imiter. Le RL apprend à agir.
Et cette distinction, qui peut sembler académique, a des conséquences très concrètes sur le type d'entreprises qui se créent, les marchés qu'elles adressent, et — c'est ce qui nous intéresse — les montants qu'elles lèvent.
Avril 2026 : la radiographie d'un mois qui raconte deux histoires
Les données collectées sur FrenchWeb et Maddyness dessinent un tableau saisissant. En filtrant les deals IA du mois d'avril (et en incluant la Série B de Mistral annoncée en janvier, qui reste structurante pour l'analyse), on obtient cinq levées qui forment un paysage cohérent.
| Startup | Montant | Stade | Approche IA | Date |
|---|---|---|---|---|
| Ineffable Intelligence | 937 M€ | Seed | Reinforcement learning | Avril 2026 |
| Mistral AI | 385 M€ | Série B | LLM / IA générative | Janvier 2026 |
| Sereact | 93 M€ | Série B | IA physique (robotique) | Avril 2026 |
| SquareMind | 15,3 M€ | Non communiqué | IA imagerie médicale | Avril 2026 |
| Phospho | 3,5 M€ | Seed | Outils évaluation LLM | Avril 2026 |
Total IA : 1 433,8 M€. Sur un mois où le total global des levées françaises tourne autour de 1,1 milliard.
Autrement dit : l'IA ne domine pas le venture français. Elle l'écrase.
Mais la composition de ce total raconte une histoire inattendue. Si vous aviez demandé à n'importe quel analyste fin 2025 « quelle approche IA va capter le plus de capital en France ? », la réponse aurait été unanime : les LLMs. Mistral. L'IA générative. Le texte, les chatbots, les copilots. Sauf que les données d'avril 2026 disent le contraire.
Le RL, avec le seul deal d'Ineffable Intelligence, capte 937 M€. Les LLMs, même en cumulant Mistral et Phospho, atteignent 388,5 M€.
Le RL a levé 2,4 fois plus que les LLMs. Sur un seul deal.
Ineffable Intelligence : le pari qui défie la grille de lecture habituelle
Qu'une startup lève 937 M€ en seed, c'est déjà aberrant. Que ce soit pour du reinforcement learning, c'est un signal fort.
Le RL a connu une traversée du désert. Après l'engouement AlphaGo (2016) puis AlphaFold (2020), le focus des investisseurs s'est massivement déplacé vers les LLMs. Plus faciles à démontrer. Plus immédiatement monétisables. Plus sexy dans un pitch deck. « On fait du GPT mais pour [insérer industrie] » est devenu le template le plus financé de l'histoire du venture.
Le RL, lui, demande de la patience. Un agent RL a besoin de millions d'itérations avant de devenir compétent. L'infrastructure de simulation est coûteuse. Les résultats sont parfois spectaculaires, parfois nuls. Et surtout, le RL brille dans des domaines où les LLMs peinent : la prise de décision en temps réel, l'optimisation de systèmes complexes, le contrôle robotique, la stratégie multi-agents.
Ineffable Intelligence, d'après FrenchWeb, se positionne explicitement en opposition aux LLMs. Le titre de l'article qui couvre leur levée ne laisse aucune ambiguïté : « Reinforcement learning vs LLM ». Ce n'est pas un pivot. C'est une thèse contrarian, financée à hauteur d'un milliard.
Et voici le détail qui change la perspective : un seed de 937 M€ signifie que les investisseurs ne financent pas un produit. Ils financent une conviction technique. À ce stade, il n'y a probablement pas de revenus significatifs. Peut-être même pas de produit commercialisable. Ce que les VCs achètent, c'est la croyance que le reinforcement learning va résoudre des problèmes que les LLMs ne peuvent pas toucher.
C'est un pari à horizon long. Et c'est exactement ce qui le rend intéressant à analyser.
Le camp LLM n'est pas en reste — mais il mute
Pendant que le RL frappe un grand coup, l'écosystème LLM français continue de se structurer. Simplement, il évolue.
Mistral AI, avec ses 385 M€ en Série B et une valorisation estimée à 5,8 milliards d'euros (d'après les données du dataset), reste le porte-drapeau. Mais Mistral n'est plus une startup au sens classique. C'est une plateforme d'infrastructure, un fournisseur de modèles pour entreprises, un acteur géopolitique dans la course à la souveraineté IA européenne. Son modèle économique ressemble de plus en plus à celui d'un éditeur logiciel B2B qu'à celui d'un labo de recherche. Pour une analyse détaillée du deal Mistral, le décryptage de la Série B à 5,8 milliards de valorisation couvre le sujet en profondeur.
Phospho, de son côté, incarne un mouvement différent. Avec 3,5 M€ en seed, portés par Y Combinator et Kima Ventures, cette startup parisienne construit des outils d'analytics et d'évaluation pour applications LLM. Autrement dit : Phospho ne fait pas de l'IA. Phospho fait de l'outillage pour ceux qui font de l'IA. C'est la pioche et la pelle de la ruée vers l'or.
Ce positionnement est malin. Pendant que tout le monde se bat pour créer le meilleur modèle, Phospho se dit : « peu importe qui gagne la course aux modèles, tout le monde aura besoin de mesurer si son IA fonctionne correctement. » C'est un raisonnement de type Levi Strauss pendant la ruée vers l'or californienne. Et le fait qu'Y Combinator — le plus sélectif des accélérateurs américains — ait parié dessus, depuis Paris, en dit long.
L'IA physique : le troisième camp que personne ne nomme
Il y a un angle mort dans le débat RL vs LLM. Deux levées d'avril 2026 ne rentrent proprement dans aucune des deux catégories. Ou plutôt, elles piochent dans les deux.
Sereact (93 M€, Série B) développe de l'IA appliquée à la robotique industrielle. SquareMind (15,3 M€) construit une plateforme d'imagerie dermatologique robotisée. Les deux font de l'IA qui touche le monde physique. Les deux utilisent probablement des composants de vision par ordinateur, de réseaux de neurones convolutifs, peut-être du RL pour l'optimisation de mouvements robotiques, peut-être des transformers pour le traitement d'images.
À elles deux, ces startups ont levé 108,3 M€ en avril. Comme l'analyse sur la montée de l'IA incarnée en France le soulignait, c'est un signal : le capital français ne mise plus uniquement sur l'IA qui génère du texte. Il mise aussi sur l'IA qui manipule des objets, diagnostique des maladies, automatise des entrepôts.
Et cette troisième voie brouille les lignes du débat RL vs LLM. Un robot de tri dans un entrepôt a besoin de RL pour apprendre les gestes. Mais il a aussi besoin de vision par ordinateur (héritée des mêmes architectures que les LLMs visuels). Un robot dermatologue a besoin de modèles de classification d'images, mais pourrait utiliser du RL pour optimiser son protocole de scan. La frontière technique n'est pas aussi nette que les communiqués de presse le laissent croire.
Petite digression : le problème de la taxonomie
J'ouvre une parenthèse, parce que c'est un point qui me turlupine chaque fois que je traite ces données. La classification « RL vs LLM » est commode pour structurer un article, mais elle simplifie à l'excès la réalité technique.
Les architectures modernes convergent. Les modèles comme AlphaFold 3 combinent de l'apprentissage supervisé classique avec du RL. GPT-4 et ses successeurs utilisent du RLHF (Reinforcement Learning from Human Feedback) pour affiner leurs réponses. Mistral utilise probablement des techniques de RL dans son fine-tuning. Ineffable Intelligence, malgré son positionnement marketing « anti-LLM », exploite vraisemblablement des architectures de transformers à certains niveaux de sa pile technique.
Bref : dans la réalité des labos, personne ne choisit « RL ou LLM ». Tout le monde mélange. Ce qui diffère, c'est l'emphase. Est-ce que le cœur de ta proposition de valeur repose sur la génération de contenu (LLM) ou sur la prise de décision autonome (RL) ? C'est cette emphase que les investisseurs financent.
Fin de la parenthèse. Mais gardez-la en tête pour la suite.
Ce que ça signifie pour l'écosystème : trois lectures possibles
Lecture optimiste : la France couvre ses paris
Une interprétation bienveillante des données d'avril 2026 : la France ne met pas tous ses œufs dans le même panier. En finançant massivement le RL (Ineffable Intelligence), les LLMs (Mistral, Phospho) ET l'IA physique (Sereact, SquareMind), l'écosystème se diversifie techniquement. C'est sain. Peu de pays peuvent se vanter de financer les trois axes simultanément à cette échelle.
Lecture inquiète : la concentration extrême
Le problème, c'est que cette diversification est un trompe-l'œil statistique. Deux deals — Ineffable Intelligence et Mistral AI — représentent 1 322 M€ sur 1 433,8 M€ totaux. Soit 92 %. L'écosystème IA français ne finance pas « les deux camps ». Il finance deux entreprises, dont une en seed et une en Série B. Enlevez ces deux deals et il reste 111,8 M€. Ce qui place la France dans la catégorie des écosystèmes modestes.
Lecture pragmatique : suivre le stade, pas la techno
La troisième lecture, celle que je trouve la plus utile, consiste à regarder non pas la technologie mais le stade de maturité. Mistral est en Série B avec des revenus et des clients. Sereact aussi. SquareMind a un produit déployé dans des hôpitaux. Phospho a un produit SaaS fonctionnel.
Ineffable Intelligence est en seed. Avec 937 M€. Sans revenus publics. Sur une technologie dont le track record commercial est mince. C'est le deal qui, à lui seul, crée toute l'asymétrie statistique. Et c'est aussi celui dont l'issue est la plus incertaine.
Pour qui suit les levées : comment lire les prochains mois
Si le débat RL vs LLM vous semble abstrait, voici la grille de lecture concrète que suggèrent les données d'avril 2026.
Premier signal à surveiller : les levées de la couche « tooling » IA. Phospho a ouvert une voie avec 3,5 M€ sur de l'évaluation LLM. Mais il faudra aussi des outils de monitoring RL, de simulation, de test d'agents autonomes. La prochaine vague de micro-levées dans cette couche d'infrastructure sera un indicateur avancé de maturité du marché.
Deuxième signal : les Séries A en IA. C'est le grand absent d'avril 2026. On a des seeds (Ineffable, Phospho), des Séries B (Mistral, Sereact), mais aucune Série A IA nettement identifiée. Axomove a bouclé une Série A en healthtech, pas en IA pure. Comme le montrent les données sur la disparition de la Série A en France, ce stade intermédiaire semble se vider. Soit les startups meurent entre le seed et la Série B, soit elles sautent directement à la Série B grâce à des seeds géants.
Troisième signal : les exits. WeMaintain (38,8 M€ levés au total, racheté par Otis) est le seul exit notable d'avril 2026 dans le dataset. Mais c'est de la proptech, pas de l'IA. Quand verra-t-on un exit IA français ? Cette question reste ouverte, et la réponse conditionne la viabilité de tout l'écosystème.
La question que personne ne pose (mais qu'il faudrait)
On parle beaucoup de montants. Peu de « cash burn ».
Ineffable Intelligence vient de lever 937 M€ en seed. Pour du RL. Le RL nécessite des infrastructures de calcul massives pour les simulations. Des équipes de chercheurs payés cher. Des cycles d'itération longs avant tout résultat commercialisable.
Question : combien de temps tiendront ces 937 M€ ? Si le burn rate est de 20 M€ par mois — un chiffre pas absurde pour une startup IA deep à cette échelle — on parle de 47 mois de runway. Quatre ans. C'est à la fois beaucoup (peu de startups ont autant de visibilité) et très peu (le RL peut nécessiter des décennies de recherche avant de déboucher sur des applications robustes).
Mistral, avec 385 M€, est dans une logique différente. La société a des clients, des revenus, une trajectoire vers la rentabilité. Son burn est élevé mais compensé partiellement par du chiffre d'affaires.
Phospho, avec 3,5 M€, a peut-être 18 mois de runway. Mais son burn est aussi proportionnellement bien plus faible.
Le cash ne ment jamais. Et le ratio « montant levé / temps avant revenus » est sans doute le meilleur prédicteur de succès à long terme. Sur ce critère, Mistral et Phospho ont un profil bien plus rassurant qu'Ineffable Intelligence.
Ce qu'il faut retenir
Les données d'avril 2026 racontent la France IA à un moment charnière. Le reinforcement learning fait un retour spectaculaire porté par un deal hors-norme. Les LLMs continuent leur progression mais se structurent : d'un côté les plateformes (Mistral), de l'autre l'outillage (Phospho). L'IA physique (Sereact, SquareMind) trace discrètement sa route avec 108 M€ cumulés.
Cinq deals IA en un mois. 1,4 milliard d'euros. Mais 92 % concentrés sur deux entreprises.
L'écosystème français ne manque pas de capital. Il manque peut-être de diversité dans la répartition de ce capital. Financer un méga-seed en RL et une méga-Série B en LLM, c'est spectaculaire. Mais les prochaines Phospho — les startups à 3-5 M€ qui construisent les briques que tout le monde utilisera demain — ce sont elles qui détermineront si la France devient un écosystème IA durable ou un terrain de jeu pour deux ou trois mastodontes.
Pour explorer les deals mentionnés dans cette analyse, l'outil de recherche par secteur et montant permet de filtrer l'ensemble des levées françaises trackées par LevéesFR.