Brancher votre IA

Une seule chose change : l’adresse de l’API

Vos applications appellent déjà une IA cloud (Anthropic, OpenAI, Mistral…). Chaque message peut emporter un nom, un montant, un contrat. CLEVYA s’intercale devant ces appels, sur votre serveur : vous pointez vos applications vers le composant CLEVYA au lieu de l’API du fournisseur, et vous gardez votre clé et votre fournisseur. Vos formats d’appel ne changent pas.


Aujourd’hui	Vos applications appellent directement l’API du fournisseur. La donnée réelle part en clair, et personne ne sait exactement laquelle.
Avec CLEVYA	Vos applications appellent le composant CLEVYA, qui tourne chez vous. Lui seul parle au fournisseur, avec votre clé. La table qui relie un jeton à sa vraie valeur ne quitte jamais votre serveur.
Pour vos développeurs	Une variable d’environnement : l’adresse de l’API. Aucune réécriture, aucune migration.

Le flux, en un schéma

Ce que devient un appel quand CLEVYA s’intercale (mode pare-feu). Tout ce qui est dans le cadre « chez vous » ne quitte jamais votre serveur ; seuls les jetons sortent vers le cloud.

  ┌──────────────────────── Chez vous (votre serveur) ────────────────────────┐
  │                                                                           │
  │   Votre requête  ──►  Anonymisation locale  ──►  (jetons)  ─────────────┐ │
  │   (donnée réelle)     noms/montants/IBAN                                │ │
  │                       remplacés par jetons                             │ │
  │                                                                        ▼ │
  │   Réponse  ◄──  Détokenisation locale  ◄──  (jetons)  ◄──────────  Cloud LLM
  │   (lisible)     vraies valeurs remises                              (Anthropic,
  │                 chez vous                                            OpenAI, ...)
  └───────────────────────────────────────────────────────────────────────────┘

  La table jeton → valeur réelle reste dans le cadre. Le cloud ne voit que des jetons.

En mode audit, le composant n’anonymise pas : il observe et consigne ce qui partirait, sans rien bloquer. En mode 100 % local, le « Cloud LLM » est remplacé par un modèle qui tourne chez vous (Ollama) - rien ne sort, même anonymisé.

Deux modes, un seul composant

Le même composant tourne chez vous. Vous commencez en observation, puis vous activez la protection quand vous êtes prêt.

Mode audit

CLEVYA observe sans rien bloquer. Pour chaque appel, il consigne ce qui est sorti : combien d’identifiants ont été détectés, ce qui aurait été masqué, ce qui a été retenu - sans jamais stocker la valeur réelle. Vous obtenez un rapport de conformité à présenter à votre délégué à la protection des données (DPO). C’est le risque rendu tangible, sans rien casser.

Mode pare-feu

CLEVYA remplace en local chaque identifiant sensible par un jeton cohérent avant l’envoi : un nom devient [PERSONNE_1], un IBAN devient [IBAN_1], partout pareil. Le modèle raisonne sur les jetons, sa réponse revient, les vraies valeurs sont remises chez vous. Le fournisseur d’IA ne voit jamais un seul identifiant réel.

Voir Anonymisation locale pour le détail de la détection et de la substitution.

La règle que nous ne franchissons jamais

Le composant tourne chez vous, jamais sur un serveur CLEVYA. Si votre trafic passait par notre infrastructure, vos données transiteraient chez nous - exactement le tiers que cet outil sert à éviter. La correspondance entre un jeton et sa vraie valeur reste sur votre serveur, point.

Vous montez selon votre besoin

Le composant est léger : le modèle, c’est le cloud que vous utilisez déjà. Vous ne montez d’un palier que lorsque vous en avez besoin.

Palier	Ce qui tourne chez vous	Pour qui
Audit	Le composant léger, en observation. Un PC ou un petit serveur suffit.	« Je veux d’abord voir ce qui fuit. »
Pare-feu	Le composant + l’anonymisation locale. Toujours léger.	« Anonymise avant l’envoi au cloud. »
100 % local	Le composant + un modèle qui tourne chez vous (Ollama). Un vrai serveur requis.	« Rien ne sort, même anonymisé. »

Les jetons d’IA, vous les payez en direct à votre fournisseur, sous votre clé - voir BYOAK. L’abonnement CLEVYA couvre le composant, sa mise à jour et le support.

Ce qui est honnête de dire

Nous ne survendons rien. Voici la frontière exacte de cette brique.

Prouvé en laboratoire. Le cycle complet a été mesuré sur la vraie API d’un fournisseur (Anthropic) : message réel anonymisé en local, jetons envoyés, réponse reconstruite chez nous, rapport de conformité avec identifiant de requête réel.
Le recall de détection n’est pas de 100 %. Sur un corpus de documents synthétiques multi-métiers écrits pour le test, la détection masque autour de 94,5 % des données sensibles ; sur un benchmark public indépendant, ce taux se situe autour de 75 %. Le reste est rattrapé par une revue humaine et une liste de blocage propre à chaque client. Ce n’est pas zéro risque.
Le code ne se masque pas. L’anonymisation porte sur les identifiants typés (noms, montants, IBAN), pas sur du code source : jetoniser du code le rend inexploitable par le modèle. Pour le code sensible, la seule protection réelle est le mode 100 % local.
Le web sort. Si un agent consulte une page web, la requête sort vers Internet. CLEVYA contrôle ce qui part vers le modèle, pas un appel réseau d’un outil tiers que vous autoriseriez.
Deux limites résiduelles. La ré-identification par recoupement de détails laissés en clair, et la donnée sensible non typée et inconnue (nom de projet maison, clause). La réponse aux deux : le mode 100 % local, où rien ne part.

Pour aller plus loin

Souveraineté - le principe et ce qui part vraiment.
Anonymisation locale - comment la détection fonctionne.
Journal d’egress - la trace vérifiable de ce qui est sorti.
BYOAK - votre clé, votre fournisseur, votre facture.