FR/EN
Negent - Truth Layer

La data
avant l'IA.

Negent Clean transforme votre corpus non structuré en une base fiable, versionnée et gouvernée. Éliminez le bruit documentaire, établissez la source unique de vérité - et passez enfin du POC a l'échelle.

85%
L'iceberg de la donnée
"85% des données n'ont aucune valeur ajoutée : ROT, dark data (emails, PDF, images...)"
Veritas - Global Databerg Report 2025
70%
Le frein no1 a l'IA
"Jusqu'a 70% des données textuelles sont obsolêtes. C'est la cause principale d'échec des projets RAG."
Infoctechtion - AI Readiness Study 2025
60%
L'urgence AI-ready
"Sans fondation solide, 60% des projets IA seront abandonnés d'ici 2027."
Gartner - Predicts 2024-2026
Source unique de vérité
Une référence par famille documentaire. Fini les contradictions.
Graphe de relations
Contrat ↔ avenants ↔ annexes. Le contexte métier reconstitué.
Règles métier appliquées
Votre taxonomie, vos seuils, vos ACL — imposés en continu.
01Déduplication avancée02Reconstruction des versions03Relationship mapping04Référence promotion05ACL-aware indexing06Human-in-the-loop07Delta continu08Graphe métier 01Déduplication avancée02Reconstruction des versions03Relationship mapping04Référence promotion05ACL-aware indexing06Human-in-the-loop07Delta continu08Graphe métier
Pourquoi Clean est indispensable

L'IA ne peut pas deviner
ce qui est vrai.

La plupart des entreprises n'ont pas un manque de données, mais un surplus de connaissances non structurées et contradictoires. Sans nettoyage, vos agents IA fournissent des réponses erronées dès la sortie du pilote.

🔀

Le chaos des versions

Le même contenu est dupliqué partout. Vos équipes et votre IA ne savent plus quelle version fait foi - final, final2, final_v7_ok...

🧩

Le manque de contexte

Vos contenus sont isolés. Sans lien avec vos projets, contrats ou actifs, la recherche d'information reste une loterie même pour l'IA.

📉

L'érosion de la confiance

Si vos règles métiers ne sont pas appliquées à vos données, la gouvernance disparait et l'adoption de l'IA s'arrête après le POC.

🔓

ACL mal propagées

Un document indexé sans respect des droits d'accès devient une faille de sécurité ou de conformité. Le RAG répond à qui il ne devrait pas.

🏷️

Metadonnées pauvres

Nommage anarchique, tags incomplets, espaces hétérogènes. Impossible de classifier, filtrer ou gouverner un corpus dans cet état.

📈

L'échelle impossible

Le POC fonctionne sur 200 documents. En production sur 2 millions, les contradictions émergent et la confiance s'effondre.

Ce que Clean délivre

Transformez votre passif informationnel
en actif stratégique.

Clean ne se contente pas d'indexer. Il arbitre, réconcilie et gouverne - pour que votre IA réponde avec la bonne version, du bon périmètre, pour le bon utilisateur.

Negent en action Un document sélectionné — sa fiche révélée ↓
Tableau de Bord
Sources
Conversations
Administration
Organisation
Taxonomies
Groupes & Règles
Master
Monitoring
Prompts
↻ Sync All
+ Add Source
WORKSPACE › DOCUMENTS
Knowledge Base
Total Documents
6 852
Catégorisés
6 613
!
Action requise
239
All Documents ▾
Affichage : 31 fichiers
NAME / SOURCE UPLOAD DATE SIZE STATUS ACTIONS
S-AMAR_Annex_16.1__Executed_LNTP_1.pdf
Contractual Documentation › Contract
Mar 30, 10:28
606 KB
OK
AMAR_Annex_5.1_-_Updated_Time_Schedule.pdf
Technical Report › Technical Report
Mar 30, 10:27
844 KB
OK
S-AMAR_Amendment_3_Executed.docx.pdf
Contractual Documentation › Amendment
Mar 30, 10:29
505 KB
OK
S-AMAR_Annex_11_-_Updated_Certificates.docx.pdf
Tender › Award
Mar 30, 10:28
373 KB
OK
S-AMAR_Amendment_2_v221129_Rev_VF.docx.pdf
Contractual Documentation › Amendment
Mar 30, 10:28
541 KB
OK
S-PT_1.1.1_-_Grid_Requirement_-_P73_2020.pdf
Technical Report › Aucune
Mar 30, 10:29
2.7 MB
OK
S-PT_1.1.1.1_-_Grid_Code_and_Scope_of_works.pdf
Technical Report › Technical Report
Mar 30, 10:29
1.4 MB
Error
S-PT_1.1.1_-_Grid_Requirement_-_DL172_2006.pdf
Statutory meetings › None
Mar 30, 10:29
492 KB
OK
S-PT-EPC_Contract_Gensun_AMAR_VF.docx.pdf
Contractual Documentation › Contract
Mar 30, 10:22
1.7 MB
OK
S-PT_2.2.2_-_HSE_-_Penalties.pdf
HSSE › Aucune
Mar 30, 10:30
238 KB
OK
S-PT_2.2_-_HSE_Requirements_Cover_Page.pdf
HSSE
Mar 30, 10:30
167 KB
OK
S-AMAR_Amendment_2_v221129_Rev_VF.docx.pdf
Document Card — Negent AI Enterprise Intelligence
Catégorisation
Contractual Documentation avenant
Document Identity
Titre Amendment #2 to the Lump Sum Contract — Solar Park of Amar
Langue Français (fr)
Nature Avenant contractuel
Finalité Modifier les termes du contrat EPC initial pour le parc solaire d'Amar.
Business Scope
Ancrage
projetcontrat
Projet Solar Park of Amar
Entreprises AMAR, UNIPAR LDA · VOLTEX PVS, S.A.
Phase Construction
Temporalité & Statut
Date doc 11 janvier 2023
Signature 23 juillet 2021
Statut Final Signé Approuvé
Résumé sémantique
« Avenant #2 daté du 11 janvier 2023 — modifie le contrat EPC initial signé le 23 juillet 2021. Révise l'Advance Payment (Art. 8.1) et les délais LNTP 2 au plus tard le 1er mars 2023, Notice to Proceed au plus tard le 30 juin 2023. »
1

Source Unique de Vérité

Une référence unique par "famille" de contenus : fini les contradictions et les versions concurrentes. Clean choisit, justifie et audite chaque promotion.

Référence promotion
2

Fondation Sémantique

Une base embeddings propre qui garantit à vos agents IA des sources fiables et à jour. Texte chiffré, métadonnées normalisées, index sémantique + texte.

Index IA-ready
3

Graphe de Connaissance

Reliez intelligemment vos contenus (avenants, contrats, annexes) pour recréer un contexte métier complet. Relations tracées, expliquées, corrigeables.

Relationship mapping
4

Gouvernance Continue

Votre taxonomie et vos règles métiers s'appliquent en temps réel sur l'ensemble de votre flux. ACL propagées jusqu'au document. Delta automatique. Audit trail complet.

Delta - ACL - HITL
La Doc Card

Chaque document devient
une donnée exploitable.

Pour chaque fichier traité, Clean produit une fiche d'identité complète — structurée, comparable, interrogeable par votre IA sans jamais ouvrir le document source.

S-AMAR_Amendment_2_v221129_Rev_VF.docx.pdf
Document Card — Negent AI Enterprise Intelligence
Signé Final Haute
Catégorisation
Contractual Documentation avenant
Document Identity
TitreAmendment #2 to the Lump Sum Contract — Solar Park of Amar
LangueFrançais (fr)
NatureAvenant contractuel
Sous-typeAvenant au contrat EPC
FinalitéModifier les termes et conditions du contrat EPC initial pour le parc solaire d'Amar.
Business Scope
Ancrage
projetcontrat
ProjetSolar Park of Amar
EntreprisesAMAR, UNIPAR LDA
VOLTEX PVS, S.A.
Contrat réf.Lump Sum Contract — Solar Park of Amar
PhaseConstruction
Acteurs
ÉmetteursAMAR, UNIPAR LDA · VOLTEX PVS, S.A.
Rôles
EmployerContractorParties
Temporalité
Date doc11 janvier 2023
Signature23 juillet 2021
Avenant #111 février 2022
LNTP 21er mars 2023 (prévu)
NTP30 juin 2023
Statut Formel
StatutFinal
SignéOui
ApprouvéOui
PertinenceHaute
Signaux discriminants
Amendment #2 Contrat signé: 23/07/2021 Avenant #1: 11/02/2022 Avenant #2: 11/01/2023 Modification Advance Payment Art. 8.1 Commencement of Work LNTP 2: 01/03/2023 NTP: 30/06/2023
Relations documentaires
Lump Sum Contract — Solar Park of Amar
Annex 16.1 LNTP 1
Annex 16.2 LNTP2 Template
Rev_VF (version finale)Traduction potentielle
Résumé sémantique
« Cet avenant contractuel (Amendment #2), daté du 11 janvier 2023, modifie le contrat initial de construction du parc solaire d'Amar signé le 23 juillet 2021. Il révise l'Advance Payment et l'article 8.1 relatif au Commencement of Work, incluant les délais LNTP 2 au plus tard le 1er mars 2023 et Notice to Proceed au plus tard le 30 juin 2023. »
01
Catégorie & identité — sans ouvrir le fichier
Chaque document reçoit une catégorie métier, un titre normalisé et une finalité extraite automatiquement. Vos équipes et votre IA savent exactement ce que c'est — avant de l'ouvrir.
Taxonomie métier · Normalisation
02
Acteurs, dates et statut formel capturés
Qui a signé, quand, avec quelle validité légale. Les métadonnées critiques sont extraites, structurées et comparables entre tous vos documents — quelle que soit leur provenance.
Extraction · Structuration
03
La chaîne documentaire reconstituée
Contrat parent, avenants, annexes — les relations inter-documents sont tracées automatiquement. Votre IA interroge le contexte complet, pas un fragment isolé arraché à son historique.
Relationship mapping · Graphe
04
Le résumé sémantique — le carburant de votre LLM
L'IA interroge la fiche pour trouver, puis le document pour répondre. Analyser une fiche coûte 100× moins qu'un document brut de 80 pages. Moins de bruit, moins de coûts, plus de fiabilité.
RAG · LLM-ready
×100
Analyser une Doc Card coûte 100 fois moins qu'un document brut de 80 pages à votre LLM. Moins de tokens, moins d'appels, des réponses plus fiables à l'échelle.
Configuration

Configurez Clean à votre métier.
Sans une ligne de code.

Taxonomie, règles de classification, champs de métadonnées, prompts d'extraction — tout est éditable dans l'interface, versionné et réactivable à tout moment. Vos équipes métier gardent la main, sans dépendre de l'IT.

Structure
Tender
Rules/RFP
Award
Package
+ Add Subcategory
Statutory meetings
Financial Statement approval
Shareholders decisions ●
Board decisions
+ Add Subcategory
Land Register
Technical Report
Studies
Business Plan
Claims
HSSE
Financial Report
Lender Audit Report
ADMINISTRATION › TAXONOMIES › NEGENT-AI TAXO (V3)
Negent-AI Taxo (v3)
← Back
✓ Save Changes
Subcategory Details
Active Component
Name
Shareholders decisions
Code (Identifier)
SHR-DCN
Description
Décisions d'assemblée / shareholders resolutions : approbations, nominations, opérations sur capital. Mots-clés : résolution, shareholders meeting, assemblée des actionnaires, approval, decision, minutes / procès-verbal. À ne pas confondre : Board decisions, Articles of association.
Metadata Fields
Define data points specifically extracted for this component.
+ Add Field
date
Date ▾
Required
Description
Date de la décision
Options / Examples
2024-01-01

Votre vocabulaire, pas celui du marché

Les catégories reflètent exactement votre façon de nommer les choses : "Avenant EPC" plutôt que "Amendment", "Note de service" plutôt que "Memo". Vos équipes reconnaissent immédiatement leur corpus — l'IA aussi.

Catégories · Sous-catégories · Codes identifiants

Des règles en langage naturel

Décrivez comment distinguer un contrat d'un avenant, une décision d'assemblée d'un procès-verbal. Ajoutez des mots-clés, des exemples, des mises en garde. Clean applique ces règles uniformément sur l'ensemble du corpus.

Description · Mots-clés · Cas limites

Des métadonnées typées par catégorie

Chaque sous-catégorie définit ses propres champs : date de décision pour les assemblées, montant pour les factures, phase pour les rapports de chantier. Ces champs alimentent directement chaque Doc Card.

Date · Montant · Liste · Champ requis
Retour sur investissement

Clean ne coûte pas.
Il récupère.

Au-delà de la qualité IA, Clean produit des gains mesurables dès les premières semaines — sur cinq dimensions opérationnelles concrètes.

-70%
Coûts de
stockage
ROT data éliminé
×100
Réduction
coûts LLM
Doc Card vs doc brut
96.5%
Précision
classification
Réponses IA fiables
Recherche
plus rapide
Corpus propre
0
Document sans
permission
ACL propagées
01
Coûts de stockage réduits
40 à 70% du corpus d'entreprise est ROT — Redundant, Obsolete, Trivial. Clean identifie et qualifie chaque fichier pour suppression ou archivage, réduisant directement les coûts de stockage, de sauvegarde et d'indexation.
Stockage · Sauvegarde · Indexation
Sauvegardes moins volumineuses dès le pilote
Coûts d'indexation réduits proportionnellement
eDiscovery 3× plus rapide sur corpus propre
02
Coûts LLM optimisés
L'IA interroge les Doc Cards pour trouver, puis les documents pour répondre. Une fiche coûte 100× moins à analyser qu'un document brut de 80 pages — moins de tokens, moins d'appels, moins de bruit dans le contexte.
Tokens · Appels API · Latence
Consommation de tokens réduite à l'échelle
Appels inutiles éliminés par le pré-filtrage
Contexte transmis plus précis, moins bruité
03
Réponses IA plus fiables
Une IA est aussi fiable que sa base documentaire. Sur un corpus propre, structuré et gouverné, les hallucinations diminuent et chaque réponse est traçable jusqu'à sa source — la bonne version, pour le bon utilisateur.
RAG · Hallucinations · Traçabilité
Réponses ancrées sur la version canonique
Source citée, vérifiable, auditée
Conflits de version éliminés en amont
04
Recherche plus rapide
Moins de temps à chercher, vérifier, ou demander "quelle est la bonne version ?". La Doc Card répond avant même d'ouvrir le document — catégorie, statut, acteurs, relations : tout est lisible en un coup d'œil.
Productivité · Friction · Temps
Résultat pertinent du premier coup
Statut et version visibles instantanément
Chaîne documentaire complète reconstituée
05
Risques réduits
Moins de décisions prises sur de mauvais documents. Les ACL sont propagées jusqu'au niveau du document — votre IA ne révèle que ce que l'utilisateur est autorisé à voir. Chaque traitement, validation ou correction est horodaté et tracé.
Conformité · ACL · Gouvernance
Aucun contenu restitué sans permission utilisateur
Traçabilité complète sur tout le corpus
Journal d’audit horodaté et sécurisé
Implémentation

Votre trajectoire vers
une fondation AI-ready.

Un processus en 6 étapes pour transformer vos données fragmentées en une fondation fiable, sécurisée et gouvernée - sans déplacer vos fichiers sources.

01
Sources

La où vit votre contenu

Connectez Negent à vos référentiels existants — SharePoint, e-mails, serveurs, GED, outils de connaissance. Negent travaille là où vos données se trouvent déjà, sans perturber vos habitudes.

Connecteurs natifs · Mode lecture seule · ACL capturées dès la connexion
N SharePoint ✓ ACL G. Drive ✓ ACL Emails Serveurs GED Notion 👁 LECTURE SEULE
02
Périmètre

Configuration du cadre

Configurez votre ADN métier en toute simplicité. Définissez vos propres règles, tags et taxonomies : Negent apprend votre langage pour s'adapter à la réalité de votre terrain.

Taxonomie configurable · Règles de versioning · Seuils de confiance
TAXONOMIE — ADN MÉTIER v1.0 Legal LGL · Contrats · Accords 312 Technique TEC · Plans · Specs · Manuels 287 💰 Financier FIN · Budgets · Rapports 156 📋 Exploitation | SEUIL DE CONFIANCE 0.88
03
Extraction Sécurisée

Vos données restent chez vous

Seuls le texte et les métadonnées essentiels sont extraits temporairement, chiffrés en transit, puis traités. Vos fichiers sources restent sanctuarisés dans votre infrastructure.

TTL/purge · Stockage minimal · Chiffrement en transit · BYOK optionnel
source.pdf 🔒 reste ici ✓ texte + meta 🔐 AES-256 BYOK N TTL / purge après traitement VOS FICHIERS NE QUITTENT PAS VOTRE INFRA
04
Construction de la Fondation

Votre socle AI-ready

Le système normalise les formats, nettoie le bruit, segmente les contenus et crée des embeddings pour permettre une recherche par le sens sur tout votre corpus, quelle que soit la source.

Normalisation · Chunking sémantique · Embeddings · Index texte
doc.pdf chunk 1 chunk 2 chunk 3 chunk N chunks dim₁ dim₂ Legal Technique Financier chunking sémantique espace vectoriel
05
Unification & Résolution

Couche de vérité du contenu

Negent résout automatiquement les conflits sémantiques, identifie les familles de versions et cartographie les relations entre contenus liés. Pour les cas ambigus, un workflow de validation humaine est déclenché.

Déduplication · Version chains · HITL sur contenus à risque
contrat_v1.pdf 2022-03-01 contrat_v2.pdf 2022-06-15 contrat_FINAL.pdf 2022-10-01 contrat_FINAL2.pdf doublon détecté Référence canonique contrat_FINAL.pdf 👤 HITL déclenché validation humaine requise CHAÎNE DE VERSIONS RECONSTRUITE
06
Gouvernance

Boucle Continue

Votre fondation reste fiable à mesure que votre métier évolue. Chaque nouveau contenu ou changement de règles est automatiquement répercuté. Journaux, SLA, alertes de dérive — observabilité complète.

Delta incrémental · Audit trail · Reprocessing ciblé · Observabilité
📥 delta repro. 📋 audit alertes corpus fiable ✓ SLA 99% uptime TRAIL historique DÉRIVE Δ alerté BOUCLE TEMPS RÉEL — TOUJOURS À JOUR
Architecture Negent
Systèmes sourcesSharePoint - Drive - GED - Reseau - Intranet
Voir Clean ↗
↓ connecteurs - lecture seule - ACL capturées
Negent CleanTruth Layer - Index IA-ready - Graphe métier
Vous êtes ici ↗
↓ corpus fiabilisé - ACL natives - embeddings
Negent IntelligenceRAG source - Recherche sémantique - Fiches
Decouvrir ↗
↓ base robuste - traçable - gouvernée
Negent AgentiqueActions automatisées - Workflows - Agents
Bientôt ⋯

Clean fabrique la fondation.
Le reste en découle.

Intelligence et Agentique ne peuvent fonctionner a l'échelle que si la base est propre. Un RAG sur un corpus chaotique amplifie le chaos - il répond avec confiance en sourcant la mauvaise version.

En activant Clean en premier, vous créez les conditions du passage du POC à la production : base fiable, versionnée, traçable, avec des permissions respectées jusqu'au niveau du document.

→ Les fichiers originaux ne quittent jamais votre environnement.

Questions fréquentes

Nous avons les réponses
que vous cherchez.

Est-ce que Negent Clean remplace notre GED/ECM (SharePoint, etc.) ?
+
Non. Clean se connecte à vos systèmes sources sans les remplacer ni les perturber. Vos fichiers restent exactement la ou ils sont. Clean crée une couche de vérité au-dessus de vos référentiels existants - un index intelligent, pas un remplacement. Votre GED continue de fonctionner comme avant ; Clean en fait une fondation exploitable pour l'IA.
A-t-on besoin de metadonnées parfaites ou d'une taxonomie finalisée pour démarrer ?
+
Non. C'est précisément le problème que Clean résout. Vous pouvez démarrer avec un corpus imparfait - nommage incohérent, tags incomplets, espaces hétérogènes. Clean inférera la structure, enrichira les metadonnées et proposera une taxonomie. Vous pouvez affiner les règles au fil du temps via le configurateur de périmètre.
Où sont stockées nos données avec Clean ?
+
Les fichiers sources restent dans vos systèmes (SharePoint, Drive, serveurs). Clean ne les déplace jamais. Seuls les métadonnées, l'index sémantique et le graphe de relations sont stockés dans Negent — avec chiffrement at-rest et in-transit, isolation par tenant, et ACL propagées. Vous gardez le contrôle total : vos documents ne quittent jamais votre infrastructure.
Comment les mises à jour restent-elles fiables dans le temps ?
+
Via le mode delta : Clean détecte en continu les nouveaux fichiers et les modifications dans vos systèmes sources, et ne retraite que les familles concernées. Si une règle métier change, seules les familles impactées sont reprocessées. L'observabilité (journaux, SLA, files d'attente, alertes) vous garantit une visibilité complète sur la fraîcheur de votre base.
Combien de temps faut-il pour voir des résultats avec Clean ?
+
Les premiers résultats (rapport de chaos documentaire, familles de doublons identifiées, chaînes de versions reconstruites) sont visibles dès la phase de connexion et d'inventaire - généralement en quelques jours sur un périmètre pilote.
Pourquoi pas simplement utiliser SharePoint Search ou notre GED existante ?
+
Les outils natifs (SharePoint, GED) indexent tout sans arbitrage. Résultat : votre recherche remonte 15 versions du même contrat sans vous dire laquelle fait foi. Clean résout ça en amont : il identifie la référence qui fait foi, reconstruit les chaînes de versions, détecte les doublons sémantiques et applique vos règles métier. SharePoint Search indexe. Clean gouverne.
Qui décide quand Clean détecte un conflit ou une ambiguïté ?
+
Clean applique vos règles métier automatiquement pour les cas clairs (ex : "garder la version la plus récente"). Quand un arbitrage est ambigu (ex : deux versions signées à dates proches, conflit de métadonnées), Clean active le mode Human-in-the-Loop : un expert de votre équipe reçoit une notification et valide la décision dans l'interface. Vous gardez le contrôle sur les choix critiques.
Contact

Parlons de
votre corpus.

Demandez une démonstration sur votre périmètre. Nous analysons votre niveau de chaos documentaire et vous montrons ce que Clean peut faire - avant toute décision.

🕐
Premiere réponse sous 24h
Un expert Negent vous contacte pour cadrer votre besoin et proposer une démo adaptée à votre périmètre.
🔎
Diagnostic offert
Avant toute décision, nous produisons un rapport de chaos documentaire sur un échantillon de votre corpus.
🔒
NDA disponible
Pour les échanges sensibles, un accord de confidentialité peut être signe dès le premier contact.

Construisez votre IA
sur une vraie fondation.

Demandez une démonstration sur votre corpus. Nous analysons votre niveau de chaos documentaire et vous montrons ce que Clean peut faire - avant toute decision.

Negent Agentique

Ce module est en cours de developpement. Agentique permettra d'automatiser des actions sur votre SI, directement depuis une base documentaire fiable et gouvernée.

Laissez-nous vos coordonnées pour etre informe en priorité.