Un notaire prépare un acte de vente sur un terrain à Marseille. La parcelle qu'on lui présente est référencée 132118670E0631. Le vendeur affirme qu'elle est issue d'une fusion intervenue en 2004. Le notaire doit le vérifier : la chaîne de titre est une obligation déontologique, et toute interruption non documentée dans la filiation cadastrale (le suivi administratif des mutations qui font naître, fusionnent ou divisent les parcelles) peut compromettre la validité de la vente.
Aujourd'hui, cette vérification se fait à la main : demande au cadastre, consultation du plan, recoupement avec les actes antérieurs. Plusieurs heures de travail pour une parcelle, plusieurs jours pour un portefeuille. Et pourtant, cette information existe déjà — elle est même publique. La DGFiP (Direction générale des Finances publiques) met à disposition depuis 2018 le Document de Filiation Immobilière (DFI), un référentiel exhaustif qui répertorie chaque mutation cadastrale informatisée du territoire français.
Le problème : la donnée brute est inutilisable telle quelle. Plusieurs gigaoctets de fichiers textes plats, un format hérité des années 1980, aucune interface, aucune API. C'est exactement le type de gisement que Ragindeed transforme en outil opérationnel pour les professionnels de l'immobilier.
Qu'est-ce qu'un Document de Filiation Immobilière ?
Quand une parcelle change — fusion avec une voisine, division en lots, arpentage suite à un bornage — les services du cadastre enregistrent l'opération sous forme d'un document DFI. Ce document décrit le lien entre les parcelles d'avant et les parcelles d'après. Une fusion de trois parcelles E-569, C-196 et B-524 en une nouvelle parcelle E-631 produit un DFI daté qui formalise la mutation.
Chaque opération est classée par nature (le code administratif qui qualifie la mutation) :
| Nature DFI | Signification | Cas typique |
|---|---|---|
| Arpentage | Mesurage suite à bornage ou rectification | Modification de limites entre voisins |
| Lotissement | Division en plusieurs lots | Programme immobilier neuf |
| Réunion | Plusieurs parcelles fusionnées en une seule | Regroupement avant construction |
| Division | Une parcelle scindée en plusieurs | Sortie de lots à la vente |
| Conservation | Modification administrative sans changement physique | Renumérotation, changement de section |
| Remaniement | Refonte cadastrale d'une zone | Opération d'aménagement urbain |
Empilées les unes sur les autres, ces mutations forment ce qu'on appelle l'arbre de filiation d'une parcelle : sa généalogie complète depuis sa première apparition au cadastre informatisé.
La promesse d'un référentiel public… et son verrou pratique
La DGFiP publie les archives DFI deux fois par an, structurées par département. Le contenu est riche : tous les départements métropolitains et d'outre-mer, soit plusieurs millions de parcelles distinctes. Ce n'est ni un échantillon, ni une zone test : c'est l'intégralité de la mémoire cadastrale informatisée.
Mais le format est dissuasif. Les fichiers sont des plats à largeur fixe (chaque colonne occupe un nombre précis de caractères, un format hérité des années 1980), regroupés dans des archives ZIP de plusieurs gigaoctets. Aucun outil grand public ne sait les lire. Pour exploiter la donnée, il faut écrire un parseur ad hoc, gérer les changements de schéma entre départements, normaliser les codes INSEE (l'identifiant administratif d'une commune, à 5 ou 6 caractères selon les arrondissements de Paris, Lyon et Marseille), et reconstituer les liens parent–enfant entre parcelles.
C'est exactement ce verrou que la plateforme Ragindeed lève. Le référentiel DFI est ingéré, normalisé et requêtable via une API simple. Pour le notaire de notre exemple, savoir d'où vient 132118670E0631 revient à formuler une requête en quelques secondes — au lieu d'une demi-journée de recherches.
Le cas pathologique : 1 447 ancêtres pour une seule parcelle
La parcelle 132118670E0631 n'a pas été choisie au hasard. Située dans le 11ème arrondissement de Marseille, elle est le résultat de 13 générations de mutations cadastrales successives. Sa généalogie remonte aux années 1980 et fait apparaître 1 447 parcelles ancêtres distinctes, reliées par 2 399 événements DFI.
Pour mesurer l'ampleur : la plupart des parcelles n'ont aucun ancêtre (elles sont stables depuis l'informatisation du cadastre) ou un à deux ancêtres immédiats. Sur un échantillon mesuré de 1 447 parcelles marseillaises :
- 50 % ont 1 ancêtre ou moins
- 90 % en ont moins de 50
- 99 % en ont moins de 600
- 1 % dépassent le millier d'ancêtres
Ces parcelles « explosives » correspondent à des zones urbaines qui ont subi des aménagements lourds : rénovations, programmes immobiliers, lotissements successifs. À chaque fusion, le nouvel ensemble hérite de l'histoire de tous ses constituants — et le réseau d'ancêtres se ramifie en cascade.
Le défi opérationnel devient évident. Représenter l'histoire d'une parcelle simple est trivial. Représenter celle d'une parcelle « lourde » — c'est-à-dire la rendre lisible pour un professionnel pressé — demande une vraie ingénierie de présentation.
L'arbre indenté : ce qui ne marche pas
L'approche naïve consiste à rendre l'histoire sous forme d'arbre indenté, comme un sommaire de livre :
E-631
← Réunion (2004-09-06) de :
├── E-569
│ ← Réunion (1999-04-22) de :
│ ├── P-375 ← Arpentage (1998-12-04) ...
│ ├── E-125 ← ...
│ └── E-127 ← ...
├── C-196 ← Arpentage (2007-09-10) de :
│ ├── C-52 ← Lotissement (2010-09-27) ...
│ ...
Sur quelques générations, c'est lisible. Sur E-631, la même représentation produit 12 358 lignes, soit environ 250 pages PDF. Le problème n'est pas la profondeur (13 générations seulement) : c'est la largeur et les reconvergences. Quand une parcelle ancêtre D-209 apparaît dans trois branches descendantes différentes, l'arbre indenté la duplique trois fois — avec toute sa sous-arborescence à chaque occurrence.
Sur les parcelles pathologiques, le facteur de duplication atteint × 12 : chaque ancêtre apparaît en moyenne 12 fois dans le rendu. Un rapport de 250 pages dont 88 % du contenu est redondant n'est pas un rapport, c'est un sabotage.
Cette explosion combinatoire est typique des graphes orientés acycliques (un graphe où chaque nœud peut avoir plusieurs parents mais où il n'existe pas de boucle) — la structure mathématique des arbres généalogiques avec fusions. Tant qu'on les rend comme des arbres simples, on duplique. Tant qu'on tronque la profondeur pour limiter le volume, on perd de l'information essentielle (les origines historiques, justement celles qui intéressent le notaire).
La solution : représentation DAG par génération
Plutôt que de rendre l'arbre, Ragindeed représente le DAG lui-même. Le principe : chaque parcelle ancêtre apparaît exactement une fois, dans la génération où elle est rencontrée pour la première fois en remontant depuis la parcelle étudiée.
Concrètement, le rapport prend la forme suivante :
=== Origine de E-631 (013_211_867_0E_0631) ===
1 447 parcelles ancêtres, 13 générations
— Parcelle étudiée — E-631
← Réunion (2004-09-06) de : E-569, C-196, B-524
— Génération -1 (3 parcelles) —
• E-569 ← Réunion (1999-04-22) de : P-375, E-125, E-127
• C-196 ← Arpentage (2007-09-10) de : C-52, D-44, ...
• B-524 ← Réunion (2002-12-09) de : P-311, E-54, ...
— Génération -2 (14 parcelles) —
• P-375 ← Réunion (1998-12-04) de : P-118, P-371, ...
• E-125 (origine, pas d'antécédent dans le DFI)
...
Trois conventions importantes :
- Une parcelle = une ligne. Quelle que soit le nombre de descendants qui en sont issus.
- Quand une parcelle reconvergente est référencée plus loin, elle est annotée par un renvoi vers sa première apparition. Exemple :
P-310⤴G-2signifie « P-310 est déjà décrit en génération -2 ». L'information de lien est préservée, mais sans duplication. - Le label de la mutation est dérivé de la topologie réelle, pas du code brut. Deux parents pour un enfant donné ? C'est une Réunion. Un parent qui produit plusieurs enfants ? C'est une Division. Le rendu colle à la sémantique métier, pas à la technique administrative.
Résultat sur E-631 : 1 479 lignes au lieu de 12 358. Une réduction de 88 % du volume, avec zéro perte d'information. Toute la généalogie est là, mais une fois — pas douze fois. Le rapport final tient en 22 pages PDF au lieu de 250.
Garder aussi la vue narrative
Pour autant, la vue indentée a un mérite : elle raconte une histoire. « Cette parcelle vient de telle fusion, qui elle-même vient de telles divisions… » C'est la façon naturelle dont un humain lit la chaîne de titre.
Le rapport DFI de Ragindeed conserve donc cette vue narrative en complément du DAG. Mais elle est bornée automatiquement : si l'arbre indenté dépasse une centaine de lignes, le système réduit progressivement la profondeur affichée (10 → 5 → 4 → 3 → 2 générations) jusqu'à ce que le rendu tienne dans le budget visuel. Un bandeau prévient explicitement le lecteur :
Vue narrative limitée à la profondeur 2 (27 lignes). Lignage exhaustif ci-dessous.
Le lecteur dispose ainsi des deux représentations :
- L'arbre indenté borné pour la lecture rapide (« d'où vient cette parcelle, en gros ? »)
- Le DAG exhaustif pour l'analyse détaillée (« liste-moi tous les ancêtres, sans en oublier »)
Sur les parcelles simples (90 % des cas), la vue narrative s'affiche en entier — il n'y a pas de bandeau, pas de section « exhaustive » superflue. Sur les parcelles pathologiques (les 5 % restants), les deux représentations coexistent et chacune joue son rôle. Ce rapport s'intègre naturellement dans la suite des documents générés automatiquement par la plateforme, dont le principe est détaillé dans notre article sur la génération de rapports DOCX et PDF.
Les usages concrets pour les professionnels
Cette infrastructure n'est pas un exercice technique. Elle débloque des cas d'usage métier précis.
Pour le notaire
Le rapport DFI fournit en quelques secondes la chaîne de titre cadastrale complète. Il sait immédiatement si la parcelle a connu des mutations récentes (et donc si une vérification au registre foncier s'impose) ou si elle est stable depuis l'informatisation. La durée de la due diligence sur ce point passe de plusieurs heures à quelques minutes.
Pour le gestionnaire d'actifs immobiliers
La filiation DFI permet de retracer l'histoire des parcelles composant un actif acquis. Cas typique : un immeuble construit sur une fusion de trois parcelles distinctes — chaque parcelle d'origine avait son propre régime fiscal et ses propres servitudes. Reconstituer cette information manuellement demande de remonter les actes ; l'API DFI la livre en une requête.
Pour le promoteur
L'historique des divisions et lotissements antérieurs signale les terrains « remembrés » — typiquement plus complexes à acquérir car ils impliquent souvent plusieurs propriétaires successifs et parfois des servitudes héritées. La filiation devient un indicateur de risque dans la phase de pré-acquisition.
Pour les services de conformité
Pour les sociétés de gestion (SGP), la traçabilité cadastrale s'intègre dans les diligences LCB-FT (la lutte contre le blanchiment et le financement du terrorisme, dont les obligations imposent de connaître l'origine des biens) sur l'origine des fonds investis dans un actif immobilier. Une parcelle au passé mouvementé mérite une vérification plus approfondie qu'une parcelle inchangée depuis vingt ans. Cette logique de pré-classification automatique des dossiers à risque est analogue à celle que nous appliquons aux documents eux-mêmes, détaillée dans l'article sur le tagging documentaire.
Ce que la donnée publique ne dit pas
Une honnêteté intellectuelle s'impose. Le référentiel DFI a deux limites structurelles dont la plateforme prévient explicitement le lecteur.
D'abord, l'antériorité. Les DFI ne remontent qu'aux mutations enregistrées informatiquement par les centres des impôts fonciers, soit grossièrement à partir du milieu des années 1980, et plus tardivement encore selon les départements. Les divisions et fusions antérieures ne sont donc pas reconstituées. Une parcelle « sans antécédent dans le DFI » peut signifier soit qu'elle est réellement inchangée depuis l'informatisation, soit que sa filiation pré-informatique n'a pas été saisie. Le rapport le précise systématiquement pour éviter toute conclusion abusive.
Ensuite, le périmètre. Le DFI documente les liens cadastraux, pas les droits réels qui s'attachent aux parcelles. Le passage par un acte de vente, une donation, une succession n'apparaît pas dans le DFI tant qu'aucune mutation cadastrale n'a été enregistrée. La chaîne de titre juridique reste à vérifier au registre foncier. Le DFI est un préalable, pas un substitut.
Cette distinction est claire pour le professionnel — et pour le notaire en particulier — mais elle mérite d'être rappelée explicitement dans chaque rapport, ce que la plateforme fait dans une section « Limites du référentiel » en première page.
La logique générale : valoriser le patrimoine de données publiques
Le DFI est un exemple parmi d'autres. La France produit, via ses administrations, un patrimoine de données publiques d'une richesse considérable :
- La BAN (Base Adresse Nationale) référence toutes les adresses postales et leurs coordonnées géographiques.
- Le cadastre informatisé documente la géométrie de chaque parcelle.
- Les bases DVF (Demandes de Valeurs Foncières) recensent toutes les transactions immobilières des cinq dernières années avec prix et surfaces.
- Le registre des bénéficiaires effectifs (RBE) liste les personnes physiques contrôlant les sociétés.
- Le registre des sanctions financières (LCB-FT) identifie les personnes faisant l'objet de mesures de gel.
Toutes ces bases ont en commun trois caractéristiques. Elles sont gratuites et publiques (financées par l'impôt, accessibles sans frais). Elles sont fiables (produites par des administrations dont c'est la mission). Et elles sont inutilisables en l'état pour la plupart des professionnels — formats techniques, granularité administrative, absence d'API, mises à jour discrètes.
Le travail de plateformes comme Ragindeed consiste précisément à transformer ce patrimoine en infrastructure exploitable. Pas pour le remplacer, mais pour le rendre utile au quotidien à ceux dont le métier en dépend : notaires, gestionnaires d'actifs, CGP (conseillers en gestion de patrimoine), services de conformité, promoteurs. L'expertise n'est ni dans la donnée — qui existe déjà — ni dans l'IA pure : elle est dans le chemin de l'une à l'autre, dans la qualité d'ingestion, la normalisation, la représentation, et l'attention portée à la lisibilité du résultat final. Cette ingestion s'opère sur une infrastructure souveraine hébergée en France, dont le détail est documenté dans notre article dédié à l'architecture et l'hébergement.
Sur le cas DFI, ce chemin a produit une diminution d'un facteur 10 du volume de rendu pour les parcelles complexes — 22 pages au lieu de 250 — sans aucune perte d'information. C'est la différence entre un document qu'on consulte et un document qu'on referme.
En résumé
Les Documents de Filiation Immobilière de la DGFiP retracent la généalogie cadastrale de chaque parcelle française depuis les années 1980. Cette information est publique, exhaustive et fiable, mais structurellement inutilisable par les professionnels de l'immobilier dans son format de diffusion d'origine.
En l'ingérant, en la normalisant et en concevant une représentation DAG par génération plutôt qu'un arbre indenté redondant, Ragindeed rend la filiation cadastrale consultable en quelques secondes pour n'importe quelle parcelle française. Sur les cas extrêmes — parcelles marseillaises avec plus de mille ancêtres — le rapport tient en une vingtaine de pages au lieu de plusieurs centaines, avec une garantie de complétude.
Cette logique se réplique à l'ensemble du patrimoine de données publiques de l'État. La valeur n'est pas dans la donnée brute : elle est dans le travail patient qui la rend opérationnelle.
Vos due diligences immobilières méritent une chaîne de titre cadastrale vérifiée en quelques secondes. Faites-en l'expérience.
Demandez une démo personnalisée : ragindeed.com
Le rapport « Historique cadastral » de Ragindeed valorise le référentiel DFI de la DGFiP pour vous fournir, en quelques secondes et pour n'importe quelle parcelle française, la généalogie complète et lisible des mutations cadastrales. Tester le rapport DFI sur vos parcelles →