Pixelbliss - stock.adobe.com

La Chambre des notaires met l’IA au service de l’estimation immobilière

L’estimation immobilière est une pratique complexe qui exige de compiler de nombreuses variables. Il faut souvent mandater un expert, comme un notaire, qui va effectuer de nombreux croisements de données plus ou moins manuellement. En vue d’accélérer, ce processus, la chambre des notaires de Paris fait appel à l’IA de PriceHubble.

Cet article est extrait d'un de nos magazines. Téléchargez gratuitement ce numéro de : Applications & Données: Processus : les bons candidats pour le RPA

Selon Loeiz Bourdic, Directeur France chez PriceHubble, les spécialistes de l’immobilier – comme Gecina, BNP Real Estate, ING ou encore Axa Investments Manager – veulent aujourd’hui obtenir des estimations précises, en quelques clics seulement, pour les biens qu’ils mettent en vente.

Et pour y arriver, le Big Data et l’intelligence artificielle sont des partenaires de choix. PriceHubble œuvre auprès de clients BtoB (des promoteurs, des investisseurs, des bailleurs sociaux, etc.) et BtoBtoC (Agences immobilières, banques de financement, courtiers, gestionnaires de patrimoine ou encore notaires).

C’est en tout cas le pari qu’a fait le Suisse PriceHubble dès 2016, date de sa création. Depuis, la startup est présente dans cinq pays (la France, la Suisse, l’Allemagne, l’Autriche et le Japon), elle emploie 60 personnes, et revendique plusieurs centaines de clients – dont ceux évoqués par Loeiz Bourdic.

La Chambre des notaires de Paris veut un modèle d’estimation immobilière

Cette carte de visite a aussi convaincu la Chambre des Notaires de Paris.

Celle-ci avait évalué quatre solutions dans le but de concevoir un AVM (Automated Valuation Model) avant de se décider en faveur de PriceHubble . « À mon sens, c’est un choix pertinent parce que PriceHubble répondait à tous les critères que l’on s’était fixés », justifie Stéphane Adler, vice-président de la Chambre des Notaires de Paris et responsable des projets IT au sein de cette institution.

La Chambre des Notaires veut faire travailler cet algorithme sur les données immobilières notariales d’Île-de-France exploitées par Paris Notaires Service. Ces données correspondent à des actes de vente enregistrés en Île-de-France depuis plus de 25 ans.

« Nous avons numérisé des fiches qui nous sont transmises par les notaires au moment des ventes. Cette base de données rassemble les informations liées aux biens et aux acheteurs : type de bien, étage, présence d’un balcon, exposition, typologie d’acheteurs, etc. », liste Stéphane Adler.

« La base de données des notaires de Paris n’est pas parfaite, mais elle est très bien structurée. Cela nous a pris moins de cinq jours pour commencer à l’utiliser et à intégrer le premier modèle », continue Loeiz Bourdic. « Il y a 25 ans de données, mais il n’y a pas besoin de toutes les intégrer, toutes ne sont pas pertinentes au regard de l’état actuel du marché ».

Mais pour concevoir, cet AVM, cette base ne sera pas l’unique source d’informations.

« Aujourd’hui, il est possible d’adjoindre des variables comme les transports, les établissements scolaires, les magasins, etc. En corrélant ces informations avec un algorithme, vous obtenez une estimation plus précise, plus efficace et plus rapide de la valeur d’un bien », assure le vice-président de la Chambre des Notaires de Paris.

L’outil final permettra aux notaires de répondre aux clients qui lors d’une succession, d’une donation ou d’un premier rendez-vous avant une mise en vente, veulent obtenir un avis de valeur. « Leurs clients ont une idée du prix du bien, mais il y a souvent des surprises à la hausse comme à la baisse », affirme Stéphane Adler.

Un tel outil répond aussi à un besoin d’évolution. « La Chambre des notaires de Paris a dû faire avec la mise à disposition gratuite des bases de données DVF (Demande de la Valeur Foncière). Les notaires souhaitaient continuer à apporter de la valeur ajoutée à leurs clients en allant plus loin », constate Loiez Bourdic.

Importance de l’explicabilité

« Les notaires veulent un algorithme puissant et explicable. »
Loeiz BourdicPriceHubble

L’organisation notariale avait néanmoins une exigence très claire. La transparence. Ses membres veulent en effet pouvoir comprendre les résultats obtenus par le modèle d’estimation immobilière. « Les notaires veulent un algorithme qui soit à la fois puissant et explicable », confirme Loeiz Bourdic. « Or nous sommes aux antipodes d’une boîte noire. C’est aussi ce qui a convaincu la Chambre des Notaires ».

Le directeur France de PriceHubble considère qu’il y a plusieurs moyens pour estimer le prix d’un bien. Le plus standard consiste à utiliser les méthodes statistiques classiques. Les ajustements des variables sont au bon vouloir du statisticien qui procède avec sa propre grille d’analyse. Ensuite, il est possible d’utiliser des algorithmes génériques.

« Les algorithmes comme les random forest et certains réseaux de neurones sont très puissants, mais sont des boîtes noires complètes. Vous ne pouvez pas expliquer leurs résultats. Et s’il y a une incohérence dans la sortie, vous ne pouvez pas la régler », déclare-t-il. « Nous, notre approche, c’est de proposer un entre-deux : nous conservons l’explicabilité et le contrôle sur les différentes variables. Nous sommes capables de maîtriser l’impact de plusieurs variables marginales ».

Pour cela, PriceHubble s’appuie sur des méthodes ensemblistes « assez avancées ».

« La structure de l’algorithme que nous déployons sur la France, l’Allemagne et le Japon est identique. Les spécificités sont intégrées par les données que l’on met dans la machine », précise Loeiz Bourdic.

« Au Japon, il y a des spécificités qui sont par exemple liées aux règles de construction induites par l’activité sismique. La Chambre des notaires de Paris dispose de ses propres variables confidentielles. C’est la manière de croiser les données entre elles qui est systématisée dans les modèles de PriceHubble », ajoute-t-il.

La startup utilise des briques « élémentaires » comme TensorFlow. « TensorFlow est beaucoup plus bas niveau. Cette bibliothèque permet – sous réserve d’effectuer les investissements initiaux qui peuvent passer à l’échelle – de garder la main sur les algorithmes », insiste Loeiz Bourdic. Elle ne mise en revanche pas sur Scikit Learn qui ne permettrait pas d’obtenir le niveau de contrôle souhaité sur les algorithmes.

Derrière le rideau, Pricehubble utilise Spark, Docker, Kubernetes et CircleCI pour gérer ses pipelines ML. Ensuite, le modèle peut être intégré via API, par exemple pour une agence immobilière qui souhaiterait bénéficier d’un estimateur sur son site Web. PriceHubble développe également une interface utilisateur (UI) qui facilite l’accès aux informations des études de marché. L’utilisateur manipule alors une douzaine d’analyses différentes pour comprendre les dynamiques du marché, les permis de construire, les prix, etc.

Un « partenariat » entre notaires et data scientists

Que ce soit les notaires ou PriceHubble, les deux parties considèrent que ce projet va au-delà d’une simple relation de fournisseur à client.

« Nous jouons habituellement le rôle de prestataire extérieur qui propose des solutions d’estimation. Le projet avec la Chambre des Notaires de Paris est un véritable partenariat. »
Loeiz BourdicPriceHubble

« Nous sommes habitués à travailler avec des institutionnels avec lesquels la relation est à sens unique. Nous jouons habituellement le rôle de prestataire extérieur qui propose des solutions d’estimation. Mais le projet avec la Chambre des Notaires de Paris est un véritable partenariat », se réjouit Loeiz Bourdic. « Ils [les notaires de la région parisienne] mettent à disposition leurs données pour que nous déployions un algorithme de machine learning encore plus précis que ce que nous faisons actuellement ».

« C’est un partenariat et véritablement nous fonctionnons comme cela », renchérit Stéphane Adler. « Il s’agit pour l’instant d’une phase de recherche et développement. Mais si la solution fonctionne, il y aura une suite et peut-être une association. Nous avons la donnée, ils ont la technicité. L’un sans l’autre, cela ne fonctionne pas ».

Si l’algorithme fait preuve d’efficacité, la solution sera directement ouverte aux clients. « Sur toutes les villes denses, nous aurons normalement de bons résultats. Ce qui ne sera pas forcément le cas à la campagne ou des zones de villégiatures », tempère Stéphane Adler en ajoutant que dans ce cas, « cela ne vaudra jamais l’expertise humaine qui engendrera la visite du bien et déterminera le coût de réfection de l’appartement, par exemple ».

Dans un deuxième temps, l’outil pourra aussi servir à certains établissements financiers prêtant à « des foncières qui veulent obtenir un avis de valeur de leurs actifs, tous les deux à trois ans ».

Avant la crise sanitaire, PriceHubble et la Chambre des notaires de Paris avaient prévu une phase de R&D de quatre mois. Un travail qui a bien commencé au mois de mars 2020.

L’objectif de cette phase est d’échanger, entre experts de la data science et de l’immobilier, des différentes versions du modèle afin d’en améliorer la précision. « Il va y avoir différentes itérations de l’algorithme qui va être affiné au fur et à mesure en intégrant des variables et de nouvelles approches », explique Loeiz Bourdic.

Malgré la crise, il est toujours prévu d’avoir, « à la fin de l’année, quelque chose de présentable », lance Stéphane Adler.

D’autres projets IA chez les notaires

La chambre des notaires de Paris n’en est pas à son premier coup d’essai en matière d’IA. Elle a en fait quatre projets en cours.

Parmi eux, elle développe – en partenariat avec la société Hyperlex – la solution VictorIA dont le but est d’accélérer l’accès à des actifs immobiliers et à leur classification, dans des data rooms en ligne.

À l’avenir, la Chambre des notaires souhaite aussi pouvoir faire des recherches à l’intérieur des documents, les reconnaître et si possible les comparer.

Elle avait déjà travaillé avec Hyperlex en vue de classifier l’usage, en 1970, des biens immobiliers localisés à Paris au sein d’une base de données unique (VIDOC). Le but est ici de voir si le statut d’un bien a évolué (d’un appartement d’habitation en bureau par exemple), pour en livrer l’historique au client. Le projet a déjà trois ans.

Pour approfondir sur Intelligence Artificielle et Data Science

Close