In der Immobilienbranche spielen präzise und effiziente Vertragsanalysen eine entscheidende Rolle. Die korrekte Extraktion und Bewertung von Flächendaten aus Kaufverträgen, wie Wohnfläche und Nutzfläche, ist dabei von zentraler Bedeutung. Mit dem Aufkommen fortschrittlicher Technologien wie dem Zero-Shot-Learning eröffnen sich neue Wege, um die Herausforderungen traditionelle Methoden der Textanalyse in Verträgen zu überwinden und die Effizienz in der automatisierten Immobilienbewertung signifikant zu steigern.
Die Herausforderung der Flächendatenextraktion
Die Extraktion von Flächendaten aus Immobilienkaufverträgen ist ein komplexer Prozess, der hohe Genauigkeit erfordert. Die Verträge enthalten oft eine Vielzahl von Informationen in unterschiedlichen Formaten und Formulierungen, was die Konsistenz und Präzision der Datenextraktion erschwert. Traditionelle Methoden, die auf manuellen Prozessen oder einfachen automatisierten Systemen basieren, stoßen hier schnell an ihre Grenzen, da sie nicht in der Lage sind, die Vielfalt und Komplexität der Daten effektiv zu bewältigen.
Zero-Shot-Learning: Ein neuer Ansatz
Zero-Shot-Learning ist ein relativ neues Konzept im Bereich des maschinellen Lernens, das es Modellen ermöglicht, Aufgaben zu bewältigen, für die sie während des Trainings keine Beispiele gesehen haben. Dies wird durch den Transfer von Wissen aus ähnlichen Aufgaben erreicht, für die das Modell trainiert wurde. Im Kontext der Vertragsanalyse ermöglicht Zero-Shot-Learning die Klassifizierung und Extraktion spezifischer Informationen wie Flächendaten, selbst wenn das Modell nicht direkt mit solchen Daten trainiert wurde. Durch die Fähigkeit, relevante Informationen ohne spezifisches Training zu erkennen und zu extrahieren, können Zero-Shot-Modelle effizienter und flexibler eingesetzt werden als traditionelle maschinelle Lernmodelle. Dies ist besonders wertvoll in einem Bereich, in dem Verträge eine hohe Variabilität aufweisen und ständig neue Formulierungen und Dokumentstrukturen auftreten.
Die Nutzung von Zero-Shot-Learning für die Extraktion von Flächendaten aus Immobilienverträgen bietet zahlreiche Vorteile. Zu den wichtigsten gehören die Verbesserung der Genauigkeit und Konsistenz der Datenextraktion, die Reduzierung des Zeitaufwands und der Kosten für die Vertragsanalyse sowie die Flexibilität im Umgang mit neuen oder unbekannten Vertragsformaten. Allerdings bringt dieser Ansatz auch Herausforderungen mit sich, insbesondere in Bezug auf die Implementierung und Anpassung der Modelle an spezifische Anforderungen der Immobilienbranche.
Die Bedeutung von Feinabstimmung und Labels
Im Kontext der Vertragsanalyse im Immobilienbereich, wo die genaue Klassifizierung von Flächendaten wie Wohnfläche, Nutzfläche oder Grundstücksfläche entscheidend ist, kann Zero-Shot-Learning einen wertvollen Beitrag leisten. Um die Wirksamkeit von Zero-Shot-Learning zu veranschaulichen, wollen wir uns eine Heatmap ansehen, die die tatsächlichen und vorhergesagten Werte darstellt:
Diese Heatmap zeigt, wie ein Zero-Shot-Modell die verschiedenen Arten von Flächen in Immobilienverträgen identifiziert hat. Auf der vertikalen Achse sind die tatsächlichen Labels (die wahren Werte aus den Verträgen), während die horizontale Achse die vom Modell vorhergesagten Labels zeigt. Die Intensität der Farbe repräsentiert die Häufigkeit, mit der das Modell ein bestimmtes Label richtig oder falsch vorhergesagt hat. Zum Beispiel zeigt das dunkelste Feld, dass das Modell sehr häufig die Wohnfläche korrekt identifiziert hat.
Ein Blick auf die Hauptdiagonale der Matrix gibt uns Aufschluss darüber, wie oft das Modell die Labels genau vorhergesagt hat. Felder außerhalb der Hauptdiagonale deuten auf Fehlklassifikationen hin. Zum Beispiel sehen wir, dass das Modell gelegentlich die Grundstücksfläche mit der Gesamtfläche verwechselt hat. Die Herausforderung besteht darin, Modelle zu entwickeln, die die Nuancen der Vertragssprache verstehen und dementsprechend die relevanten Informationen extrahieren können. Hierbei spielen die Feinheiten der Vertragssprache eine entscheidende Rolle, denn die gleichen Begriffe können je nach Kontext unterschiedliche Bedeutungen haben.
Weiterführende Schritte
Um die Effektivität von Zero-Shot-Learning in der Vertragsanalyse zu erhöhen, könnten die folgenden Schritte in Betracht gezogen werden:
Erweiterung des Kontexts
Die Bereitstellung eines größeren Kontexts für das Modell könnte zu genaueren Vorhersagen führen. Wenn ein Modell beispielsweise nur "25 m²" sieht, könnte es schwierig sein zu bestimmen, ob dies die Wohnfläche oder die Terrassengröße ist. Mehr Kontext könnte diese Ambiguität auflösen.Verfeinerung der Labels
Die Entwicklung spezifischerer Labels und die umfangreiche Datenvorverarbeitung um dem Modell saubere und eindeutige Textteile zu präsentieren, könnte die Genauigkeit verbessern. Beispielsweise könnte das Label "Wohnfläche" in "Nutzfläche - Innen" und "Nutzfläche - Außen" unterteilt werden, um präzisere Klassifikationen zu ermöglichen.Post-Processing
Nach der ersten Klassenzuordnung könnten weitere Analysen durchgeführt werden, um die Ergebnisse zu überprüfen und zu verfeinern. Dies könnte insbesondere dort hilfreich sein, wo das Modell unsicher ist oder inkonsistente Klassifikationen vornimmt.
Der vorliegende Blogbeitrag entstammt einer umfassenderen Forschungsarbeit, die sich mit der Anwendung von Zero-Shot-Learning für die Extraktion von Flächendaten aus Immobilienverträgen befasst. Diese Arbeit wurde von Julia Angerer in Zusammenarbeit mit der DataScience Service GmbH und der Paris-Lodron-Universität Salzburg durchgeführt. Es sei darauf hingewiesen, dass die gesamte Studie eine breitere Palette von Modellen, Ansätzen und Techniken umfasst, die hier nicht vollständig dargestellt werden können.
Es ist unser Ziel, diese fortschrittlichen Entwicklungen und Erkenntnisse in unsere Softwarelösungen zu integrieren. Die Integration von Zero-Shot-Classification in unsere Systeme wird es uns ermöglichen, den Bewertungsprozess für Immobilien signifikant zu verbessern. Durch den automatischen Abgleich der von Bewertern angegebenen Flächendaten mit den im Vertrag festgehaltenen Werten können wir eine zusätzliche Sicherheitsebene im Bewertungsprozess schaffen. Dies ist ein entscheidender Schritt, um die Genauigkeit und Zuverlässigkeit unserer Dienstleistungen zu gewährleisten und unseren Kunden die Sicherheit zu geben. Kontaktieren Sie uns unter office@ds-s.at, um mehr über unsere wissenschaftlichen Initiativen zu erfahren. Bei DataScience Service GmbH nutzen wir diese neuen Technologien, um unseren Kunden genaue, datengesteuerte Bewertungen zu bieten und sie bei der Navigation durch den sich ständig verändernden Immobilienmarkt zu unterstützen.
Quelle: Angerer, Julia. „How Big Is the Real Estate Property? Using Zero-Shot vs. Rule-Based Classification for Area Categorization in Real Estate Contracts.“ Masterarbeit, Paris-Lodron-Universität Salzburg, Fakultät für Digitale und Analytische Wissenschaften, Salzburg, April 2024. Verfügbar unter: https://eplus.uni-salzburg.at/download/pdf/10077751.pdf