Porsche Turbo Schnäppchenjagd

Porsche Turbo S in Unterführung mit Code

In einem früheren Beitrag habe ich Autopreise verglichen und den Preiszerfall pro Jahr modelliert. Nun wollte ich mich der Herausforderung stellen, besonders günstige Porsche Turbos (...what else?) anhand von Daten und Modellen zu identifizieren.

Datenaufbereitung

Hier geht es wieder um den gleichen Datensatz wie hier im Blog beschrieben. Nur schaue ich diesmal nicht nur den Preis und das Alter an, sondern auch noch andere vorhandene Datenpunkte wie Getriebe, Kilometerstand, Leistung (in PS) Postleitzahl des Verkäufers oder Inseratbewertung durch Autoscout24. Interessant bei Porsche 911 ist sicherlich die Vielfalt an Modellen (Turbo, S, 4S, GTS etc.) und Modellreihen durch die Jahre. Auch um eine etwas homogene Datengrundlage zu haben, habe ich mich für die Turbo und Turbo S Variante entschieden. Zum Zeitpunkt des Scrapings waren über 200 Modelle auf Autoscout verfügbar.

Daten analysetauglich machen

Ein grosser Teil der Analyse ist das weitere Verfeinern der Daten und das sog. Feature Engineering. Es gibt Informationen, die sich in Abhängigkeit mit dem Alter des Fahrzeugs ändern: Kilometerstand ist bei älteren Autos höher, weil gefahren wurde, und aufgrund technologischer Fortschritte haben neuere Autos tendenziell mehr Leistung und sind Automatik. Diese Datenpunkte sollen nicht nur einfach das Alter widerspiegeln. Deshalb habe ich gewisse Infos mit dem Fahrzeugsalter normalisiert.

Zusammenhang zwischen PS und Alter Hier die wichtigsten Daten für die analysierten Porsche Turbos inkl. den beschriebenen Korrekturen fürs Alter des Fahrzeugs

Schlussendlich habe ich einige Modelle (RandomForestRegression, XGBoost Regression, GBM) ausprobiert. Am besten hat mir jedoch das lineare Regressionsmodell gefallen, da es einerseits gute Parameter hatte (R² = 0,8 und durchschnittlicher Fehler von 20'000 CHF) und andererseits leicht zu interpretieren ist.

Insights

Ein Wort zum Modellfehler

20'000 CHF mag nach einem hohen Modellfehler klingen. Das liegt sicherlich an der trotz allem heterogenen Datenlage und den wenigen Beobachtungen. Trotzdem habe ich, wie im nächsten Abschnitt beschrieben, Fahrzeuge gefunden, die mehr als 20'000 CHF günstiger sind als das Modell vorhersagt. Dies sind bestimmt sehr gute Kandidaten für ein Schnäppchen - auch trotz Fehler.

Tuning ist schwierig einzuschätzen

Es gibt hervorzuheben, dass getunete Fahrzeuge oft schwierig zu bewerten sind. Wenn ein Modell übermässig viel PS hat oder durch einen Umbau sehr wenige gefahrene Kilometer aufzeigt (wird bei neuen Motoren teilweise auf Autoscout so gemacht), bewertet das Modell oft falsch. Diese Fahrzeuge habe ich von der Analyse ausgeschlossen.

Unterbewertete Fahrzeuge

(Disclaimer: Das ist keine echte Kaufempfehlung - sondern lediglich eine Analyse. Ich würde jedes Fahrzeug vor einem Kauf noch detailliert prüfen) Nach Analyse mit einem linearen Regressionsmodell habe ich folgende Fahrzeuge als Schnäppchen identifiziert (Links werden wahrscheinlich nicht lange gültig sein):

Zusammenfassung und nächste Schritte

Der Blog beschreibt, wie man anhand von Autoscout-Daten den Preis von Porsche Turbos modellieren kann. Damit ist es möglich, unterbewertete Fahrzeuge zu finden, welche günstiger sind als das Modell vorhersagt.

Eine Limitation sind sicherlich die zu wenigen Daten. Ich werde in einem der nächsten Blogs probieren, noch Autoscout.de-Daten hinzuzufügen sowie auch ein Modell auf anderen Autos zu trainieren.