Machine-Learning-Modelle bewerten – die Crux mit der Metrik und den Testdaten

Neben einem guten Verständnis des Anwendungfalls sind die Qualität und Aufbereitung der Trainings- und Testdaten sowie die ausgewählten Metriken zur Bewertung von Machine-Learning-Modellen essenziell um erfolgreich Machine-Learning Ansätze in der Praxis einzusetzen.
Allerdings ist die Interpretation der Metriken und Resultate nicht immer eindeutig, wenn nicht gar irreführend. Darüberhinaus hat die Größe der Testdaten-Sets nicht zu unterschätzenden Einfluss auf die Vergleichbarkeit und Bewertbarkeit der Ergebnisse.

Lesen Sie dazu im codecentric Blog die Artikel:
Machine-Learning-Modelle bewerten – die Crux mit der Metrik
und
Machine-Learning-Modelle bewerten – die Crux mit den Testdaten.

An einem Beispiel des supervised learnings erläutere ich dort welche Aspekte unter anderem zu beachten und zu klären sind um einzuschätzen ob die mögliche Qualität eines Machine-Learning-Modells den Erwartungen entsprechen kann.

Please find the English version of the articles here:
Evaluating machine learning models: The issue with test data sets
Evaluating machine learning models: How to tackle metrics

Buchtipp: Machine Learning mit Python: Das Praxis-Handbuch für Data Science, Predictive Analytics und Deep Learning

Auf der Suche nach einem Buch mit einer umfassenden aber kompakten Einführung in Maschinelles Lernen und kleinen Beispielen aus der Praxis bin ich vor ein paar Jahren auf das Buch von Sebastian Raschka: Machine Learning mit Python: Das Praxis-Handbuch für Data Science, Predictive Analytics und Deep Learning gestoßen. Nun kann man 400+ Seiten (Druckversion) wahrscheinlich nicht als kompakt betrachten, aber angesichts des Themenspektrums und Komplexität finde ich es durchaus angemessen.
Weiterlesen „Buchtipp: Machine Learning mit Python: Das Praxis-Handbuch für Data Science, Predictive Analytics und Deep Learning“