Im Rahmen der Studie wurden systematisch Testfälle entwickelt, die mit wenig Aufwand eingesetzt werden, zum Beispiel mit besonders großen Zahlen als Eingaben. Durch unsere Arbeit konnten wir unter anderem Fehler in den populären Bibliotheken Scikit-Learn und WEKA finden, die nicht nur zu Berechnungsfehlern führen, sondern direkt die ganze Software abstürzen lassen.
Wir empfehlen daher: Verlassen Sie sich nicht auf die Korrektheit der Bibliotheken, sondern Testen sie die Robustheit ihrer Anwendungen.
Geeignete Tests finden sie in unserer als Open Access Verfügbaren Studie „Smoke Testing for Machine Learning: Simple Tests to find Severe Defect” wurde in der Fachzeitschrift Empirical Software Engineering publiziert und kann hier abgerufen werden: https://doi.org/10.1007/s10664-021-10073-7