| |
statistische Stabilität, overfitting, artificial skill, von einem Modell hoher statistischer Stabilität spricht man, wenn die Eigenschaften des Modells, insbesondere seine Vorhersagegüte, auch bei Anwendung auf (zukünftige) Fälle erhalten bleibt, die nicht zum sogenannten Entwicklungskollektiv gehören. Ohne besondere Vorkehrungen tendieren statistische Modelle dazu, ihren geschätzten (Qualitäts-) Erwartungen nicht gerecht zu werden.
Die Ursache liegt in der Dialektik von Zufall und Notwendigkeit, d.h. in der Tatsache, dass im Einzelfall (Element einer Stichprobe) notwendige (gesetzmässige) und zufällige Prediktor-Prediktanden-Beziehungen nicht getrennt werden können. Bekanntlich wächst das Risiko einer statistischen Instabilität mit abnehmendem Stichprobenumfang. Besonders in der Meteorologie mit ihren unübersehbaren, vierdimensionalen, globalen Datensätzen, die sehr rasch zu Tausenden von potentiellen Prediktoren (mögliche Einflussfaktoren) führen können, existiert eine zweite, wichtige Quelle von mangelnder Erwartungstreue, eben diese Anzahl potentieller Prediktoren selbst. Je grösser sie ist, um so grösser auch die Gefahr, Zufälliges als Gesetzmässiges zu modellieren. |
|