データを処理する人には、「データを十分に拷問すれば、ほとんど何にでも告白する」ということわざがあります。これは、ボフェローニの定理によって数学的に裏付けられています。この定理では、「統計的検定の数が増えると、誤った有意な結果(タイプIの過誤)が発生する可能性も高くなります」と述べています。たとえば、データマイニングの原則で与えられた状況が知られています:「このタイプの予測の特にユーモラスな例の1つは、有名なスタンダードとプアーの年間値のほぼ完全な予測を達成したラインウェーバー(個人的なコミュニケーション)によって提供されましたバングラデシュと米国のバター生産、チーズ生産、羊の個体数の前年の年間値の関数としての500財務指数。
複雑すぎるモデルを使用しているときに実際的な状況に遭遇しましたか?結果は誤っていましたか?あなたが使ったアプローチと一緒に、あなたはそのような状況を提示できますか?