Conversation
Notices
-
地震予測コンペ
1位: #1 private LB kernel LANL lgbm | Kaggle https://www.kaggle.com/ilu000/1-private-lb-kernel-lanl-lgbm
2位: 2nd place solution | Kaggle https://www.kaggle.com/c/LANL-Earthquake-Prediction/discussion/94369-
・勝者の使った特徴量は意外にシンプル (ピーク数、パーセンタイル、MFCC平均値2種)
・ガウシアンノイズを入れるデータオーギュメンテーション (でもその後ウェーブレットでデノイズしてる…)
・ノイズを入れた後、中央値を引いてる
・学習データを何か選別してる
・n_fold=3
・LightGBM一本 (アンサンブルなし、2位はCatBoost)-
パブリックカーネルで出てきた何でもかんでも特徴量入れてその上複数モデルをアンサンブルってチュートリアルとしては良くても結果は良くないのかもな。性能出ないわりに、チューニングしずらいし、時間かかるし、わかりづらい。
そしてNNの存在感が無く、時系列の回帰ってNNよりGBDTが強いのかな。いろいろ考えさせられる。-
1位の手法の説明が出てた。互いに相関が小さい4つの特徴量を選び、学習データとテストデータで特徴量の分布の差が出ないようにコルモゴロフ-スミルノフ検定でp値>0.05になるように学習データを選んだらしい。パブリックLBのサンプルがプライベートLBに比べて違いすぎてパブリックLBが参考にならないため、CVをうまく調整して性能を確認する必要があるコンペだったとのこと。
1st place solution | Kaggle https://www.kaggle.com/c/LANL-Earthquake-Prediction/discussion/94390#latest-543640
-
-
-