検討すること
- 基本に立ち返ること
- 全てのデータを使えているか
- 使っているデータデカすぎないか?小さくしても問題ない可能性はないか?(最小サイズで試して理想値を計算するなど)
- モデルについて
- 主要なモデルを試したか?(resnet34d, efficientnet, swimtransformer)
- テーブルデータ
- Tree系GBDT, catboost, xgboost(https://signate.jp/competitions/624/discussions/32)
- NN系 Tabnet, Grownet(https://www.kaggle.com/code/gogo827jz/multi-label-pbestpre-inference-grownet-pl#Preprocessing)
- 音声データ
- reshapeしてCNN2Dに入れた?参照eeg_raw_model | Kaggle
- 周波数ごとにみたか?(mneライブラリ使える)
- headのslide + (LSTM, GRUなど)
- 画像データ
注意すること - 最初からモデルを大きくしすぎていないか? - TTAを最初から大きくしすぎていないか?(最後に5とかにしよう) - augmentationを試しすぎない