DSB2019で惨敗した

はじめに

Kaggleはたまに参加していたけど、あまり本気でやったこともなかったので、ラスト1カ月からまじめにやってみた。

結論

色々ためしたが、何をやってもスコアが上がらず、惨敗した。

なぜだめだったか。

  • CVの切り方が最後まで分からず、全くtrustCVにならなかった。
  • trainとtestの分布が違う場合に、どう対応すればよいかわからなかった。
  • FeatureEngineeringも色々ためしたけど、LB上でのスコアが上がらなかった。
    • LBはあまり、信用できないだろうとも思っていたけど、自分のCVの切り方にも自信が持てなかった。
  • 英語力が無く、間違って読み取ったり、理解に時間がかかったり等が根本原因としてありそう。
  • 割と一から実装しているのでいろんなところで時間がかかってしまった。

よかったこと。

  • 最終サブミットまで頑張った。
    • 地味にいつも途中でやめてしまうので、一番良かったことかもしれない。
  • 知ってはいるけど、試したことがなかった手法を色々試せた。
    • target encoding, adversarial validation等
  • やるかと思ってからの環境準備とかにいつも手間取るけど、割とスムーズに始められた。
  • フォルダ構成とかが少しずつ良くなっている気がする。
  • 手法の実装が比較的すぐできた。
    • 「Kaggleに勝つ技術」のおかげだったりする。

今後について

  • 上位陣の解法をちゃんとチェックしたい。
  • パイプラインを少しずつ作っていきたい。
  • 画像もやりたい。