荷物持ちでも構わない

文系大学4年生からデータサイエンティストを目指して頑張りつつ、書きたいことを書きたいときに書きたいだけ書く、ルール無用雑記ブログ。

MENU

2019年は目指せKaggler!機械学習ド素人のPython初心者がKaggleに挑戦

2019年は目指せKaggler!!

卒論は2018年中に書き上げたし、内定先は忘年会に参加したときに一通り顔合わせも済ませてどんな仕事をすることになるのかも大体聞いたし、年始は特に何も予定がないので、2019年の抱負として、Kaggleに挑戦してみることにした。

数学はまるでダメなド文系、統計学は去年統計検定2級に合格した程度、Rはちょっとだけ書けるけどPythonはほぼ素人、機械学習の知識はほとんどゼロ、そんな僕がKagglerとして大成するまでの物語である。

そもそもKaggleとは何なのか

Kaggle(カグル)とは、Your Home for Data Scienceである。

グーグル翻訳によれば、「データサイエンスのためのあなたの家」らしい。

要は、データサイエンスに関わる人々が集まるプラットフォームが、Kaggleなのだ。

Kaggleでは何が行われているかというと、まず第一に、世界中の企業が自社のデータを提供して、機械学習のコンペを開催している。

企業がデータを提供し、Kaggleのユーザーはそのデータを使って機械学習のモデルを作ってその精度を競い合い、最も精度の高いモデルが企業に買い取られ、作者には賞金とメダルが与えられる。

というのが、Kaggleのメインコンテンツである機械学習コンペ。

日本企業もKaggleでコンペを開催していて、有名どころだとメルカリなんかがコンペを開催していたらしい。

コンペで優秀な成績を残すと賞金がもらえる他、Kaggle内でメダルがもらえて、メダルを集めると、エキスパート、マスター、グランドマスターというようにKaggle内で称号をもらうことができる。

特にグランドマスターは世界でも100人強しかいないらしく、Kaggleで称号を得ることがデータサイエンティストとしてキャリアを積み上げていくための手段となっているのだ。

といった具合で、Kaggleのメインコンテンツはコンペなのだが、それだけではなく、「カーネル」という、機械学習のモデルのソースコードにコメントが添えられた、いわば「お手本」のようなものを公開する場もあったり、

ユーザーの質問に他のユーザーが回答したりする場もあったりと、「Your Home for Data Science」の名の通り、とにかくデータサイエンスに関わる人たちにとって有益なプラットフォームになっている。

2019年はKagglerを目指したい!!

去年の11月に統計検定2級(大学基礎レベル)に合格してからは、卒論のための研究に追われてあまりデータ分析方面の勉強ができていなかった僕だが、

その卒論は2018年中に書き終えて、バイトとか就職先で使うための資格の勉強とかはあるのだが、一応時間に余裕ができてきたというわけで、2019年はKagglerを目指そうと思う。

一応補足しておくと、Kagglerとは、Kaggleのコンペに参加する者のことである。

しかし、統計検定2級を取ったことで大学基礎レベルの統計学の知識を持っていることは証明できたものの、統計学と機械学習はまた別の世界。

機械学習に関する勉強なんてほとんどしたことがないので、よく使われるアルゴリズムもよくわからない。

サポートベクターマシンとか、ロッソ回帰とか、ランダムフォレストとか、ニューラルネットとか、名前は知ってるけど一体何者?というレベル。

損失関数を最小化して、目的関数を最大化する最適化問題を解けばいいらしい、なんてもっともらしいことは言えるが実際合ってるのかどうかは全くわからない。

そんな感じで、機械学習に関しては全くのド素人。

加えて、機械学習の世界ではもはやデファクトスタンダードなPythonも、ちょっと勉強したことがあるだけで、イチからコードを書けと言われたら何も書けない。

print("Hello, World!") が精々である。

メソッド?クラス?インスタンス?どれが何で何だっけ?というレベル。

一応これでもProgateは一周した。

というわけで、Kaggleに参加する前に、Kaggleに参加するための勉強から始めなければならない。

あとついでに言うと、Kaggleは全て英語の世界なのだが、英語もわからないので、カーネルなどの有益な情報を見ても理解するのに時間がかかる。

ずいぶん道のりは長そうだが、とりあえず、2019年中に、どんな小さなコンペでもいいので、ブロンズメダルを獲得することを目標にしたい。

Pythonも機械学習もほぼゼロからのスタートなので、まず2019年中にコンペに参加できるのかどうかも怪しいところだが、3月までは暇な時間も多くあることだし、なんとかがんばっていこうと思う。

まとめ

2019年の抱負として、Kagglerを目指してみることにした話。

とりあえずKaggleに登録だけはしてみたので、わからないなりにいろいろ目を通してみるだけでも後々勉強に活かせることがあるかもしれない。

かなりハードな企画だというのは何となく察知しているので、途中で心が折れて逃げ出すこともあるかもしれないが、まずは機械学習とPythonの基礎を固めるところから。

Kagglerの方々の応援コメントなどもお待ちしております。

というわけで、今回はこの辺で。