荷物持ちでも構わない

文系大学4年生からデータサイエンティストを目指して頑張りつつ、書きたいことを書きたいときに書きたいだけ書く、ルール無用雑記ブログ。

MENU

PythonとSQLでデータを蓄積して目視で打ち手を考えるツールを作る

僕は4月から広告業界に就職することになっており、既に1月から就職先の会社でバイトを始めているのだが、

来週からエンジニアチームに入って社内向けの分析ツールを作ることになった。

といっても既に外注で大方完成していて、僕が参加するのは細かいテコ入れやツールの改良といった部分になる。

社内向けのツールなのであまり具体的な話はできないが、PythonのスクレイピングとSQLを使って広告に関するデータを半自動で収集・蓄積し、Googleデータポータルで可視化して、それを運用担当が見て今後の打ち手を考えるのに役立てる、という形。

今のところはツールがやってくれるのはデータを可視化するところまでなので、あとは運用担当の知識と経験に基づいてデータを活用して業務の効率化を図ることになるのだが、

将来的には自然言語処理などの機械学習も取り入れていって、人間の勘と経験以上のパフォーマンスを叩き出すことと、現在は半自動になっているデータの蓄積と可視化を完全に自動化することを目標にしている。

僕は基本的にはド文系で、統計学は独学で勉強して統計検定2級(大学1~2年レベル)を取得するまでには至ったが、機械学習に必須の線形代数学はさっぱりわからないし、

プログラミングに関してもRはコピペでなんとか使えるぐらい、Pythonは基本的な文法がギリギリわかるぐらい、SQLは3日ぐらい勉強しただけ、という有様なので、

新卒でこんな大型プロジェクトに関われるのはラッキーという他ない。

プロジェクトを主導で進めているデータサイエンティストいわく、「刀を鉄砲に変えるのが一番強い」とのことで、今回のプロジェクトはまさに鉄砲を作るためのものなので、実現すれば会社の競争力がぐっと底上げされるのは間違いない。

とはいえ僕はまだバイト身分だし、ツールの根幹になっているPythonとSQLの知識もほとんどないので、これから勉強して少しでも戦力になれるように追い付かなければならない。

Pythonの勉強は相変わらずPyQで少しずつ進めているし、PyQのプログラムの中にSQLの基礎も含まれていたのでそれを使ってSQLの勉強もしているが、足りなかったらProgateを再開してSQLの勉強も強化していくかもしれない。

そんな感じで、まだ軽く概要を聞いただけなので実際の業務にどれほど関わるのかはまだわかっていないが、かねてから希望していたデータサイエンス周りの業務なので、今からワクワクしている。

大きな経験になるのは間違いないし、他のデータサイエンティスト達から積極的にノウハウを盗んでいく所存。

夢のデータサイエンティストの肩書は意外と早く手に入るかもしれない。

というわけで、短めだが今回はこの辺で。