荷物持ちでも構わない

文系大学4年生からデータサイエンティストを目指して頑張りつつ、書きたいことを書きたいときに書きたいだけ書く、ルール無用雑記ブログ。

MENU

実務で必要な統計学・データ分析・プログラミングの知識はどこまでか

データサイエンティスト・データアナリスト・データエンジニアと呼ばれる仕事に就いている人達は、実際のところ、統計学やデータ分析、プログラミングの知識をどれだけ要求されるのか。

実務で必要になるこれらの知識レベルは、当然、業界や企業によって異なると思うけれども、データサイエンスに関わる多くの人達が一度は考える問題じゃないだろうか。

僕も就職したらデータ分析に専門的に携わっていくことが内々定している身分で、今はそのために勉強している最中なので、一体どこまで知識を身に着ければいいのか、実務におけるゴールはどこなのかを考えてみたい。

データサイエンティスト・データアナリスト・データエンジニアの違い

まず前提として、データ分析に関わる職種を3つに分類してみる。

データサイエンティスト・データアナリスト・データエンジニアの3つである。

これらはよく混同されるし、誰もが共通して持っている絶対的な違いというのもないと思う。

一応、僕の考えを述べておくと、データサイエンスに関わる人達は、データ分析スキル、ビジネススキル、エンジニアリングスキルの3つの力を要求されるが、この3つのうちどれに特化しているかが職種の分類を決めると考えている。

データサイエンスにこれら3つのスキルが必要というのは恐らくほぼ異論はなくて、いろいろな記事や書籍で言われている内容のはず。

軽く内容を説明しておくと、データ分析スキルは、言うまでもなく、データの海から有益な情報を見つけ出す力。

データサイエンスに関わるなら持っていて当たり前のスキル。

ビジネススキルは、課題発見力とか、企画立案力とか、データをビジネスに活かすための力。マーケッターに近い。

エンジニアリングスキルは、データを扱うためのプログラミングの力。

R、Python、SQLなどなど、データ分析を効率的に行うためにはもはやプログラミングのスキルは欠かせないものとなっている。

これら3つのスキルをオールラウンドに持っているのがデータサイエンティスト、

ビジネススキルに強いマーケッター寄りの人間がデータアナリスト、

エンジニアリングスキルに強いエンジニア寄りの人間がデータエンジニア、

というように分類されるというのが僕の考え。

僕は「データサイエンティストになりたい」とよく言っているが、出身がマーケティング畑なので、どちらかというとデータアナリストに近いということになる。

というわけで、データアナリストを名乗るのに必要なスキルを考えてみたい。

データアナリストが実務で必要なスキルとは?

データアナリストを名乗るために必要なスキルは何なのか。

上述した3つのスキル、データ分析スキル、ビジネススキル、エンジニアリングスキルは、もちろんすべて兼ね備えていることが必須となる。

ではこれら3つのスキルを、それぞれどのレベルで持っていればいいのか。

実務においては何が重要になってくるのかを考えてみる。

データアナリストに必要なスキル①データ分析(統計学)スキル

まずはデータ分析スキル。

データ分析スキルというと曖昧なので、より具体的に、統計学のスキルということにしておく。

データを適切に扱って実務に活かすためには、統計学のスキルはもちろん不可欠である。

しかし、僕の就職先にいる元Googleのデータサイエンティストによれば、実務において高度な統計学の知識は必要ないらしい。

まあこれは業界や仕事内容にも依るだろうが、クロス集計と統計的仮説検定がわかれば十分なんだそうだ。

重回帰分析や因子分析といった多変量解析の知識は重要ではないということだ。

実際のところ、データ分析はクロス集計に始まりクロス集計に終わると言われるほど、クロス集計は重要で効果的な手法である。

特に僕の専門であるマーケティングにおいては、派手な多変量解析よりも地道なクロス集計が良い結果を導くことも多い。

データアナリストの仕事においては、基本的な記述統計と、確率論、推定と検定がわかっていれば十分と言えるだろう。

データアナリストに必要なスキル②ビジネススキル

データアナリストに最も必要なスキルは、ビジネススキルである。

より具体的には、データ分析を始める前にデータにアタリをつけるための課題発見力や、データから得られたエビデンスを元に利益に繋がる施策を提案する企画立案力、経営者に近い目線で物事を考える力など、要はマーケッターに要求される力。

データアナリストは企業の売上を増やすためにデータ分析を行う。

あまり良くない表現かもしれないが、「カネになる」データ分析が仕事なのだ。

そのためには、ただデータとにらめっこを続けているだけではダメで、顧客や自社の社員に対するヒアリングが大切になってくるし、事業内容についての深い理解も重要だ。

データアナリストという肩書ながら、データだけでは得られない情報を手に入れて活用する力が必要だと僕は思う。

データアナリストに必要なスキル③エンジニアリングスキル

最後に、エンジニアリングスキルだが、上述の通り、データアナリストは高度な多変量解析や機械学習モデリングを行うよりも、地道なクロス集計と仮説検定やヒアリングといった作業に重きを置く職業なので、エンジニアリングスキルは最低限で事足りる。

最低限と言っても、データ分析を行うためにはRかPythonは必須で、データベースに触れるならSQLも必要だし、扱うデータの大きさによってはHadoopやSparkなどの分散管理技術についても精通している必要がある。

そして、データアナリストはマーケティングなどの文系領域出身の人間が多いので、エンジニアリングスキルが一番苦労するところでもある。

SPSSやエクセル、RコマンダーなどのGUIツールでなんとかなることもあるかもしれないが、データを柔軟に扱うためにはやはりプログラミングの知識を備えていないと苦しいので、R、Python、SQLあたりは一通り扱えるようになっている必要があると思う。

データアナリストに必要なスキルまとめ

データアナリストは、ビジネススキルを最も要求される文系寄りの職種だが、統計学やプログラミングの知識も身に着けないといけないなかなかハードな仕事だ。

ただ、多変量解析を扱う場面はあまりないので、一番重要なのは「課題発見力」なんじゃないだろうか。

事業内容に対する深い理解と、顧客や社内でのヒアリングによって、課題を見つけ出し、データにアタリをつけて、最短最速でエビデンスを得て、顧客や経営者にプレゼンを行う。

データサイエンティスト・データエンジニアと比べて、スピード感が大事なのかもしれない。

僕はデータアナリストとしての仕事を始める前に半年間は現場仕事で修業を積むように社長から言われているが、その修業も、要はビジネススキルを磨いて事業内容への理解を深めるためのものだ。

統計学やプログラミングの知識も必要最低限には身に着けつつ、ビジネススキルを自分の武器として特化させていく。

それこそが、データアナリストに要求されるスキルなのだ。

僕は元々マーケッターの出身なので、マーケッターとして培ったビジネススキルをさらに伸ばしつつ、現状不足しているエンジニアリングスキルを高めることに注力していきたい。