荷物持ちでも構わない

文系大学4年生からデータサイエンティストを目指して頑張りつつ、書きたいことを書きたいときに書きたいだけ書く、ルール無用雑記ブログ。

MENU

データ分析

文系だけどデータサイエンティストを目指したい!! 統計学・データ分析について勉強したことの記録。

Python初心者だけど実務に活かしたい!PyQで勉強始めました

今まで、Progate、CODEPREP、AI Academyと数々のオンラインプログラミング学習サービスを渡り歩いてきた僕だが、このたび新しく「PyQ(パイキュー)」というサービスにも手を出してみた。 新しく内定先でアルバイトを始めたことで、より一層Pythonの必要性を感…

実務で必要な統計学・データ分析・プログラミングの知識はどこまでか

データサイエンティスト・データアナリスト・データエンジニアと呼ばれる仕事に就いている人達は、実際のところ、統計学やデータ分析、プログラミングの知識をどれだけ要求されるのか。 実務で必要になるこれらの知識レベルは、当然、業界や企業によって異な…

どうせ機械学習やるならディープラーニングでビットコインFXしたい

今日は欲望丸出しな話。 卒論は年越しまでに書き上げて、辛かった年末年始もなんとか乗り越えて、やっと普通の日常が戻ってきたので、ぼちぼち勉強も再開することにした。 で、今やっているのは主にPythonと機械学習。 今年の目標はKagglerになることなので…

2019年は目指せKaggler!機械学習ド素人のPython初心者がKaggleに挑戦

2019年は目指せKaggler!! 卒論は2018年中に書き上げたし、内定先は忘年会に参加したときに一通り顔合わせも済ませてどんな仕事をすることになるのかも大体聞いたし、年始は特に何も予定がないので、2019年の抱負として、Kaggleに挑戦してみることにした。 …

RとShinyでWebアプリ制作に挑戦し始めたものの謎のエラーで難航中

最近バイトで出社しても仕事がなく、上から2番目の古株にも関わらず社内ニートと化しているので、今日はひたすらWebアプリ制作に勤しんでいた。 統計解析用ソフトでおなじみRと、そのパッケージであるShinyというR内で動作するツールを使って、Googleアナリ…

ド文系だけど統計学の基礎が固まってきたので線形代数学始めました

今月の上旬に統計検定2級を受験して、60点以上で合格のところを79点というなかなかいい成績で合格したので、一応統計学の基礎知識は固まっていると判断して、次のステップに進むことにした。 次のステップとは、具体的に言うと機械学習である。 僕はデータサ…

Googleアナリティクスの指標を理解するのに大切なスコープレベル3つ

最近、バイト先の仕事の引継ぎでGoogleアナリティクスの使い方を後輩に指導しているので、今回はGoogleアナリティクスの話でも。 Googleアナリティクスの指標は、大きく分けて3つのスコープレベルが存在する。 そのスコープレベルとは、ユーザー、セッション…

機械学習のド素人が『大学4年間のデータサイエンスが~』読んだ感想

『大学4年間のデータサイエンスが10時間でざっと学べる』本がKindle Unlimitedの読み放題対象になっていたので、これ幸いとばかりにダウンロードして読んでみた。 大学4年間のデータサイエンスが10時間でざっと学べる posted with ヨメレバ 久野 遼平,木脇 …

CBT方式で統計検定2級合格!通常試験との違い、勉強時間と勉強方法

統計検定2級、ついに合格したぞー!!! ということで、本日11月4日、ついに、ようやく、CBT方式で統計検定2級に合格した。 勉強を始めたのが今年の7月上旬頃なので、4ヶ月もかかってしまった。 長かった……。 というわけで、この度統計検定2級に合格したので…

明日CBT方式で統計検定2級を受験してきます

タイトル通りなので、今日はちょっと手短に。 明日、CBT方式で統計検定2級を受験してきます。 当初の予定では9月末までに合格を目指していたのが、10月中旬まで、10月末まで、とどんどんずれていき、最終的に11月まで食い込んでしまった。 過去問は、2015~2…

ビジネスで使える統計講座(統計検定2級対応)の第2回を受講してきた

今日は、株式会社アゴラ・ステーション主催、SAS Institute Japan株式会社協賛の、「ビジネスで使える統計講座(統計検定2級対応)」の第2回を受講してきた。 先々週に第1回を受講して、2週間ぶりの受講となる。 ↓第1回を受講したときの記事はこちら↓ www.mess…

Google Analyticsはスクショ画像公開OK?社内でも意見が分かれる模様

Googleアナリティクスのスクリーンショット画像やデータの数値をブログなどで公開するのは規約違反にあたり、Googleからお叱りを受けるという噂がある。 実際、ネットで調べてみると、掲載していた画像を消されてしまっただとか、アナリティクスのスクショ画…

【Googleアナリティクス】「直帰率」と「滞在時間」の関係性を知ろう

Googleアナリティクスのレポートの中には、「直帰率」という指標がある。 文字通り、「直ぐに帰ってしまった人の率」という意味で、例えばこのブログにトップページから入ってきた人が、他のページに一切遷移することなくブラウザバックしてしまった場合など…

ビジネスで使える統計講座(統計検定2級対応)の第1回を受講してきた

今日はタイトル通り、「ビジネスで使える統計講座」という、統計検定2級に対応した内容の統計学の講座を受講してきた。 全3回あって、今日はその初回だったのだが、統計検定2級合格を目指している者としていろいろ学ぶことも多かったので、初回の感想をつら…

Progateが終わったら次はこれ!「AI Academy」でさらにPythonを学ぶ

AI AcademyというPythonの学習サービスを使ってWebスクレイピングの勉強を始めてみた。 本来は有料のサービスなのだが、CEOの方のご厚意で、学生限定先着10名で、数週間~最大1ヶ月間無料で使わせてもらえるとのことだったので、すかさず手を挙げて参加して…

【Python】プログラミング知識ゼロから始めてProgate完走しました

ProgateでPythonのレッスン完走したぞー!!! というわけで、プログラミング学習サービスのProgateで、Pythonのレッスンを一通りやり切ったので、その報告と感想記事。 ただ1周やりきっただけでは初心者に毛も生えないぐらいの初心者でしかないと思うので、…

プログラミング経験ほぼゼロだけどProgateでPythonの勉強始めてみた

以前、CODEPREPというプログラミング学習サービスが期間限定で無料公開されているということで、それに乗じてPythonの勉強を始めたという記事を書いた。 www.messyer813.com 2ヶ月でPythonマスターを目指すなんてタイトルで書いたはいいものの、CODEPREPの教…

『データサイエンス「超」入門』の感想|データを疑う力を養う本

データサイエンティストで作家でもある、株式会社デコムの松本健太郎さん(@matsuken0716)と、何の縁でかツイッターで相互フォローさせていただいているのだが、 その松本健太郎さんが、9月28日に『データサイエンス「超」入門 嘘をウソと見抜けなければ、デ…

『誤解だらけの人工知能』の感想|来たるAI時代を文系が生き抜く方法

『誤解だらけの人工知能~ディープラーニングの限界と可能性~』という本を読んで、いろいろ思うところがあったので、書評というほどしっかりした文は書けないけれども、読書感想文程度のものを雑記として書いてみようと思う。 誤解だらけの人工知能 ディー…

統計検定2級の進捗報告と実践している勉強方法・参考書まとめ

7月初旬に統計検定2級の受験を決意してから、早いもので2ヶ月半ほど過ぎた。 そのときに書いた統計検定2級についての記事が、「統計検定 就職」のようなそこそこ検索ボリュームのあるいくつかの検索キーワードで掲載順位1位を取れるようになっていて、そこか…

KHCoderのベイズ学習でツイートの属性を機能的/情緒的に分類した

以前、RとKHCoderを使ってSHARP公式ツイッターのツイートをクラスタリングする記事を書いた。 このときは「教師なし学習」による分類だったので、自分の思い通りのクラスターを作ることができなかったが、今回は、単純ベイズ分類器(ナイーブベイズフィルター…

【保存版】Google Analyticsを使うなら覚えておきたい用語集(2/2)

昨日に引き続き、今回も、Google Analytics(グーグルアナリティクス)をこれから使おうとしている、あるいは最近使い始めた初心者の人に向けて、グーグルアナリティクス初心者にとって大きな壁となる、グーグルアナリティクス特有の用語を解説していきたい。 …

【保存版】Google Analyticsを使うなら覚えておきたい用語集(1/2)

今回から、2回に分けて、Google Analytics(グーグルアナリティクス)をこれから使おうとしている、あるいは最近使い始めた初心者の人に向けて、グーグルアナリティクス初心者にとって大きな壁となる、グーグルアナリティクス特有の用語を解説していきたい。 1…

RとKHCoderを使ってSHARP公式のツイートをテキストマイニングする

一昨日、昨日と、テキストマイニングについての記事を書いてきたが、 今日は、データ取得→加工→形態素解析→クラスタリング という一連の流れをやってみようと思う。 使うツールはRとKHCoderとMeCab。 一昨日と昨日の記事を読んでいないという人は、先にそっ…

Excelで正規表現検索・置換ができるアドインでデータ加工を効率化

昨日の記事(KHCoderを使って文章の形態素解析とクラスタリングをやってみた)では、KHCoderというフリーソフトを使って、各新聞社の社説を形態素解析してクラスタリングするという、テキストマイニングの一連の流れをやってみた。 僕はテキストマイニングにつ…

KHCoderを使って文章の形態素解析とクラスタリングをやってみた

卒論の研究のためにテキストマイニングをマスターする必要があったので、今日はそのための勉強をしていた。 とりあえずタイトルの通り、文章を形態素解析してそれを元にクラスタリングするところまではできたので、その方法をまとめて記事にしようと思う。 …

【一覧表】対応のある2群の平均値差の検定(t検定)と信頼区間の推定

相変わらず鋭意勉強中の統計検定2級より、前回に引き続き、今回も平均値差の検定(t検定)と信頼区間の推定の話。 前回から間が空きすぎて前回っていつだよ状態だが、前回は独立した2群の平均値差の検定と信頼区間の推定をするための手順と公式を一覧表でまと…

RでGoogleAnalyticsのAPIを使って重回帰分析でCVRを予測してみた

先日、グーグルアナリティクスとRを使ってコンバージョン率(CVR)の高い見込み顧客を発掘する重回帰モデルを作ろうとした結果、グーグルアナリティクスの仕様上それが不可能だと知って断念した、という記事を書いた。 今回は、グーグルアナリティクスのAPIか…

"Googleの認定証"で履歴書を豪華に?無料で取れるGoogle公式資格3つ

Googleが公式に発行している民間資格があることをご存知の方はどれくらいいるだろうか。 そして、その存在を知っている方の中で、それが無料で取得できることまでご存知の方はいるだろうか。 今回は、そんなGoogle公式資格の話。 Googleが発行する公式資格は…

GoogleAnalyticsとRを使って重回帰分析で見込み顧客を発掘したかった

けどできなくて行き詰った、という話。 今回の記事は、僕が知識不足で悩んでいるというだけの話題で、これからGoogle AnalyticsとRを使って重回帰分析をするよ!というハウツー記事ではないので、そういう内容を期待して開いてくれた人は申し訳ないがブラウ…