荷物持ちでも構わない

文系大学4年生からデータサイエンティストを目指して頑張りつつ、書きたいことを書きたいときに書きたいだけ書く、ルール無用雑記ブログ。

MENU

データ分析

文系だけどデータサイエンティストを目指したい!! 統計学・データ分析について勉強したことの記録。

【Googleアナリティクス】「直帰率」と「滞在時間」の関係性を知ろう

Googleアナリティクスのレポートの中には、「直帰率」という指標がある。 文字通り、「直ぐに帰ってしまった人の率」という意味で、例えばこのブログにトップページから入ってきた人が、他のページに一切遷移することなくブラウザバックしてしまった場合など…

ビジネスで使える統計講座(統計検定2級対応)の第1回を受講してきた

今日はタイトル通り、「ビジネスで使える統計講座」という、統計検定2級に対応した内容の統計学の講座を受講してきた。 全3回あって、今日はその初回だったのだが、統計検定2級合格を目指している者としていろいろ学ぶことも多かったので、初回の感想をつら…

Progateが終わったら次はこれ!「AI Academy」でさらにPythonを学ぶ

AI AcademyというPythonの学習サービスを使ってWebスクレイピングの勉強を始めてみた。 本来は有料のサービスなのだが、CEOの方のご厚意で、学生限定先着10名で、数週間~最大1ヶ月間無料で使わせてもらえるとのことだったので、すかさず手を挙げて参加して…

【Python】プログラミング知識ゼロから始めてProgate完走しました

ProgateでPythonのレッスン完走したぞー!!! というわけで、プログラミング学習サービスのProgateで、Pythonのレッスンを一通りやり切ったので、その報告と感想記事。 ただ1周やりきっただけでは初心者に毛も生えないぐらいの初心者でしかないと思うので、…

プログラミング経験ほぼゼロだけどProgateでPythonの勉強始めてみた

以前、CODEPREPというプログラミング学習サービスが期間限定で無料公開されているということで、それに乗じてPythonの勉強を始めたという記事を書いた。 www.messyer813.com 2ヶ月でPythonマスターを目指すなんてタイトルで書いたはいいものの、CODEPREPの教…

『データサイエンス「超」入門』の感想|データを疑う力を養う本

データサイエンティストで作家でもある、株式会社デコムの松本健太郎さん(@matsuken0716)と、何の縁でかツイッターで相互フォローさせていただいているのだが、 その松本健太郎さんが、9月28日に『データサイエンス「超」入門 嘘をウソと見抜けなければ、デ…

『誤解だらけの人工知能』の感想|来たるAI時代を文系が生き抜く方法

『誤解だらけの人工知能~ディープラーニングの限界と可能性~』という本を読んで、いろいろ思うところがあったので、書評というほどしっかりした文は書けないけれども、読書感想文程度のものを雑記として書いてみようと思う。 誤解だらけの人工知能 ディー…

統計検定2級の進捗報告と実践している勉強方法・参考書まとめ

7月初旬に統計検定2級の受験を決意してから、早いもので2ヶ月半ほど過ぎた。 そのときに書いた統計検定2級についての記事が、「統計検定 就職」のようなそこそこ検索ボリュームのあるいくつかの検索キーワードで掲載順位1位を取れるようになっていて、そこか…

KHCoderのベイズ学習でツイートの属性を機能的/情緒的に分類した

以前、RとKHCoderを使ってSHARP公式ツイッターのツイートをクラスタリングする記事を書いた。 このときは「教師なし学習」による分類だったので、自分の思い通りのクラスターを作ることができなかったが、今回は、単純ベイズ分類器(ナイーブベイズフィルター…

【保存版】Google Analyticsを使うなら覚えておきたい用語集(2/2)

昨日に引き続き、今回も、Google Analytics(グーグルアナリティクス)をこれから使おうとしている、あるいは最近使い始めた初心者の人に向けて、グーグルアナリティクス初心者にとって大きな壁となる、グーグルアナリティクス特有の用語を解説していきたい。 …

【保存版】Google Analyticsを使うなら覚えておきたい用語集(1/2)

今回から、2回に分けて、Google Analytics(グーグルアナリティクス)をこれから使おうとしている、あるいは最近使い始めた初心者の人に向けて、グーグルアナリティクス初心者にとって大きな壁となる、グーグルアナリティクス特有の用語を解説していきたい。 1…

RとKHCoderを使ってSHARP公式のツイートをテキストマイニングする

一昨日、昨日と、テキストマイニングについての記事を書いてきたが、 今日は、データ取得→加工→形態素解析→クラスタリング という一連の流れをやってみようと思う。 使うツールはRとKHCoderとMeCab。 一昨日と昨日の記事を読んでいないという人は、先にそっ…

Excelで正規表現検索・置換ができるアドインでデータ加工を効率化

昨日の記事(KHCoderを使って文章の形態素解析とクラスタリングをやってみた)では、KHCoderというフリーソフトを使って、各新聞社の社説を形態素解析してクラスタリングするという、テキストマイニングの一連の流れをやってみた。 僕はテキストマイニングにつ…

KHCoderを使って文章の形態素解析とクラスタリングをやってみた

卒論の研究のためにテキストマイニングをマスターする必要があったので、今日はそのための勉強をしていた。 とりあえずタイトルの通り、文章を形態素解析してそれを元にクラスタリングするところまではできたので、その方法をまとめて記事にしようと思う。 …

【一覧表】対応のある2群の平均値差の検定(t検定)と信頼区間の推定

相変わらず鋭意勉強中の統計検定2級より、前回に引き続き、今回も平均値差の検定(t検定)と信頼区間の推定の話。 前回から間が空きすぎて前回っていつだよ状態だが、前回は独立した2群の平均値差の検定と信頼区間の推定をするための手順と公式を一覧表でまと…

RでGoogleAnalyticsのAPIを使って重回帰分析でCVRを予測してみた

先日、グーグルアナリティクスとRを使ってコンバージョン率(CVR)の高い見込み顧客を発掘する重回帰モデルを作ろうとした結果、グーグルアナリティクスの仕様上それが不可能だと知って断念した、という記事を書いた。 今回は、グーグルアナリティクスのAPIか…

"Googleの認定証"で履歴書を豪華に?無料で取れるGoogle公式資格3つ

Googleが公式に発行している民間資格があることをご存知の方はどれくらいいるだろうか。 そして、その存在を知っている方の中で、それが無料で取得できることまでご存知の方はいるだろうか。 今回は、そんなGoogle公式資格の話。 Googleが発行する公式資格は…

GoogleAnalyticsとRを使って重回帰分析で見込み顧客を発掘したかった

けどできなくて行き詰った、という話。 今回の記事は、僕が知識不足で悩んでいるというだけの話題で、これからGoogle AnalyticsとRを使って重回帰分析をするよ!というハウツー記事ではないので、そういう内容を期待して開いてくれた人は申し訳ないがブラウ…

RとPython今から始めるならどっち?プログラミング初心者目線で比較

ビッグデータ解析や機械学習といった、最近"アツい"分野で活躍するためにはもはや必須のスキルとされるプログラミング言語、R(アール)とPython(パイソン)。 マーケティング専攻の僕は、ゼミの活動でRを使っており、Rの勉強を始めてから大体1年半になる。 そ…

【一覧表】独立な2群の平均値差の検定(t検定)と信頼区間の推定の手順

なおも継続して勉強中の統計検定2級だが、ようやくその試験範囲の半分程度に達したかどうかというところまで来た。 半分終わった、と断定的な表現ができないのは、僕が公式参考書ではなく別の参考書と問題集を使っていて、微妙に範囲がズレているからだ。 で…

【最新版】初心者でもわかるVSCodeでPython(Anaconda)を始める方法

2日間かけて、Microsoft Visual Studio Code(VSCode)でPython3.7の開発環境を作ることに成功したので、 これからPythonの勉強を始めようとしているプログラミング知識ゼロの初心者の人たちとこの感動を共有するために、 VSCodeでPython3.7(最新版)をまともに…

ゼロから始めて2ヶ月でPythonマスターを目指そうと思う【CODEPREP】

最近ツイッターで知ったのだが、「CODEPREP」という有料のプログラミング学習サイトが、ビジネス上の理由でサービスを終了したらしい。 codeprep.jp が、サービスを続けてほしいという声が多かったために、9月末までサービスを無料解放しているというのだ。 …

【一覧表】確率モデルと標本分布の公式を覚えるための一覧表を作った

相変わらず統計検定2級合格のための勉強は続けており、進行度としては3割行ったか行かないかぐらいというところである。 9月末までの合格を目標にしているが、夏休みは他にもやらなければいけないことが山積みなので、間に合うかどうかは微妙なところだ。 今…

【文系向け】統計学の基本を数式なしで学べるオススメ入門書5冊

今回は、数学苦手なド文系だけど独学で統計学を勉強している僕が、数式なしで統計学の基礎を学び、素養を身に着けることができる統計学の読み物をご紹介したい。 統計学の理論や手法を理解して実際に複雑な統計解析ができるようになるのを目指すというよりは…

文系が統計を学ぶなら『心理統計学ワークブック』も必須の本だと思う

僕は文系だが統計学を専門としていて、統計学のバイブルとして『心理統計学の基礎』という本を愛読している。 どれぐらい愛読しているかというと、この一冊を紹介するだけのためにブログで記事を1本書くぐらいである。 今回はこの記事の続きなので、まだ読ん…

文系大学生だけど統計検定2級取れば就職・転職で有利と思って調べた

僕は文系の大学4年生だが、将来のいつか、転職してデータサイエンティストになりたいと考えている。 現在バイトとして働いていて、卒業後に就職が決まっている会社でも、一応統計データを扱う仕事をしている。 というか言ってしまえばアクセス解析で、「デー…

ツイッターの仕様変更でRによるデータ取得の時にエラーが出るらしい

ツイッターの仕様変更により、Rを使ってツイッターAPIからデータを取得する際にエラーが出ることがあるようだ。 ツイッターを使ったテキストマイニングができなくなってしまう。さあ困った。 目次 原因はコールバックURLのホワイトリスト登録必須化 access_t…

文系が統計学を勉強するなら『心理統計学の基礎』は必須の本だと思う

今回は、文系の僕が統計学を勉強する上でバイブルとして何度も何度も読み返している「必携」の書籍を紹介したい。 大前提として、この本を初めて読んだときの僕は、 文系(大学2年) 数学苦手 統計の知識ゼロ という三重苦状態だったことを覚えておいてもらう…

グーグルアナリティクス個人認定資格(GAIQ)合格しました

グーグルアナリティクス個人認定資格(GAIQ)を取得した。 ©Google GAIQとは何かというと、グーグルアナリティクスの知識を持っていることをグーグルが公式に認定してくれる資格のことである。 受験料は無料で、インターバルはあるが何回でも挑戦できる。 有効…

アナーキーアナリスト

僕がベンチャー企業でマーケティングの仕事をしていることは以前にも話した通りである。 luggagecarrier.hatenablog.com 大学での専門分野もマーケティングなので、その知識を活かした采配ということになるが、最近は少し違う仕事も任されている。 弊社で運…