荷物持ちでも構わない

書きたいことを書きたいときに書きたいだけ書く、ルール無用雑記ブログ。

MENU

データ分析

文系だけどデータサイエンティストを目指したい!! 統計学・データ分析について勉強したことの記録。

Python初心者だけど実務に活かしたい!PyQで勉強始めました

今まで、Progate、CODEPREP、AI Academyと数々のオンラインプログラミング学習サービスを渡り歩いてきた僕だが、このたび新しく「PyQ(パイキュー)」というサービスにも手を出してみた。 新しく内定先でアルバイトを始めたことで、より一層Pythonの必要性を感…

実務で必要な統計学・データ分析・プログラミングの知識はどこまでか

データサイエンティスト・データアナリスト・データエンジニアと呼ばれる仕事に就いている人達は、実際のところ、統計学やデータ分析、プログラミングの知識をどれだけ要求されるのか。 実務で必要になるこれらの知識レベルは、当然、業界や企業によって異な…

ド文系だけど統計学の基礎が固まってきたので線形代数学始めました

今月の上旬に統計検定2級を受験して、60点以上で合格のところを79点というなかなかいい成績で合格したので、一応統計学の基礎知識は固まっていると判断して、次のステップに進むことにした。 次のステップとは、具体的に言うと機械学習である。 僕はデータサ…

CBT方式で統計検定2級合格!通常試験との違い、勉強時間と勉強方法

統計検定2級、ついに合格したぞー!!! ということで、本日11月4日、ついに、ようやく、CBT方式で統計検定2級に合格した。 勉強を始めたのが今年の7月上旬頃なので、4ヶ月もかかってしまった。 長かった……。 というわけで、この度統計検定2級に合格したので…

明日CBT方式で統計検定2級を受験してきます

タイトル通りなので、今日はちょっと手短に。 明日、CBT方式で統計検定2級を受験してきます。 当初の予定では9月末までに合格を目指していたのが、10月中旬まで、10月末まで、とどんどんずれていき、最終的に11月まで食い込んでしまった。 過去問は、2015~2…

ビジネスで使える統計講座(統計検定2級対応)の第2回を受講してきた

今日は、株式会社アゴラ・ステーション主催、SAS Institute Japan株式会社協賛の、「ビジネスで使える統計講座(統計検定2級対応)」の第2回を受講してきた。 先々週に第1回を受講して、2週間ぶりの受講となる。 ↓第1回を受講したときの記事はこちら↓ www.mess…

ビジネスで使える統計講座(統計検定2級対応)の第1回を受講してきた

今日はタイトル通り、「ビジネスで使える統計講座」という、統計検定2級に対応した内容の統計学の講座を受講してきた。 全3回あって、今日はその初回だったのだが、統計検定2級合格を目指している者としていろいろ学ぶことも多かったので、初回の感想をつら…

『データサイエンス「超」入門』の感想|データを疑う力を養う本

データサイエンティストで作家でもある、株式会社デコムの松本健太郎さん(@matsuken0716)と、何の縁でかツイッターで相互フォローさせていただいているのだが、 その松本健太郎さんが、9月28日に『データサイエンス「超」入門 嘘をウソと見抜けなければ、デ…

『誤解だらけの人工知能』の感想|来たるAI時代を文系が生き抜く方法

『誤解だらけの人工知能~ディープラーニングの限界と可能性~』という本を読んで、いろいろ思うところがあったので、書評というほどしっかりした文は書けないけれども、読書感想文程度のものを雑記として書いてみようと思う。 誤解だらけの人工知能 ディー…

統計検定2級の進捗報告と実践している勉強方法・参考書まとめ

7月初旬に統計検定2級の受験を決意してから、早いもので2ヶ月半ほど過ぎた。 そのときに書いた統計検定2級についての記事が、「統計検定 就職」のようなそこそこ検索ボリュームのあるいくつかの検索キーワードで掲載順位1位を取れるようになっていて、そこか…

KHCoderのベイズ学習でツイートの属性を機能的/情緒的に分類した

以前、RとKHCoderを使ってSHARP公式ツイッターのツイートをクラスタリングする記事を書いた。 このときは「教師なし学習」による分類だったので、自分の思い通りのクラスターを作ることができなかったが、今回は、単純ベイズ分類器(ナイーブベイズフィルター…

RとKHCoderを使ってSHARP公式のツイートをテキストマイニングする

一昨日、昨日と、テキストマイニングについての記事を書いてきたが、 今日は、データ取得→加工→形態素解析→クラスタリング という一連の流れをやってみようと思う。 使うツールはRとKHCoderとMeCab。 一昨日と昨日の記事を読んでいないという人は、先にそっ…

Excelで正規表現検索・置換ができるアドインでデータ加工を効率化

昨日の記事(KHCoderを使って文章の形態素解析とクラスタリングをやってみた)では、KHCoderというフリーソフトを使って、各新聞社の社説を形態素解析してクラスタリングするという、テキストマイニングの一連の流れをやってみた。 僕はテキストマイニングにつ…

KHCoderを使って文章の形態素解析とクラスタリングをやってみた

卒論の研究のためにテキストマイニングをマスターする必要があったので、今日はそのための勉強をしていた。 とりあえずタイトルの通り、文章を形態素解析してそれを元にクラスタリングするところまではできたので、その方法をまとめて記事にしようと思う。 …

【一覧表】対応のある2群の平均値差の検定(t検定)と信頼区間の推定

相変わらず鋭意勉強中の統計検定2級より、前回に引き続き、今回も平均値差の検定(t検定)と信頼区間の推定の話。 前回から間が空きすぎて前回っていつだよ状態だが、前回は独立した2群の平均値差の検定と信頼区間の推定をするための手順と公式を一覧表でまと…

RでGoogleAnalyticsのAPIを使って重回帰分析でCVRを予測してみた

先日、グーグルアナリティクスとRを使ってコンバージョン率(CVR)の高い見込み顧客を発掘する重回帰モデルを作ろうとした結果、グーグルアナリティクスの仕様上それが不可能だと知って断念した、という記事を書いた。 今回は、グーグルアナリティクスのAPIか…

GoogleAnalyticsとRを使って重回帰分析で見込み顧客を発掘したかった

けどできなくて行き詰った、という話。 今回の記事は、僕が知識不足で悩んでいるというだけの話題で、これからGoogle AnalyticsとRを使って重回帰分析をするよ!というハウツー記事ではないので、そういう内容を期待して開いてくれた人は申し訳ないがブラウ…

RとPython今から始めるならどっち?プログラミング初心者目線で比較

ビッグデータ解析や機械学習といった、最近"アツい"分野で活躍するためにはもはや必須のスキルとされるプログラミング言語、R(アール)とPython(パイソン)。 マーケティング専攻の僕は、ゼミの活動でRを使っており、Rの勉強を始めてから大体1年半になる。 そ…

【一覧表】独立な2群の平均値差の検定(t検定)と信頼区間の推定の手順

なおも継続して勉強中の統計検定2級だが、ようやくその試験範囲の半分程度に達したかどうかというところまで来た。 半分終わった、と断定的な表現ができないのは、僕が公式参考書ではなく別の参考書と問題集を使っていて、微妙に範囲がズレているからだ。 で…

【最新版】初心者でもわかるVSCodeでPython(Anaconda)を始める方法

2日間かけて、Microsoft Visual Studio Code(VSCode)でPython3.7の開発環境を作ることに成功したので、 これからPythonの勉強を始めようとしているプログラミング知識ゼロの初心者の人たちとこの感動を共有するために、 VSCodeでPython3.7(最新版)をまともに…

【一覧表】確率モデルと標本分布の公式を覚えるための一覧表を作った

相変わらず統計検定2級合格のための勉強は続けており、進行度としては3割行ったか行かないかぐらいというところである。 9月末までの合格を目標にしているが、夏休みは他にもやらなければいけないことが山積みなので、間に合うかどうかは微妙なところだ。 今…

【文系向け】統計学の基本を数式なしで学べるオススメ入門書5冊

今回は、数学苦手なド文系だけど独学で統計学を勉強している僕が、数式なしで統計学の基礎を学び、素養を身に着けることができる統計学の読み物をご紹介したい。 統計学の理論や手法を理解して実際に複雑な統計解析ができるようになるのを目指すというよりは…

文系が統計を学ぶなら『心理統計学ワークブック』も必須の本だと思う

僕は文系だが統計学を専門としていて、統計学のバイブルとして『心理統計学の基礎』という本を愛読している。 どれぐらい愛読しているかというと、この一冊を紹介するだけのためにブログで記事を1本書くぐらいである。 今回はこの記事の続きなので、まだ読ん…

文系大学生だけど統計検定2級取れば就職・転職で有利と思って調べた

※11月4日追記 CBT方式で無事一発合格しました。 www.messyer813.com 僕は文系の大学4年生だが、将来のいつか、転職してデータサイエンティストになりたいと考えている。 現在バイトとして働いていて、卒業後に就職が決まっている会社でも、一応統計データを…

文系が統計学を勉強するなら『心理統計学の基礎』は必須の本だと思う

今回は、文系の僕が統計学を勉強する上でバイブルとして何度も何度も読み返している「必携」の書籍を紹介したい。 大前提として、この本を初めて読んだときの僕は、 文系(大学2年) 数学苦手 統計の知識ゼロ という三重苦状態だったことを覚えておいてもらう…