機械学習準備編
統計 入門 (前編)

機械学習で頻繁に使われる統計の基礎知識や用語を学ぼう

初心者対象
受講人数 351名 | 学習期間目安 3時間 〜 3日
★★★★☆  4.0 (2件)

icon-check 受講期限:無制限 icon-check 受講料金:0円(無料)
icon-check 対象:初心者 icon-check 条件:会員登録

コース概要

  • 機械学習で頻繁に出てくる統計基礎や用語
  • 機械学習 vs 統計
  • ドットプロットとヒストグラム
  • 平均値・中央値・最頻値
  • 分散と標準偏差
  • 標本標準偏差
  • 外れ値と平均値・中央値

統計の基礎を学ぼう

極論にはなりますが、統計の知識がなくても機械学習を実装することは可能です。では、なぜ機械学習のために統計を学ぶのでしょうか?

その答えの一つとして、機械学習では大規模なデータの分析や処理を行う際に統計の基本的な用語が使われる為です。データを扱う際に「平均(Mean)」や「中央値(Median)』などは初歩的に出てきますし、さらには「標準偏差(Standard Deviation)」なども一般的に使われます。加えて、すでにNumpy入門コースでも取り上げましたが、データの相関性を表す指数「相関係数」なども統計の基礎的な知識の一つです。

上記のように機械学習の世界では統計の基礎用語が一般的に使われますので、統計の基本的な知識を事前に学んで多くことで、より深く機械学習を身につけることが可能です。

文系のエンジニアの方や、理系の方でも基礎的な統計の知識に不安がある方など、是非機械学習を本格的に勉強する前に本コースで統計の「復習」をしましょう。統計の基本的な知識があるだけで、機械学習のアルゴリズムへの理解やデータセットの前処理などがよりスムーズに理解できるようになります。

統計とは?

機械学習では統計の基本的な知識が使われているということはご理解頂けたかと思いますが、そもそも「統計」とはなんでしょうか?

統計には「記述統計」と「推測総計」の2つの異なる目的を持った種類があります。「記述統計」では、データの平均や散らばり度を計算して、データの示す傾向や性質を知ることを指します。対して「推測時計」では、データの一部分を分析することにより、全体を推測することを指します。

より噛み砕くと、例えば学校での中間テストの点数をA組とB組で比較したいと考えた場合、両方のクラスの全生徒の点数を一覧に出しても分かりづらくて比較ができません。そこで各クラスの「平均」をという指標を使うことにより、容易にデータを比較することが可能になります。これが「記述統計」の目的となります。

対して、「推測時計」の例も考えてみましょう。A組40名の各生徒の勉強時間とテストの点数結果を用いて、B組の生徒の勉強時間のみでテストの点数を推測するといったものが「推測統計」を指します。

本コース「機械学習のための統計入門」では、統計の初歩的な知識や用語を中心に説明していきます。機械学習をこれから学ぼうと考えている方で、統計の基本的な知識に不安がある方は、是非ご受講をお勧め致します。

Numpyを使って補講学習

本コースでは、原則としてプレゼンテーション資料を統計の基本的な知識を学んでいく流れとなります。加えて、補講学習(オプション)として、PythonおよびNumpyとMatplotlibを使用して、動画授業で学んだ統計の基礎知識を確認することも可能です。統計の基礎を覚えながら、Numpyとの紐付けを行うことで、より効率よく統計基礎の理解を得られます。チャプター2にて、Numpyを使う必要な環境構築の説明を行なっていますので、補講学習をご希望の方は是非合わせてPython+Numpy+Matplotlibの環境構築も行いましょう。

このコースの対象者
  • これから機械学習を学ぼうと考えている方
  • 既に機械学習を勉強しているが統計の基本に不安のある方

注意事項

本コースは「統計学」の基礎を学ぶためのコースではございません。あくまで機械学習で頻繁に使われる統計の基本的な用語や概念の説明を行なっています。統計を学びたいとお考えの方に向けたコースではございませんので、ご注意くださいませ。

受講資格

icon-check 特に事前知識やスキルは必要ありません

コース詳細

機械学習準備編 統計 入門 (前編)
 icon-play-circle-o Chapter 1 コース概要と紹介 04:08
 icon-pencil Chapter 2 Numpy & Matplotlib 環境構築 03:47
 icon-play-circle-o Chapter 3 機械学習 vs 統計 04:03
 icon-play-circle-o Chapter 4 ドットプロットとヒストグラム 10:40
 icon-play-circle-o Chapter 5 平均値・中央値・最頻値 10:24
 icon-play-circle-o Chapter 6 分散と標準偏差 23:19
 icon-play-circle-o Chapter 7 標本標準偏差 20:48
 icon-play-circle-o Chapter 8 外れ値と平均値/中央値 09:07

レビュー

icon-user 機械学習の書籍などを数冊読んだんですが、いまいち理解ができない言葉が多数ありました。統計を今まで一度も学んだことがなかったので、非常に助かりました。内容は初心者向けで、とても簡単でした。

icon-check-circle-o 講師からの返答
フィードバックありがとうございます!引き続き良質なコンテンツ制作を心がけます。

icon-user 標準偏差やメジアンなど、マシーンラーニングを自己学習していると前提として普通に使われている言葉なので、このように統計の初歩的な内容をまとめたコースは非常に役に立ちました。これから機械学習を始めようという方に特におすすめ!

icon-check-circle-o 講師からの返答
フィードバックありがとうございます!現在、統計コースの続編も制作していますので、また近日中に公開致します!

講師紹介

codexa ロゴ

本コース「Pandas 入門」はcodexa(コデクサ)の機械学習エンジニアチームにて監修・作成を行いました。機械学習チームの最大の特徴は様々なレベルの機械学習エンジニアが共同でコースの作成を行っています。人工知能先進国のアメリカで機械学習エンジニアとして活躍してきたエンジニアもいれば、日本でPHPを中心としてWebアプリケーション開発から一から機械学習を学んだエンジニアも所属しています。機械学習上級者が一方的に教えるコンテンツよりも、機械学習初心者が主体となり、初心者「が」理解しやすく、学習が継続的に行えるようなコースを提供することを目的としています。「初心者の、初心者による、初心者のための機械学習」をモットーにチーム一丸となってコンテンツを制作しています。

このコースを取っている方は次のコースも取っています