データサイエンス活用法 ビジネス応用のための統計・機械学習入門

講座の趣旨

  • 統計分析や機械学習によってどのようなことができるのか、データを活用する際に注意すべきことや準備すべきことは何かを具体的に学びます。
  • 数学をなるべく使わずに、例題や実例を通して具体的な流れを理解します。

到達目標

  • AIやデータを活用して何ができるのかについて、ひととおり具体的に理解している。
  • AIやデータを活用するプロジェクトについて、具体的な発案・企画ができる。
  • 社内・社外のデータサイエンス技術者に発注して、AIやデータを活用するプロジェクトを推進できる。
  • データサイエンス技術者が出した分析結果や予測結果を適切に理解したり評価したりして、業務改善や新規ビジネスの創出につなげることができる。

数学レベル

  • 高校までの文系数学の初歩(文字式・関数など)について、あらかじめある程度知っていることが望ましいです。

カリキュラム

  1. 統計分析「データによって何が分かるのかを理解する」
    • 統計分析によってできること
    • 図表・可視化による整理(度数分布表、ヒストグラム)
    • 特性量による整理①(代表値:平均値、中央値、最頻値)
    • 特性量による整理②(データの広がり:分散、標準偏差)
    • 相関(散布図、相関係数、相関と因果)
    • データの散らばり(確率変数、さまざまなデータの分布)
    • 母集団と標本、標本の適切な抽出方法
    • 一部のデータから全体像を推測する方法(点推定、区間推定)
  2. さまざまな可視化方法「大量の調査項目を整理して、見やすく図示する」
    • 次元を削減し可視化する方法(主成分分析)
    • 背後に潜む要因を探り出し可視化する方法(因子分析)
    • 集計結果を見やすく表示する方法(コレスポンデンス分析)
  3. 教師なし学習(クラスタリング)「似ている性質のものをグループに分ける」
    • データを扱いやすい形式に整える(欠損値の扱い、日付の扱いなど)
    • クラスタリングの概念
    • 実例
    • 非階層的クラスタリング(K-means法)
    • 階層的クラスタリング
  4. 教師あり学習(判別)「AかBかを予測したり、判断したりする」
    • 判別問題の概念
    • 実例
    • 判別問題の評価方法:F値、正解率
    • さまざまな判別手法:決定木、ランダムフォレスト、SVM
  5. 教師あり学習(回帰)「(売上などの)値を予測する」
    • 回帰問題の概念
    • 実例
    • 回帰問題の評価方法
    • さまざまな回帰手法:決定木、ランダムフォレスト、重回帰分析(標準偏回帰係数)
    • 数値データ以外のデータを用いて予測する方法:数量化1類
  6. ニューラルネット・深層学習(ディープラーニング)「画像などのデータを柔軟に処理する」
    • ニューラルネットワーク
    • 深層学習の概念
    • ニューラルネットワーク
    • 深層学習による判別と回帰
    • 深層学習による画像認識、言語処理
  7. 選択や制御を最適化する方法
    • 強化学習「AIが自ら試行錯誤することで、より良い選択肢を見つけ出す」
    • 数理最適化「現実世界の条件を数式化し、適切な解法で効率よく解く」

時間・料金

対面・オンラインライブ
受講期間単科講座料金(税込)
3日(9時間)¥142,560

申込

※申し込みは各開講日の8営業日前までとなりますのでご注意ください

開講日 講義形態
22/01/18 オンラインライブ 申込

講義スケジュール

★講義スケジュールはこちら。
講師からのメッセージ
  • データサイエンス活用法について(山肩 洋子 准教授)
    データサイエンスは現実世界の問題をコンピュータが解くことのできる問題に置き換え、よい答えを導くための一連の手順です。これをどのように行っているのかを事例を通じて具体的に学んでいただきます。(山肩 洋子 准教授)
    山肩 洋子 准教授