Data Science Online Course

東大のデータサイエンティスト/未来のCMO育成講座の社会人向けオンラインコースです

 

本講座では、5年間で延べ約700名が受講し約160名の修了者を輩出した東京大学学生向けのデータサイエンス講座のエッセンスを凝縮し、完全自習可能なオンラインコースとして公開します。
第3期までの社会人向けコースでは募集人数をはるかに超える応募が殺到し、多大な反響をいただきました。

本コースは主に社会人技術者やマーケティング担当者、情報分野以外の研究者等を対象者と想定し設計されていますが、幅広い分野で役に立つ実践的なデータサイエンスを網羅的にカバーしているため、データサイエンスを身に付けたい幅広い層に活用いただけるものとなっています。

本公開講座は国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)の委託業務の一環として実施しています。

 


 

●コースの概要

 

●受講対象者

 

●特徴

●受講の仕組み

 


●カリキュラム

Chapter1: Numpy、Scipy、Pandas、Matplotlibの基礎
  1. Numpy、Scipy、Pandas、Matplotlibの基礎
  2. 総合問題
Chapter2 : 記述統計学と単回帰分析
  1. 記述統計学と単回帰分析
  2. 総合問題
Chapter3 : 確率と統計の基礎
  1. 確率・統計の基礎
  2. 総合問題
Chapter4 : Pythonによる科学計算の基礎(NumpyとScipy)
  1. 概要
  2. Numpy
  3. Scipy
  4. 総合問題
Chapter5 : Pandasを使ったデータ加工処理
  1. Pandas
  2. 欠損データと異常値の取り扱いの基礎
  3. 総合問題
Chapter6 : Matplotlibを使ったデータ可視化
  1. データの可視化
  2. 分析結果の見せ方を考えよう
  3. 総合問題
Chapter7 : データベースとSQLの基礎
  1. この章の概要
  2. SQLの基礎
  3. ビュー
  4. 総合問題
Chapter8 : データベースの応用(高度なSQL処理と高速化)
  1. この章の概要
  2. 高度なSQLの基礎
  3. ストアドプロシージャとストアドファンクション
  4. インデクシングとSQLの高速化
  5. その他
  6. 総合問題
Chapter9 : ドキュメント型DB(MongoDB)
  1. NoSQLとRDBMS
  2. MongoDBの基礎知識
  3. MongoDBの基本操作
  4. MongoDBのパフォーマンス向上
Chapter10 : 機械学習の基礎(教師あり学習)
  1. 機械学習の全体像
  2. 重回帰分析
  3. ロジスティック回帰分析
  4. 正則化、ラッソ回帰、リッジ回帰
  5. 決定木
  6. k-NN
  7. サポートベクターマシン
  8. 総合問題
Chapter11 : 機械学習の基礎(教師なし学習)
  1. クラスタリング(クラスター分析)
  2. 次元圧縮(主成分分析)
  3. バスケット分析とアソシエーションルール
  4. 総合問題
Chapter12 : モデルの検証方法とチューニング方法
  1. この章で学ぶこと
  2. 過学習の対処法とモデルチューニング方法
  3. 混同行列とROC曲線
  4. シミュレーションと計算統計学の基礎
  5. アンサンブル学習
  6. 総合問題
Chapter13 : データサイエンスティスト中級者への道
  1. この章の概要
  2. 深層学習を学ぶための準備
  3. Pythonの高速化
  4. Spark入門
  5. その他の数学的手法とエンジニアリングツール
  6. 総合問題
Chapter14 : 総合演習問題(最終課題)

 


●Credit