第2期 Data Science Online Course

東大のデータサイエンティスト/未来のCMO育成講座の社会人向けオンラインコースです

 

本GCIの育成カリキュラムとして東京大学学生向けに設置され、3年間で延べ300名以上が受講し約80名の修了者を輩出したデーサイエンス講座のエッセンスを凝縮し、完全自習可能なオンラインコースとして公開します。
前回の第1期の社会人向けコースでは300人を超える応募が殺到し、多大な反響をいただきました。

本コースは主に社会人技術者やマーケティング担当者、情報分野以外の研究者等を対象者と想定し設計されていますが、幅広い分野で役に立つ実践的なデータサイエンスを網羅的にカバーしているため、データサイエンスを身に付けたい幅広い層に活用いただけるものとなっています。

前回60名限定だったところ、今回は人数を増やして120名限定での無料公開を行います。コースへの参加を通して本気でスキルアップしたい方、またコース自体へのフィードバック等へご協力いただける方を優先的に受け入れます。
* 応募はこちら
* 学生は対象外です(社会人学生は対象です)

 


 

●コースの概要

 

●受講対象者

 

●特徴

●受講の仕組み

●日程


●カリキュラム

Chapter1 : データサイエンティスト講座概要とPythonの基礎
  1. はじめに
  2. Pythonの基礎
  3. 総合問題
Chapter2 : Numpy、Scipy、Pandas、Matplotlibの基礎
  1. Numpy、Scipy、Pandas、Matplotlibの基礎
  2. 総合問題
Chapter3 : 記述統計学と単回帰分析
  1. 記述統計学と単回帰分析
  2. 総合問題
Chapter4 : 確率と統計の基礎
  1. 確率・統計の基礎
  2. 総合問題
Chapter5 : Pythonによる科学計算の基礎(NumpyとScipy)
  1. 概要
  2. Numpy
  3. Scipy
  4. 総合問題
Chapter6 : Pandasを使ったデータ加工処理
  1. Pandas
  2. 欠損データと異常値の取り扱いの基礎
  3. 総合問題
Chapter7 : Matplotlibを使ったデータ可視化
  1. データの可視化
  2. 分析結果の見せ方を考えよう
  3. 総合問題
Chapter8 : データベースとSQLの基礎
  1. この章の概要
  2. SQLの基礎
  3. ビュー
  4. 総合問題
Chapter9 : データベースの応用(高度なSQL処理と高速化)
  1. この章の概要
  2. 高度なSQLの基礎
  3. ストアドプロシージャとストアドファンクション
  4. インデクシングとSQLの高速化
  5. その他
  6. 総合問題
Chapter10 : ドキュメント型DB(MongoDB)
  1. NoSQLとRDBMS
  2. MongoDBの基礎知識
  3. MongoDBの基本操作
  4. MongoDBのパフォーマンス向上
Chapter11 : 機械学習の基礎(教師あり学習)
  1. 機械学習の全体像
  2. 重回帰分析
  3. ロジスティック回帰分析
  4. 正則化、ラッソ回帰、リッジ回帰
  5. 決定木
  6. k-NN
  7. サポートベクターマシン
  8. 総合問題
Chapter12 : 機械学習の基礎(教師なし学習)
  1. クラスタリング(クラスター分析)
  2. 次元圧縮(主成分分析)
  3. バスケット分析とアソシエーションルール
  4. 総合問題
Chapter13 : モデルの検証方法とチューニング方法
  1. この章で学ぶこと
  2. 過学習の対処法とモデルチューニング方法
  3. 混同行列とROC曲線
  4. シミュレーションと計算統計学の基礎
  5. アンサンブル学習
  6. 総合問題
Chapter14 : データサイエンスティスト中級者への道
  1. この章の概要
  2. 深層学習を学ぶための準備
  3. Pythonの高速化
  4. Spark入門
  5. その他の数学的手法とエンジニアリングツール
  6. 総合問題
Chapter15 : 総合演習問題

 


●Credit