Data Science Online Course

東大のデータサイエンティスト/未来のCMO育成講座が一般向けオンラインコースになりました

 

本GCIの育成カリキュラムとして東京大学学生向けに設置され、3年間で延べ300名以上が受講し約80名の修了者を輩出したデーサイエンス講座のエッセンスを凝縮し、完全自習可能なオンラインコースとして公開します。

本コースは主に社会人技術者やマーケティング担当者、情報分野以外の研究者等を対象者と想定し設計されていますが、幅広い分野で役に立つ実践的なデータサイエンスを網羅的にカバーしているため、データサイエンスを身に付けたい幅広い層に活用いただけるものとなっています。

今回は初回として60名限定での無料公開を行います。コースへの参加を通して本気でスキルアップしたい方、またコース自体へのフィードバック等へご協力いただける方を優先的に受け入れます。

* 東大学生向けGCI 第4期 講座案内はこちら

本公開講座は国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)の委託業務の一環として実施しています。


 

●コースの概要

 

●受講対象者

  • こんな人にオススメ
    • 高度なデータ解析でインパクトを出したいビジネス/マーケティング分野の専門家
    • 機械学習技術を身に着けたいソフトウェアエンジニア
    • データを扱うスキルの基礎を網羅的に学びたい非情報系の研究者
    • ディープラーニングを学ぶための前提スキルを一気に身につけたい方
    • 何を学んだら良いか迷っている全ての学生の方
  • 受講に必要なスキル
    • Pythonで基礎的なコーディングができる
    • 大学の初等数学を理解している

 

●特徴

  • Practice > Theory
    • 本コースは、一般的な教科書とは異なるアプローチを取り、理論よりも実際の問題への応用に主眼を置き、手を動かしながら実装力をつけることを目指した設計となっています
    • 修了レベルにある人が1セクション4時間程度で完了できるボリュームとなっており、学習者のレベルにより習得にかかる時間が変動する設計となっています
  • End-to-end
    • 全11Chapterを通し、データのセットアップから解析、可視化やモデルのアウトプットまで、一気通貫でできることを目指します
    • 全体を通じて、分析の「流れ」を掴むことを意識しています
  • iLect
    • 本コースは、「Practice makes perfect」の考えに基き、演習を通じての技術習得を目指します。演習では、ブラウザ上からアクセス可能なフルスタックのLinux+Python開発環境を提供する「ilect.net」を利用し、本題のみに集中して学習できるように講義を設計しています(ilectの詳細はこちら)。

●受講の仕組み

 


●カリキュラム

Chapter1 : データサイエンティスト講座概要とPythonの基礎
  1. はじめに
  2. データ分析で使うPythonの基礎とその仲間たち
  3. 総合演習問題
Chapter2 : 確率統計の基礎
  1. 記述統計学
  2. 確率の基礎
  3. 単回帰分析
  4. 総合問題
Chapter3 : Pythonによる科学計算の基礎(NumpyとScipy)
  1. 概要
  2. Numpy
  3. Scipy
  4. 総合問題
Chapter4 : データサイエンスにおけるデータ加工処理と可視化(PandasとMatplotlib)
  1. Pandas
  2. データの可視化
  3. 欠損データと異常値の取り扱い基礎
  4. 総合問題
Chapter5 : データベース基礎
  1. この章の概要
  2.  SQLの基礎
  3. ビュー
  4. 総合問題
Chapter6 : データベースの応用(高度なSQL処理と高速化)
  1. この章の概要
  2. 高度なSQLの処理
  3. ストアドプロシージャとスドアドファンクション
  4. インデクシングとSQLの高速化
  5. その他
  6. Pythonとの連携
  7. 総合問題
Chapter7 : データベース応用(Key-Value Storage)
  1. NoSQLとRDBMS
  2. MongoDBの基礎知識
  3. MongoDBの基本操作
  4. MongoDBのパフォーマンス向上
  5. Pythonドライバ
  6. 総合問題
Chapter8 : 機械学習の基礎
  1. 機械学習の全体像
  2. 教師あり学習
  3. 教師なし学習
  4. 総合問題
Chapter9 : モデルの検証方法とチューニング方法
  1. この章で学ぶこと
  2. 過学習の対処法とモデルチューニング方法
  3. 混合行列とROC曲線
  4. シミュレーションと計算統計学の基礎
  5. アンサンブル学習
  6. 総合問題
Chapter10 : データサイエンティスト中級者への道
  1. この章の概要
  2. 深層学習を学ぶための準備
  3. Pythonの高速化
  4. Spark入門
  5. 他の手法とツール群
  6. 総合問題
Chapter11 : 総合演習問題


●Credit