Data Science Online Course
4期の募集は終了しました.たくさんのご応募有難うございました。
応募いただいた皆様へ
この度はお申し込みを頂きありがとうございました。
予想を超える応募があったため、厳正な審査にて第一回の受講者を選考させて頂きました。
残念ながら今回ご参加頂けなかった応募者の皆様へは、次回以降の公開時に再度ご連絡いたしますので、引き続き何卒よろしくお願いいたします。
応募いただいた皆様へ
この度はお申し込みを頂きありがとうございました。
予想を超える応募があったため、厳正な審査にて第一回の受講者を選考させて頂きました。
残念ながら今回ご参加頂けなかった応募者の皆様へは、次回以降の公開時に再度ご連絡いたしますので、引き続き何卒よろしくお願いいたします。
第二回募集の具体時期は未定ですが、順次拡大公開を予定しております
東大のデータサイエンティスト/未来のCMO育成講座が一般向けオンラインコースになりました
本GCIの育成カリキュラムとして東京大学学生向けに設置され、3年間で延べ300名以上が受講し約80名の修了者を輩出したデーサイエンス講座のエッセンスを凝縮し、完全自習可能なオンラインコースとして公開します。
本コースは主に社会人技術者やマーケティング担当者、情報分野以外の研究者等を対象者と想定し設計されていますが、幅広い分野で役に立つ実践的なデータサイエンスを網羅的にカバーしているため、データサイエンスを身に付けたい幅広い層に活用いただけるものとなっています。
今回は初回として60名限定での無料公開を行います。コースへの参加を通して本気でスキルアップしたい方、またコース自体へのフィードバック等へご協力いただける方を優先的に受け入れます。
* 東大学生向けGCI 第4期 講座案内はこちら
本公開講座は国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)の委託業務の一環として実施しています。
●コースの概要
- 大量のデータを自由自在に解析・分析し、隠れた関係性を発見する。そんなスキルを身につけた「データサイエンティスト」に対する需要は、工学分野だけならず、医療・経済・経営・ライフサイエンスなど非常に多くの分野で高まる一方です。
- 本コースでは、あらゆる分野で武器になるデータの解析・分析スキルのコアとなる機械学習およびビッグデータを扱う技術、分析結果を効果的に可視化する技術の基盤を網羅的に身につけ、一人前のデータサイエンティストとして活躍する入り口に立つことを目指します。
●受講対象者
- こんな人にオススメ
- 高度なデータ解析でインパクトを出したいビジネス/マーケティング分野の専門家
- 機械学習技術を身に着けたいソフトウェアエンジニア
- データを扱うスキルの基礎を網羅的に学びたい非情報系の研究者
- ディープラーニングを学ぶための前提スキルを一気に身につけたい方
- 何を学んだら良いか迷っている全ての学生の方
- 受講に必要なスキル
- Pythonで基礎的なコーディングができる
- 大学の初等数学を理解している
●特徴
- Practice > Theory
- 本コースは、一般的な教科書とは異なるアプローチを取り、理論よりも実際の問題への応用に主眼を置き、手を動かしながら実装力をつけることを目指した設計となっています
- 修了レベルにある人が1セクション4時間程度で完了できるボリュームとなっており、学習者のレベルにより習得にかかる時間が変動する設計となっています
- End-to-end
- 全11Chapterを通し、データのセットアップから解析、可視化やモデルのアウトプットまで、一気通貫でできることを目指します
- 全体を通じて、分析の「流れ」を掴むことを意識しています
- iLect
- 本コースは、「Practice makes perfect」の考えに基き、演習を通じての技術習得を目指します。演習では、ブラウザ上からアクセス可能なフルスタックのLinux+Python開発環境を提供する「ilect.net」を利用し、本題のみに集中して学習できるように講義を設計しています(ilectの詳細はこちら)。
●受講の仕組み
- 期間
- 本コースはオンラインコースですが、定められた期間にて課題をクリアし修了を目指すコースとなります
- 全10週間、毎週1Chapterずつ順次公開し、1Chapter-1週間を目安に学習を進めていきます
- 4週以上稼働がないアカウントは停止されます
- 修了証
- 全Chapterで課題をクリアした方には講座修了証を発行します
- 修了者へのベネフィット
- 修了者にクローズドなコミュニティを作り、様々な機会をご案内してきます
- データサイエンス関連のイベント・勉強会や研究プロジェクトへの参加
●カリキュラム
Chapter1 : データサイエンティスト講座概要とPythonの基礎
- はじめに
- データ分析で使うPythonの基礎とその仲間たち
- 総合演習問題
Chapter2 : 確率統計の基礎
- 記述統計学
- 確率の基礎
- 単回帰分析
- 総合問題
Chapter3 : Pythonによる科学計算の基礎(NumpyとScipy)
- 概要
- Numpy
- Scipy
- 総合問題
Chapter4 : データサイエンスにおけるデータ加工処理と可視化(PandasとMatplotlib)
- Pandas
- データの可視化
- 欠損データと異常値の取り扱い基礎
- 総合問題
Chapter5 : データベース基礎
- この章の概要
- SQLの基礎
- ビュー
- 総合問題
Chapter6 : データベースの応用(高度なSQL処理と高速化)
- この章の概要
- 高度なSQLの処理
- ストアドプロシージャとスドアドファンクション
- インデクシングとSQLの高速化
- その他
- Pythonとの連携
- 総合問題
Chapter7 : データベース応用(Key-Value Storage)
- NoSQLとRDBMS
- MongoDBの基礎知識
- MongoDBの基本操作
- MongoDBのパフォーマンス向上
- Pythonドライバ
- 総合問題
Chapter8 : 機械学習の基礎
- 機械学習の全体像
- 教師あり学習
- 教師なし学習
- 総合問題
Chapter9 : モデルの検証方法とチューニング方法
- この章で学ぶこと
- 過学習の対処法とモデルチューニング方法
- 混合行列とROC曲線
- シミュレーションと計算統計学の基礎
- アンサンブル学習
- 総合問題
Chapter10 : データサイエンティスト中級者への道
- この章の概要
- 深層学習を学ぶための準備
- Pythonの高速化
- Spark入門
- 他の手法とツール群
- 総合問題
Chapter11 : 総合演習問題
●Credit
- データサイエンス エキスパート: 塚本邦尊(つかもとくにたか) / 熊本県出身。大学と大学院で確率論・確率解析を専攻後、SI企業で金融システムを開発。その後、広告代理店、マーケティング、コンサル企業にて、色々なデータ分析の業務に携わる。現在は金融機関のクオンツ部にて、ビッグデータの分析環境構築から分析を担当。
- 東京大学工学系研究科TMI グローバル消費インテリジェンス寄付講座 松尾研究室
- powered by iLect
受講申込みは締め切りました
本コースは社会人一般を対象にしています
本コースは社会人一般を対象にしています