GCI オンライン (Global Consumer Intelligence Tutorial) は、東京大学工学部 松尾豊研究室とグローバル消費インテリジェンス寄附講座の学生のためのオンライン学習教材です。ウェブと人工知能を活かした研究を行うために必要な技能を身に付けることを目的としています。

GCI オンライン はいくつかのカリキュラムに分かれており、それぞれのレベルに合わせて取り組むことができます。そのため、プログラム未経験者であっても安心して取り組むことができます。高度な分析手法についても取り上げているため、プログラム経験者にとっても有用です。


必修カリキュラム

必修カリキュラムは、GCI の修了要件となるものです。プログラム初心者の状態から、企業との共同研究においてデータ分析を行うために必要な基本的な技能を修得することを目的としています。

⑴ GCI入門編:

CGI入門編は、GCI の受講要件となるオンライン学習教材です。入門編の課題をこなし、審査を通過することで GCI 受講生として認められます。プログラミング未経験者を対象に、基本的なコンピュータの取り扱いおよびプログラムの読み書きができるようになることを目指します。

キーワード UNIX、シェル、エディタ、Emacs、プログラム、Python

⑵ GCI基本編:

GCI基本編はプログラミング初心者を対象に、ウェブを用いたデータの取得→加工→出力の一連の流れができるようになるためにデータベースを理解し、ウエブから自在にデータを取得してくる事が出来るようになる事を目指します。

ウェブからデータを取得する方法として、ウェブサービスが公開している API を用いた方法や、ウェブサイトの更新情報を知らせてくれる RSS を用いた方法を紹介します。

キーワード データベース、MySQL、API

⑶ GCI応用編:

GCI の修了要件の最終チュートリアルです。学生はGCI応用編を完了し、審査を通過することで GCI 修了を認められます。基本編が完了し、ウェブとのデータの基本的なやり取りができるようになった学生を対象に、企業との共同研究に参加して戦力となるレベルまで引き上げることを目指します。

GCI基本編ではデータを取得し、データベースに保存する方法を学びましたが、GCI応用編では、それらのデータを解析する方法を学びます。特に、データ解析の主要な技術である「機械学習技術」と「自然言語処理技術」を学びます。次に、データの可視化の方法について Excel やネットワーク可視化ツールを使って学びます。最後に、研究成果を企業のアクションに結びつけるために、プレゼンテーションの際に気をつけるべきことについて述べます。

キーワード キーワード抽出、tfidf、クローリング、スクレイピング、教師なし学習、クラスタリング、教師あり学習、SVM、CGI、正規表現、xpath、Excel、ネットワーク、Gephi、networkx、プレゼンテーション、PowerPoint


実践カリキュラム

実践カリキュラムは、GCI 必修カリキュラムを終え、修了要件を満たした方に向けたカリキュラムです。より実践的な学習の場を通じ、必修カリキュラムで学んだ知識を生きた知識に昇華させていくことを目的とします。

⑷ GCI実践編:

GCI実践編は GCI応用編までを修了したGCI修了生のみが受講できる企業との共同研究プロジェクトです。データを扱う日本を代表する企業との共同プロジェクトの中で、企業が扱うデータを用い、これ迄応用編で学んだスキルを生かし、付加価値を付けられる場に参加することができます。

⑸ GCI発展編:

応用編より高度な分析を行うためのチュートリアルです。データから知識を抽出するための様々な手法を習得します。

⑹ GCIウェブサービス編:

自分でウェブサービスをつくる際に修了することが望ましいチュートリアルです。基本的なウェブサービスの構築方法、収益化、分析のための技能を習得します。

⑺ GCI論文編:

論文を書く際に修了することが望ましいチュートリアルです。学術コミュニティに貢献する論文を書くための技能を習得します。

それぞれのチュートリアルを修了すると、修了証が贈呈されます。
ぜひ研究室内外問わずみなさん取り組んでみてください。