到達目標
① データの解析・マイニングについて、これらの各手法が説明でき、これらを適用してデータの関係性や傾向の把握、データの予測・判別、データのグルーピング、データからのパターン発見などができる。
② データの視覚化について、一般的な2軸チャートによる視覚化、散布図行列などによる多次元の視覚化、ネットワークによる関係性の視覚化などができる。
③ 非構造化データ処理について、テンソル分解とそれを応用した画像処理について説明でき、画像データの分解処理と復元処理に適用できる。
ルーブリック
| 理想的な到達レベルの目安 | 標準的な到達レベルの目安 | 未到達レベルの目安 |
データの解析・マイニング | これらの各手法がすべて説明でき、これらを適用してデータの関係性や傾向の把握、データの予測・判別、データのグルーピング、データからのパターン発見などが的確にできる。 | これらの各手法が説明でき、これらを適用してデータの関係性や傾向の把握、データの予測・判別、データのグルーピング、データからのパターン発見などができる。 | これらの各手法の一部しか説明できず、これらを適用してデータの関係性や傾向の把握、データの予測・判別、データのグルーピング、データからのパターン発見などができない。 |
データの視覚化 | 一般的な2軸チャートによる視覚化、散布図行列などによる多次元の視覚化、ネットワークによる関係性の視覚化などが的確にできる。 | 一般的な2軸チャートによる視覚化、散布図行列などによる多次元の視覚化、ネットワークによる関係性の視覚化などができる。 | 一般的な2軸チャートによる視覚化、散布図行列などによる多次元の視覚化、ネットワークによる関係性の視覚化などができない。 |
非構造化データ処理 | テンソル分解とそれを応用した画像処理についてすべて説明でき、画像データの分解処理と復元処理に的確に適用できる。 | テンソル分解とそれを応用した画像処理について説明でき、画像データの分解処理と復元処理に適用できる。 | テンソル分解とそれを応用した画像処理について一部しか説明できず、画像データの分解処理と復元処理に適用できない。 |
学科の到達目標項目との関係
教育方法等
概要:
現代社会においては、諸領域でたえず蓄積され続けている大規模なデータ(ビッグデータ)から知見を得て、新たな付加価値を見出すことが求められてきている。このようなデータを取り扱う分野はデータサイエンスと呼ばれ、この分野の実施者・研究者はデータサイエンティスト(DS)と呼ばれる。本授業では、データサイエンスにおけるデータの解析・マイニングに焦点を当て、それら各手法の基礎について説明し、専用のツールを活用してデータ解析を体験しながら各手法の理解を深めることにより、DSが身につけるべき基礎的なスキルを学習できる。
授業の進め方・方法:
講義の形式で進める。授業内容としては、データマイニングの基礎、各データマイニング手法の基礎および各手法のケーススタディ、データの視覚化、非構造化データ処理などについて説明していく。さらに、データマイニングツールとしてRを活用させ、本授業で説明されたこれらの授業内容の理解をさらに深めさせる。
注意点:
規定授業時数15
1単位あたり30時間程度の自学自習が求められます。
授業計画
|
|
週 |
授業内容 |
週ごとの到達目標 |
後期 |
3rdQ |
1週 |
ガイダンス・データマイニングとツール |
データマイニングの概要について説明できる。解析ツールの基本操作ができる。
|
2週 |
データの演算と行列演算・基本統計量 |
データの演算、行列演算などが説明でき、演算ができる。基本統計量について説明でき、計算できる。
|
3週 |
データの視覚化 |
データを視覚化するための基本的なグラフが作成できる。
|
4週 |
主成分分析 |
主成分分析(PCA)について説明できる。PCAの計算ができ、縮約されたデータから元のデータ構造の再現性が説明できる。
|
5週 |
因子分析 |
因子分析(FA)について説明できる。FAの計算ができ、データの関係性の把握、因子の解釈などができる。
|
6週 |
クラスター分析 |
クラスター分析について説明できる。クラスター分析の計算ができ、データのグルーピング、グループの特徴などについて分析できる。
|
7週 |
自己組織化マップ |
自己組織化マップ(SOM)について説明できる。SOMの計算ができ、パターンの分類およびパターンの特徴を分析できる。
|
8週 |
回帰分析 |
重回帰分析、ロジスティック回帰分析などについて説明できる。これら回帰分析の計算ができ、データの予測ができる。
|
4thQ |
9週 |
ツリーモデル |
決定木および回帰木について説明できる。これらモデルの計算ができ、データの判別・予測ができる。
|
10週 |
サポートベクターマシン |
サポートベクターマシン(SVM)について説明できる。SVMの計算ができ、データの判別・予測ができる。
|
11週 |
ニューラルネットワーク |
ニューラルネットワーク(NN)、深層学習の概要について説明できる。NNの計算ができ、データの分類ができる。
|
12週 |
ネットワーク分析 |
ネットワーク分析について説明できる。ネットワークを作成でき、ネットワークの統計量からデータの関係性を把握できる。
|
13週 |
アソシエーション分析 |
アソシエーション分析について説明できる。アソシエーション分析の計算ができ、データから頻出するパターンを抽出できる。
|
14週 |
高階テンソル・テンソル分解 |
高階テンソルおよび高次特異値分解(HOSVD)について説明できる。HOSVDの計算ができる。
|
15週 |
非構造化データ処理 |
HOSVDを利用した画像処理について説明できる。HOSVDにより画像データを分解することができ、復元精度を調整して画像が復元できる。
|
16週 |
多次元主成分分析 |
多次元主成分分析(MPCA)について説明できる。MPCAの計算ができ、データの特徴抽出および分類ができる。
|
モデルコアカリキュラムの学習内容と到達目標
分類 | 分野 | 学習内容 | 学習内容の到達目標 | 到達レベル | 授業週 |
評価割合
| 小テスト | レポート | データ分析手法の実装 | | | | 合計 |
総合評価割合 | 20 | 20 | 60 | 0 | 0 | 0 | 100 |
基礎的能力 | 20 | 0 | 0 | 0 | 0 | 0 | 20 |
専門的能力 | 0 | 20 | 60 | 0 | 0 | 0 | 80 |
分野横断的能力 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |