到達目標
本講義では、現代社会では多種多様で膨大なデータが生成され、情報を適切に分析する能力が求められることを背景として、データ操作・可視化・統計解析・機械学習の基礎を学び、実践的にデータを処理・分析できる力を身につける。
具体的には、プログラミング(Python)を用いて、データに対する処理・分析結果を論理的に解釈・説明できる事で、構築・使用したモデルやシステムを評価するなど、意思決定に利活用できる基本的なスキルを身につける。
ルーブリック
| 理想的な到達レベルの目安 | 標準的な到達レベルの目安 | 未到達レベルの目安 |
| Python操作 | データサイエンスで必要となるPythonのコードを十分に作成できる | データサイエンスで必要となるPythonのコードを作成できる | データサイエンスで必要となるPythonのコードを作成できない |
| データ処理・可視化 | 分析対象のデータごとに最適な処理・可視化を的確に実施できる | 分析対象のデータごとに最適な処理・可視化を実施できる | 分析対象のデータごとに最適な処理・可視化を実施できない |
| 分析結果の解釈・説明 | データに対する分析結果を論理的に解釈・説明できる | データに対する分析結果を解釈・説明できる | データに対する分析結果を解釈・説明できない |
学科の到達目標項目との関係
教育方法等
概要:
第1週の授業を除いて、毎授業で必ずコードを書くことで、データサイエンスを行うえで必要となるプログラミングの作成能力を身につける。
第5週までの前半の授業は、Pythonの基本文法から始まり、データ操作や可視化を実際に行う導入部分となる。第6週以降の授業では、t検定をはじめとする統計の基礎や回帰分析といった具体的なデータサイエンスの技法を学ぶ。また、第6週以降の授業では、単に分析を行うだけでなく、分析結果の論理的な解釈・説明能力まで併せて身につける。
授業の進め方・方法:
【授業の進め方】
本講義では、確率や検定等統計分野の数学的な「理論」を深掘りして学ぶといった授業形態では行わず、実務を想定して、Pythonを用いた「データの処理・可視化」を中心に学ぶ演習形式となる。
【評価方法】
レポート課題(100%)で評価する。
注意点:
本授業でのプログラミングではPythonを用いるが、第2週から第5週にかけて、データサイエンスで必要となる汎用的なコードを学ぶ期間があるため、Pythonが未経験であっても問題ない。しかしながら、C言語などの他のプログラミングの経験があれば望ましい。
授業の属性・履修上の区分
授業計画
|
|
週 |
授業内容 |
週ごとの到達目標 |
| 後期 |
| 3rdQ |
| 1週 |
データサイエンスとは |
データサイエンスの分野で求められるデータ活用の基本的な考え方や、本講義の進め方・構成を理解する。
|
| 2週 |
Pythonの基礎 |
データ操作に必要なPythonの基本文法(変数、リスト、辞書)を用いて簡単なプログラムが書ける。
|
| 3週 |
配列操作、数学計算 |
Numpyを用いた配列操作や、Scipyを用いた数学計算をPythonで実行できる。
|
| 4週 |
表計算 |
Pandasを用いたデータ読み込み、整形(欠損値やフィルタリング)、集計操作ができる。
|
| 5週 |
可視化 |
Matplotlibを用いてデータの特徴を可視化するグラフを作成できる。 可視化結果から簡単な分析を説明できる。
|
| 6週 |
平均値・中央値・最頻値、分散・標準偏差 |
基本統計量を計算し、データの分布や特徴を理解・説明できる。
|
| 7週 |
確率、正規分布、母集団 |
確率概念と正規分布を用いたデータのモデル化が理解できる。 母集団と標本の違いを説明できる。
|
| 8週 |
検定、帰無仮説・対立仮説、t検定 |
帰無仮説・対立仮説の考え方を理解したうえで、t検定の概念と手順を理解し、Pythonで実行して結果を解釈・説明できる。
|
| 4thQ |
| 9週 |
二項検定、カイ二乗検定 |
二項検定・カイ二乗検定の概念と手順を理解し、Pythonで実行して結果を解釈・説明できる。
|
| 10週 |
分散分析 |
分散分析(1要因・2要因、被験者内・被験者間)の概念と手順を理解し、Pythonで実行して結果を解釈・説明できる。
|
| 11週 |
相関 |
データ間の関係を表す相関の概念を理解し、Pythonで実行した結果として算出される相関係数等の結果を解釈・説明できる。
|
| 12週 |
単回帰分析 |
データ間の関係を表す回帰係数と定数項の概念を理解し、Pythonで実行した単回帰分析の結果を解釈・説明できる。
|
| 13週 |
教師あり学習(重回帰分析①) |
各変数の影響を表す偏回帰係数を中心に重回帰分析の概念と手順を理解し、Pythonで実行した結果を解釈・説明できる。
|
| 14週 |
教師あり学習(重回帰分析②) |
重回帰分析にダミー変数を加えて、Pythonで分析を行い、実行した結果を解釈・説明できる。
|
| 15週 |
教師なし学習(PCA・クラスタリング) |
主成分分析とクラスタリング(K-means法)をPythonで実行し、可視化された結果を解釈・説明できる。
|
| 16週 |
|
|
モデルコアカリキュラムの学習内容と到達目標
| 分類 | 分野 | 学習内容 | 学習内容の到達目標 | 到達レベル | 授業週 |
評価割合
| 課題 | 合計 |
| 総合評価割合 | 100 | 100 |
| 評価項目1 | 30 | 30 |
| 評価項目2 | 40 | 40 |
| 評価項目3 | 30 | 30 |