データサイエンス(令和8年度開講予定)

科目基礎情報

学校 木更津工業高等専門学校 開講年度 令和07年度 (2025年度)
授業科目 データサイエンス(令和8年度開講予定)
科目番号 2025T0591 科目区分 専門 / 選択
授業形態 演習 単位の種別と単位数 履修単位: 1
開設学科 特別学修 対象学年 3
開設期 後期 週時間数 2
教科書/教材 なし
担当教員 一葉 修平

到達目標

本講義では、現代社会では多種多様で膨大なデータが生成され、情報を適切に分析する能力が求められることを背景として、データ操作・可視化・統計解析・機械学習の基礎を学び、実践的にデータを処理・分析できる力を身につける。
具体的には、プログラミング(Python)を用いて、データに対する処理・分析結果を論理的に解釈・説明できる事で、構築・使用したモデルやシステムを評価するなど、意思決定に利活用できる基本的なスキルを身につける。

ルーブリック

理想的な到達レベルの目安標準的な到達レベルの目安未到達レベルの目安
Python操作データサイエンスで必要となるPythonのコードを十分に作成できるデータサイエンスで必要となるPythonのコードを作成できるデータサイエンスで必要となるPythonのコードを作成できない
データ処理・可視化分析対象のデータごとに最適な処理・可視化を的確に実施できる分析対象のデータごとに最適な処理・可視化を実施できる分析対象のデータごとに最適な処理・可視化を実施できない
分析結果の解釈・説明データに対する分析結果を論理的に解釈・説明できるデータに対する分析結果を解釈・説明できるデータに対する分析結果を解釈・説明できない

学科の到達目標項目との関係

教育方法等

概要:
第1週の授業を除いて、毎授業で必ずコードを書くことで、データサイエンスを行うえで必要となるプログラミングの作成能力を身につける。
第5週までの前半の授業は、Pythonの基本文法から始まり、データ操作や可視化を実際に行う導入部分となる。第6週以降の授業では、t検定をはじめとする統計の基礎や回帰分析といった具体的なデータサイエンスの技法を学ぶ。また、第6週以降の授業では、単に分析を行うだけでなく、分析結果の論理的な解釈・説明能力まで併せて身につける。
授業の進め方・方法:
【授業の進め方】
本講義では、確率や検定等統計分野の数学的な「理論」を深掘りして学ぶといった授業形態では行わず、実務を想定して、Pythonを用いた「データの処理・可視化」を中心に学ぶ演習形式となる。
【評価方法】
レポート課題(100%)で評価する。
注意点:
本授業でのプログラミングではPythonを用いるが、第2週から第5週にかけて、データサイエンスで必要となる汎用的なコードを学ぶ期間があるため、Pythonが未経験であっても問題ない。しかしながら、C言語などの他のプログラミングの経験があれば望ましい。

授業の属性・履修上の区分

アクティブラーニング
ICT 利用
遠隔授業対応
実務経験のある教員による授業

授業計画

授業内容 週ごとの到達目標
後期
3rdQ
1週 データサイエンスとは データサイエンスの分野で求められるデータ活用の基本的な考え方や、本講義の進め方・構成を理解する。
2週 Pythonの基礎 データ操作に必要なPythonの基本文法(変数、リスト、辞書)を用いて簡単なプログラムが書ける。
3週 配列操作、数学計算 Numpyを用いた配列操作や、Scipyを用いた数学計算をPythonで実行できる。
4週 表計算 Pandasを用いたデータ読み込み、整形(欠損値やフィルタリング)、集計操作ができる。
5週 可視化 Matplotlibを用いてデータの特徴を可視化するグラフを作成できる。
可視化結果から簡単な分析を説明できる。
6週 平均値・中央値・最頻値、分散・標準偏差 基本統計量を計算し、データの分布や特徴を理解・説明できる。
7週 確率、正規分布、母集団 確率概念と正規分布を用いたデータのモデル化が理解できる。
母集団と標本の違いを説明できる。
8週 検定、帰無仮説・対立仮説、t検定 帰無仮説・対立仮説の考え方を理解したうえで、t検定の概念と手順を理解し、Pythonで実行して結果を解釈・説明できる。
4thQ
9週 二項検定、カイ二乗検定 二項検定・カイ二乗検定の概念と手順を理解し、Pythonで実行して結果を解釈・説明できる。
10週 分散分析 分散分析(1要因・2要因、被験者内・被験者間)の概念と手順を理解し、Pythonで実行して結果を解釈・説明できる。
11週 相関 データ間の関係を表す相関の概念を理解し、Pythonで実行した結果として算出される相関係数等の結果を解釈・説明できる。
12週 単回帰分析 データ間の関係を表す回帰係数と定数項の概念を理解し、Pythonで実行した単回帰分析の結果を解釈・説明できる。
13週 教師あり学習(重回帰分析①) 各変数の影響を表す偏回帰係数を中心に重回帰分析の概念と手順を理解し、Pythonで実行した結果を解釈・説明できる。
14週 教師あり学習(重回帰分析②) 重回帰分析にダミー変数を加えて、Pythonで分析を行い、実行した結果を解釈・説明できる。
15週 教師なし学習(PCA・クラスタリング) 主成分分析とクラスタリング(K-means法)をPythonで実行し、可視化された結果を解釈・説明できる。
16週

モデルコアカリキュラムの学習内容と到達目標

分類分野学習内容学習内容の到達目標到達レベル授業週

評価割合

課題合計
総合評価割合100100
評価項目13030
評価項目24040
評価項目33030