データサイエンス基礎

科目基礎情報

学校 釧路工業高等専門学校 開講年度 令和08年度 (2026年度)
授業科目 データサイエンス基礎
科目番号 0033 科目区分 専門 / 必修
授業形態 講義 単位の種別と単位数 学修単位: 2
開設学科 情報工学分野 対象学年 2
開設期 後期 週時間数 2
教科書/教材 教科書:竹村彰通著「データサイエンス入門」(学術図書出版社),参考書:藤井直弥著「Excel 最強の教科書」(SBクリエイティブ),下山輝昌著 「Python 実践データ分析 100本ノック」(秀和システム)
担当教員 田森 湧斗

到達目標

本講義では、学内のJupyter Notebook上で再現性あるノートを作りながら、Pythonの基礎文法とNumPy・pandasによるデータの読み込み・前処理・可視化を身につけます。平均・分散・標準偏差、四分位数・IQR、相関係数などの基礎統計を計算します。最終的に、目的の明確化から前処理、図表と指標の提示、解釈、限界の整理までを一連の流れとしてまとめ、相関と因果を混同せずに根拠をもって説明できるようになることを到達目標とします。

ルーブリック

理想的な到達レベルの目安標準的な到達レベルの目安未到達レベルの目安
評価項目1:Python基礎文法と標準ライブラリ実装力条件分岐・反復・関数・例外・内包表記を適切に用い、標準ライブラリで課題を自力完遂。読みやすい構成。条件分岐・反復・関数は概ね正確。例外処理や内包表記は部分的活用。冗長さは残るが要件を満たす。基本文法の誤りが多く関数化が不十分。例外対応がなく、仕様どおりの出力に到達できない。
評価項目2:NumPy・pandasによる前処理・集約・可視化欠損・型変換・抽出・集約・結合を的確に実装。配列演算を活用し、適切な図で要点を明快に示す。主要な前処理と集約は実装可。図は基本要件を満たすが選択や効率性に改善余地。解釈は概ね妥当。主要な前処理と集約は実装可。図は基本要件を満たすが選択や効率性に改善余地。解釈は概ね妥当。前処理や集約に致命的誤り。配列演算・pandas操作が不安定。図が不適切で情報が読み取れない。
評価項目3:基礎統計の実装と説明平均・分散・相関・回帰を正確に実装し残差も確認。数値と図を根拠に簡潔で説得力ある説明ができる。主要指標を算出し傾向を説明可能。残差や限界の扱いは浅いが、相関と因果は概ね区別できている。指標計算や式実装に誤りが多い。図表との整合がなく解釈が曖昧。相関と因果をしばしば混同する。

学科の到達目標項目との関係

ディプロマ・ポリシー C 説明 閉じる

教育方法等

概要:
現在,AI・IT技術者の育成を目的として,数理及びデータサイエンスに係る教育強化がが急務とされている.
本講義では,統計学や数学・計算機科学などと関連し,主に大量のデータ(ビッグデータ)から何らかの意味のある情報の抽出,分析,表現加工し,それらから補足関連性などを導出できるデータサイエンス能力の育成を目的とする.
授業の進め方・方法:
本講義は教室での講義と計算機室での演習の両方の形式で進める.
座学ではデータの入手,加工,解読,表現加工,データ活用の理論を学び,計算機室で実データを使った実習を行う.
データサイエンティストに必須となるデータを加工するPythonの基礎プログラミング能力を育成する.

最終評価:定期試験60%+提出物40%
     定期試験:期末試験
     提出物:小テストまたは報告書
合格基準:定期試験60%と提出物40%の合計が60%を以上であること
再試験の場合、試験60%で合格となるが、最終成績の最高点は60%とする.

前関連科目:UNIXリテラシー 後関連科目:プログラミング言語ⅡA他
事前に行う準備学習:講義の冒頭で予習・復習内容を説明する.
注意点:
講義だけでなく、計算機室のPCを使った実習も行う.
小テストや報告書は欠席すると提出できません.欠席しないようにしましょう.

本科目は学修単位科目であるため、授業時間相当の自主学習(授業の予習・復習を含む)を行う必要がある。

授業の属性・履修上の区分

アクティブラーニング
ICT 利用
遠隔授業対応
実務経験のある教員による授業

授業計画

授業内容 週ごとの到達目標
後期
3rdQ
1週 ガイダンス、環境確認、データサイエンス概論 データサイエンスとは何かを説明できる.Pythonの特徴と役割を説明できる.基礎的な統計の公式について説明できる.
2週 Python基礎①(変数・型・演算・print) 基本型と演算・printを用いて、簡単な計算や文字出力を自力で記述・実行できる。
3週 Python基礎②(入力・型変換・文字列) inputと型変換、文字列操作を組み合わせ、対話型の小さなスクリプトを作成できる。
4週 条件分岐①(if / elif / else) if/elif/elseで条件に応じた処理分岐を設計し、境界条件の動作も確認できる。
5週 条件分岐②(論理演算・多段分岐) 論理演算と多段分岐で複合条件を表現し、判定ロジックを整理・検証できる。
6週 反復①(for・range・列挙処理) forとrangeで繰り返し処理を構成し、合計・平均などの基礎集計を実装できる。
7週 反復②(while・break・continue) whileとbreak/continueで反復制御を設計し、適切な終了条件を設定できる。
8週 関数①(定義・引数・戻り値・スコープ) 関数を定義し引数・戻り値・スコープを理解、処理を再利用可能に分割できる。
4thQ
9週 データ構造①(リスト・タプル・スライス) リスト/タプルとスライスでデータを抽出・更新し、基本操作を正確に扱える。
10週 データ構造②(辞書・集合・内包表記) 辞書・集合・内包表記で集計や重複除去を簡潔に記述し、可読性を高められる。
11週 ファイル入出力・例外・CSV基礎 ファイル入出力でCSVを読み書きし、例外処理でエラー時の動作を制御できる。
12週 NumPy入門+簡易統計(配列・集計) NumPy配列の作成・形状操作・ベクトル演算で、要約統計を効率よく算出できる。
13週 pandas入門①(読み込み・選択・加工) pandasでCSVを読み込み、列の選択・抽出・新列作成など基本操作を一通り行える。
14週 可視化基礎(Matplotlib入門) 棒・折れ線・散布・箱ひげ図を作成し、軸・凡例・注記を適切に設定できる。
15週 総合演習I(Pythonの活用) 与えられたデータを総合的に分析し、成果をレポートにまとめることができる
16週 後期期末試験

モデルコアカリキュラムの学習内容と到達目標

分類分野学習内容学習内容の到達目標到達レベル授業週

評価割合

試験発表ポートフォリオその他合計
総合評価割合600040100
基礎的能力00000
専門的能力600040100
分野横断的能力00000