第1~3学期は,自治体や企業の提供するオープンデータ,経済データ,地理情報データを利用し,これらの分析および可視化を試みる。その過程においてデータ分析の重要性を理解し,かつ分析手法・可視化手法を身に付ける。第4学期はマルチエージェントシミュレーションを取り上げ,オブジェクト指向に基づくシミュレーション技法を身に付ける。
概要:
第1~3学期は,自治体や企業の提供するオープンデータ,経済データ,地理情報データを利用する。最初に,比較的馴染みがあると思われるオープンデータを用いて,データ分析手法・可視化手法の基礎を学ぶ。経済データに関して,特に株価を対象として相関,変動率に基づくパフォーマンス評価,騰落率や変化率の相関からの企業分析を取り上げる。地理情報データの活用においては,商圏人口の推定を目標とし,GeoPandas を活用する。第4学期はマルチエージェントシミュレーションを用いた感染症流行過程モデリングを取り上げる。
※実務との関係
この科目は企業で情報システム開発を担当していた教員が、その経験を生かし,情報技術を用いたデータの分析・可視化について演習形式で授業を行うものである。
授業の進め方・方法:
多様な手法を組み合わせることから,事前に予習用の動画を公開する。これらを予め視聴の上,演習室においては演習・実習に時間を割く形とする。また,演習時は学生同士で情報交換しながら,また教員へ質問しながら課題に取り組む。
注意点:
全編を通してボリュームが多いため,事前に予習用動画を視聴することを求める。
|
|
週 |
授業内容 |
週ごとの到達目標 |
前期 |
1stQ |
1週 |
イントロおよびGoogle Colaboratory環境構築 |
データ分析の重要性を理解できる。また,演習室での演習・自学での相互運用性を担保するため,Google Colaboratory を用いた開発環境を構築できる。
|
2週 |
オープンデータの活用(1):気象庁データを用いたデータ可視化 |
気象庁の公開するデータを活用し,データの取得方法・基本的な可視化手法を身に付ける。
|
3週 |
オープンデータの活用(2):pandasを用いたデータ処理 |
地方自治体の公開するデータを利用し,pandasによるデータ処理手法を身に付ける。
|
4週 |
オープンデータの活用(3):リッチな可視化手法 |
地方自治体の公開するデータを利用し,plotly express 等を用いたリッチな可視化手法を身に付ける。
|
5週 |
オープンデータの活用(4):ヒートマップを用いた可視化 |
地方自治体の公開するデータを解析し,ヒートマップを用いた可視化手法を身に付ける。
|
6週 |
オープンデータの活用(5):COVID-19 Community Mobility Reports の活用 |
COVID-19 Community Mobility Reports のデータを利用し,人流の傾向を把握・可視化できる。
|
7週 |
経済データの分析(1):株価データの相関[1] |
東証一部上場企業の株価データより,株価推移の相関を調べ,業種ごとの特徴を分析できる。
|
8週 |
|
|
2ndQ |
9週 |
経済データの分析(2):株価データの相関[2] |
東証一部上場企業の株価データより,株価推移の相関を調べ,業種ごとの特徴を分析できる。
|
10週 |
経済データの分析(3):企業のパフォーマンス評価[1] |
株価推移の分析を通して,株価の移動平均を用いた投資タイミングの見定め,および株価の月別変動率に基づくパフォーマンス評価を実行できる。
|
11週 |
経済データの分析(4):企業のパフォーマンス評価[2] |
株価推移の分析を通して,株価の移動平均を用いた投資タイミングの見定め,および株価の月別変動率に基づくパフォーマンス評価を実行できる。
|
12週 |
経済データの分析(5):株価の騰落率からの企業分析[1] |
社会情勢と株価の相関に関する仮説を立て,株価の騰落率から考察できる。
|
13週 |
経済データの分析(6):株価の騰落率からの企業分析[2] |
社会情勢と株価の相関に関する仮説を立て,株価の騰落率から考察できる。
|
14週 |
経済データの分析(7):株価の変化率の相関[1] |
株価の変化率の相関およびこれらから見出される特徴的な企業を分析できる。
|
15週 |
経済データの分析(8):株価の変化率の相関[2] |
株価の変化率の相関およびこれらから見出される特徴的な企業を分析できる。
|
16週 |
前期のまとめ |
前期に学んだデータ分析手法や可視化手法を整理できる。
|
後期 |
3rdQ |
1週 |
地理情報の活用(1):シェイプファイルの利用 |
GeoPandas の利用方法,シェイプデータの取得・活用方法を理解できる。
|
2週 |
地理情報の活用(2):人口密度の可視化 |
「地図で見る統計(統計GIS)」のデータを用いて,山口県や市町村単位の人口密度を可視化できる。
|
3週 |
地理情報の活用(3):平面直角座標系の導入 |
商圏人口の推定に向けて,店舗位置を平面直角座標系へ配置できる。
|
4週 |
地理情報の活用(4):商圏人口の推定[1] |
商圏人口を推定するためのアルゴリズムを理解できる。
|
5週 |
地理情報の活用(5):商圏人口の推定[2] |
現実の店舗を対象として,商圏人口を推定できる。
|
6週 |
地理情報の活用(6):商圏人口の推定[3] |
現実の店舗を対象として,商圏人口を推定できる。
|
7週 |
地理情報の活用(7):オープンデータと地理情報の組み合わせ |
World Development Indicators にて提供されるオープンデータを地図上に展開できる。
|
8週 |
|
|
4thQ |
9週 |
地理情報の活用(8):SDGsとの関連 |
就学率や gender parity index 等,SDGs と結びつきの強い指標を用いて,データ分析および可視化ができる。
|
10週 |
マルチエージェントシミュレーション(1):MASの概要 |
マルチエージェントシミュレーション(MAS)の考え方,オブジェクト指向に基づくコーディングの方法論を理解できる。
|
11週 |
マルチエージェントシミュレーション(2):mesaの使い方 |
mesa ライブラリを用いた MAS の実装手順を理解できる。
|
12週 |
マルチエージェントシミュレーション(3):SIRモデル |
感染症の流行過程をモデリングするSIRモデルを用いて,単純な条件下での感染状況をシミュレーションできる。
|
13週 |
マルチエージェントシミュレーション(4):SIRモデルへの条件付加 |
エージェントのマスク装着,自粛行動を取り込み,やや複雑な条件下でのシミュレーションを実行できる。
|
14週 |
マルチエージェントシミュレーション(5):SIRDモデル |
SIRDモデルへ発展させ,かつエージェントのマスク装着・自粛行動等の条件を取り込んだシミュレーションを実行できる。
|
15週 |
マルチエージェントシミュレーション(6):シミュレーション結果の分析 |
SIRDモデルを用いたシミュレーション結果から感染者数・死者数低減のための条件を見出せる。
|
16週 |
後期のまとめ |
後期に学んだ地理情報解析手法およびマルチエージェントシミュレーションの技法を整理できる。
|
分類 | 分野 | 学習内容 | 学習内容の到達目標 | 到達レベル | 授業週 |
基礎的能力 | 工学基礎 | 情報リテラシー | 情報リテラシー | 同一の問題に対し、それを解決できる複数のアルゴリズムが存在しうることを知っている。 | 3 | 前10,前11,前12,前13,前14,前15,後4,後5,後6,後10,後11,後12,後13,後14 |
与えられた基本的な問題を解くための適切なアルゴリズムを構築することができる。 | 3 | 前2,前3,前4,前5,前6,前7,前9,前10,前11,前12,前13,前14,前15,後1,後2,後3,後4,後5,後6,後7,後9,後10,後11,後12,後13,後14,後15 |
任意のプログラミング言語を用いて、構築したアルゴリズムを実装できる。 | 3 | 前2,前3,前4,前5,前6,前7,前9,前10,前11,前12,前13,前14,前15,後1,後2,後3,後4,後5,後6,後7,後9,後10,後11,後12,後13,後14,後15 |