シラバス
授業科目名 | 年度 | 学期 | 開講曜日・時限 | 学部・研究科など | 担当教員 | 教員カナ氏名 | 配当年次 | 単位数 |
---|---|---|---|---|---|---|---|---|
データ解析第2 | 2024 | 後期 | 火2 | 理工学部 | 馬塲 弘樹 | ババ ヒロキ | 2年次配当 | 2 |
科目ナンバー
SE-SA2-7B07
履修条件・関連科目等
「確率論」、「統計学」、「データ解析第1」を履修していることが望ましい。
授業で使用する言語
日本語
授業で使用する言語(その他の言語)
授業の概要
「データ解析第1」に引き続き、統計的データの取り扱いとその解析方法について学習する。データ解析第1で学習したパラメータの推定や仮説検定、統計モデルに基づき、主として回帰と分類について学習する。実践的なデータ解析を前提として、多種の統計モデルを学習するとともに、実データに対して最適な統計モデルのあてはめを行う。
科目目的
本講義では、データ解析を行う際に必要な統計手法を演習付きで理解していくことを目的とする。演習時間には実際のデータを用意し、RやPythonを利用して様々な統計手法を活用することで、実践的にデータ解析を身につけることが本講義の特徴である。
到達目標
大きく以下の三点を理解あるいは実装できることを目標とする。
(1)データ型に依らず、RまたはPythonでデータを適切に加工できる
(2)利用ライブラリの仕組みを理解し、基礎的なモデリングができる
(3)データの特徴に応じてモデル選択を行い、RまたはPythonでモデルを実装できる
授業計画と内容
第1回 オリエンテーション、統計モデリングの概観
第2回 クラスター分析
第3回 主成分分析
第4回 因子分析
第5回 決定木
第6回 離散選択モデル
第7回 分類・クラスタリング問題に関するグループワーク
第8回 分類・クラスタリング問題に関する課題の発表と討論
第9回 重回帰モデル1:カテゴリー変数、交互作用項
第10回 重回帰モデル2:多重共線性、不均一分散、非線形性
第11回 一般化線形モデル
第12回 罰則付き回帰モデル
第13回 回帰問題に関するグループワーク
第14回 回帰問題に関する課題の発表と討論
授業時間外の学修の内容
指定したテキストやレジュメを事前に読み込むこと/授業終了後の課題提出
授業時間外の学修の内容(その他の内容等)
授業時間外の学修に必要な時間数/週
・毎週1回の授業が半期(前期または後期)または通年で完結するもの。1週間あたり4時間の学修を基本とします。
・毎週2回の授業が半期(前期または後期)で完結するもの。1週間あたり8時間の学修を基本とします。
成績評価の方法・基準
種別 | 割合(%) | 評価基準 |
---|---|---|
平常点 | 40 | 講義への参加度および各回の課題提出の成績で評価する。 |
その他 | 60 | 授業の中でデータを利用した演習課題を設定する。その課題の発表と討論の内容を評価する。 |
成績評価の方法・基準(備考)
課題や試験のフィードバック方法
授業時間内で講評・解説の時間を設ける/授業時間に限らず、manabaでフィードバックを行う/その他
課題や試験のフィードバック方法(その他の内容等)
manabaとともに、この授業用にGoogle Classroomを用いて、補足資料の共有やショートコメントなどのフィードバックを行う。
アクティブ・ラーニングの実施内容
ディスカッション、ディベート/グループワーク/プレゼンテーション
アクティブ・ラーニングの実施内容(その他の内容等)
授業におけるICTの活用方法
その他
授業におけるICTの活用方法(その他の内容等)
Google Classroom, Google Drive, Google Colaboratoryを利用して、オンラインにも対応した授業を行う。
実務経験のある教員による授業
いいえ
【実務経験有の場合】実務経験の内容
【実務経験有の場合】実務経験に関連する授業内容
テキスト・参考文献等
講義資料・課題は、manabaあるいはGoogle Classroom上に掲示する。
参考文献:
久保拓弥. 2017. データ解析のための統計モデリング入門. 岩波書店. ISBN:978-4000069731.
八谷大岳. 2020. ゼロからつくるPython機械学習プログラミング入門. 講談社. ISBN: 978-4065206126.