シラバス
授業科目名 | 年度 | 学期 | 開講曜日・時限 | 学部・研究科など | 担当教員 | 教員カナ氏名 | 配当年次 | 単位数 |
---|---|---|---|---|---|---|---|---|
コンピュータ演習(データ分析) | 2024 | 秋学期 | 金5 | 商学部 | 吉田 健一郎 | ヨシダ ケンイチロウ | 1~4年次配当 | 2 |
科目ナンバー
CM-OI1-83XS
履修条件・関連科目等
事前登録科目です。
履修希望者が定員を超過した場合は、抽選にて履修者を決めます。日程等の詳細を授業時間割で確認してください。2022年度以前に「入門データ分析演習」または「応用データ分析演習」を修得している学生は履修できません。 2022年度以前入学生も授業科目一覧上にはありませんが、履修可能です。修得した単位は「リベラルアーツ科目 自然科学系」に算入されます。
統計入門を履修済みであることが望ましい。
授業で使用する言語
日本語
授業で使用する言語(その他の言語)
授業の概要
本講義ではpython(実行環境はgoogle colaboratory)を用いて、データ分析手法を学ぶ。具体的には、各種ライブラリを用いて統計的・機械学習的な方法を学ぶ。ただし、データクレンジングについてはpandasを中心とするが、場合によってExcelを用いて行い、クレンジング後のデータセットを用いることもある。
科目目的
機械学習の基本的なアルゴリズム(回帰分析、ロジスティック回帰、決定木、ランダムフォレスト、ニューラルネットワーク)を理解すること目標とします。アルゴリズムの背景にある理論については直感的な説明をします。また、本科目はリベラルアーツ科目における自然科学系科目に位置付けられており、データサイエンスの基礎的な位置付けとして、発展的なデータサイエンス・機械学習への土台となる科目である。
到達目標
- 機械学習の基本的なアルゴリズム(回帰分析、ロジスティック回帰、決定木、ランダムフォレスト、ニューラルネットワーク)を理解すること。
- それぞれのアルゴリズムの使い所を判断できるようになること。
- 機械学習の結果を適切な手法を用いて評価できること。
- データクレンジングの仕方を理解すること。
授業計画と内容
第1回 オリエンテーション、Pythonの復習
第2回 Python基礎1(変数・関数・文字列の入出力)
第3回 Python基礎2(条件式と分岐・繰り返し・関数の定義)
第4回 データ分析の流れとデータの前処理(pandasの基本操作)
第5回 機械学習の全体を理解する
第6回 回帰分析を用いた機械学習
第7回 欠損値と外れ値の処理で精度を向上させる
第8回 決定木の理論と分類手法の理解
第9回 ニューラルネットワークを用いた機械学習
第10回 小テスト(基本的な分析手法の実習)
第11回 ロジスティック回帰を用いた機械学習
第12回 ランダムフォレスト/Xgboostを用いた機械学習
第13回 Lightgbmを用いた機械学習
第14回 応用的な分析手法の総括
授業時間外の学修の内容
授業終了後の課題提出
授業時間外の学修の内容(その他の内容等)
授業時間外の学修に必要な時間数/週
・毎週1回の授業が半期(前期または後期)または通年で完結するもの。1週間あたり4時間の学修を基本とします。
・毎週2回の授業が半期(前期または後期)で完結するもの。1週間あたり8時間の学修を基本とします。
成績評価の方法・基準
種別 | 割合(%) | 評価基準 |
---|---|---|
平常点 | 60 | 講義時に当日の講義内容に対する理解度を確認する課題を出題する |
その他 | 40 | 小テスト:与えられたデータと目的に対して、適切な手法で実際に処理・分析できるかを問う |
成績評価の方法・基準(備考)
課題や試験のフィードバック方法
授業時間内で講評・解説の時間を設ける/授業時間に限らず、manabaでフィードバックを行う
課題や試験のフィードバック方法(その他の内容等)
アクティブ・ラーニングの実施内容
実施しない
アクティブ・ラーニングの実施内容(その他の内容等)
授業におけるICTの活用方法
実施しない
授業におけるICTの活用方法(その他の内容等)
実務経験のある教員による授業
いいえ
【実務経験有の場合】実務経験の内容
【実務経験有の場合】実務経験に関連する授業内容
テキスト・参考文献等
須藤秋良(2020)『スッキリわかるPythonによる機械学習入門』インプレス
https://www.amazon.co.jp/dp/4295009946
その他特記事項
Google Colaboをブラウザから利用するため、特別なソフトウェアは利用しません。