シラバス
授業科目名 | 年度 | 学期 | 開講曜日・時限 | 学部・研究科など | 担当教員 | 教員カナ氏名 | 配当年次 | 単位数 |
---|---|---|---|---|---|---|---|---|
機械学習基礎論 | 2024 | 前期 | 木2 | 理工学部 | 樋口 知之 | ヒグチ トモユキ | 3年次配当 | 2 |
科目ナンバー
SE-AI3-7B08
履修条件・関連科目等
大学における基礎数学、確率論を理解していること。また、R言語を使えることを前提とする。
授業で使用する言語
日本語
授業で使用する言語(その他の言語)
授業の概要
膨大なデータからパターンをコンピュータで見いだし、それに基づき予測や判別を行う計算技術は、機械学習(正確に言えば、統計的機械学習)と呼ばれる。機械学習の枠組みと、代表的な手法の解説を行う。機械学習は、教師有り学習、教師無し学習、そして強化学習の三つに大別できる。教師有り学習の代表例は判別や回帰であり、教師無し学習の代表例はクラスタリングや次元圧縮になる。強化学習はゲームプログラミングやロボット制御において必須の道具であるが、やや高度な数理が必要となるため、教師有り学習と教師無し学習を解説する。解説においては、数理的な側面に深く立ち入ることよりも手続きおよびR言語で書いたプログラムを解説することで、実際の問題に直面した際、まずは手を動かせるように意識付けする。授業内でR言語を用いたコンピュータ実習を行い、具体的にアルゴリズムがどのように働くのかを体得する。
科目目的
統計の標準的な手法を学んだ後に、その発展として、ビッグデータ解析に必要な機械学習の基礎的な知識を習得することを目的とする。講義内で解説するロジスティック回帰は、後期に開講する「深層学習」を学ぶために必須の内容になる。あわせてR言語を復習することで、3年次後期の「データサイエンス演習」(樋口担当分)や、4年次での「卒業研究Ⅰ、Ⅱ」で行うデータ解析に必要となる最低限のスキルを身につける。
到達目標
以下を到達目標とする。
・統計学と機械学習の関係および、人工知能における機械学習の果たす役割が説明できる。
・ビッグデータ解析において、統計学の手法の限界を具体的な例でもって示せる。
・汎化誤差と過学習について説明できる。
・機械学習の枠組みと機能を体系的に理解し、多数ある機械学習の手法群を俯瞰的に整理できる。
・よく使われる手法のアルゴリズムの概要を説明でき、フローチャートが書ける。
・モデル評価の代表的な指標について理解し、問題に応じたモデル比較が行える。
・アルゴリズム内の計算ステップ(手続き)をR言語によりプログラミングできる。
授業計画と内容
第1回 機械学習全般の概説
第2回 機械学習の応用上の課題とR言語利用のオリエンテーション(一部実習)
第3回 ランダムサンプリング(一部実習)
第4回 モデル評価: k-fold クロスバリデーション(一部実習)
第5回 過学習: 多項式回帰(一部実習)
第6回 最適化: 勾配法(一部実習)
第7回 ロジスティック回帰(一部実習)
第8回 サポートベクターマシンとカーネル法(一部実習)
第9回 カーネル回帰、リッジ回帰(一部実習)
第10回 決定木分析(一部実習)
第11回 ランダムフォレストとアンサンブル学習(一部実習)
第12回 クラスタリング: K-means法(一部実習)
第13回 次元削減と可視化: t-SNE法(一部実習)
第14回 評価指標:ROC, AUC(一部実習)
◎ 以上は目安である。
授業時間外の学修の内容
指定したテキストやレジュメを事前に読み込むこと/その他
授業時間外の学修の内容(その他の内容等)
・授業前に資料とプログラム集をアップする。指示された内容について予習すること。
・毎回、小テストを行うため、教科書および配布資料を用いて復習すること。数式展開が多いので、アルゴリズムについては特に復習すること。
・授業内ではR言語を用いた実習を行うので、R言語のわからなかった部分は復習をすること。
授業時間外の学修に必要な時間数/週
・毎週1回の授業が半期(前期または後期)または通年で完結するもの。1週間あたり4時間の学修を基本とします。
・毎週2回の授業が半期(前期または後期)で完結するもの。1週間あたり8時間の学修を基本とします。
成績評価の方法・基準
種別 | 割合(%) | 評価基準 |
---|---|---|
平常点 | 30 | 授業への参加、受講態度(授業内での課題への取り組み、アンケートへの回答姿勢)の状況を基準とする。 |
その他 | 70 | 初回を除いて、毎回小テストを行う。前回の講義内容の基礎知識が習得できたかどうかを評価する。 |
成績評価の方法・基準(備考)
出席率が70%に満たない者はE判定とする。
課題や試験のフィードバック方法
授業時間内で講評・解説の時間を設ける/授業時間に限らず、manabaでフィードバックを行う
課題や試験のフィードバック方法(その他の内容等)
アクティブ・ラーニングの実施内容
その他
アクティブ・ラーニングの実施内容(その他の内容等)
プログラミング演習
授業におけるICTの活用方法
実施しない
授業におけるICTの活用方法(その他の内容等)
実務経験のある教員による授業
いいえ
【実務経験有の場合】実務経験の内容
【実務経験有の場合】実務経験に関連する授業内容
テキスト・参考文献等
適宜レジュメとプログラム集を配付する。マナバから授業前に毎回ダウンロードすること。
テキスト:特に指定しない。
ただし、以下の教科書的書籍は、文科省が定めるリテラシーレベルの標準カリキュラムに準拠している。事前に読んでおくと、授業の内容がよく理解できる。
教養としてのデータサイエンス (データサイエンス入門シリーズ) 、講談社 (2021/6/17) ISBN: 978-4065238097
参考書:
(1)管 他著「最短突破 データサイエンティスト検定(リテラシーレベル)公式リファレンスブック」(技術評論社、2021, ISBN 978-4297122614)
※データサイエンティストのビジネスマンとして必須の知識とスキルを大ぐくりにとらえられる。
(2)横内大介、青木義允著「イメージでつかむ機械学習入門」(技術評論社、2017、ISBN: 978-4774190624)
※数式が少ない初学者用解説書。
(3)竹村彰通、姫野哲人、高田聖治編「データサイエンス入門:(学術図書出版、2019、ISBN: 978-4780607017)
(4)照井著「ビッグデータ統計解析入門 経済学部/経営学部で学ばない統計学」(日本評論社、2018、ISBN: 978-4535559011)
その他特記事項
参考URL
https://researchmap.jp/matrix/