シラバス
授業科目名 | 年度 | 学期 | 開講曜日・時限 | 学部・研究科など | 担当教員 | 教員カナ氏名 | 配当年次 | 単位数 |
---|---|---|---|---|---|---|---|---|
データサイエンスのフロンティア | 2025 | 後期 | 金1 | 文学部 | 木田 幹久 | キダ モトヒサ | 3・4年次配当 | 2 |
科目ナンバー
LE-AI3-L312
履修条件・関連科目等
授業で使用する言語
日本語
授業で使用する言語(その他の言語)
授業の概要
データマイニングの技術の一分野であるテキストマイニングを中心にした科目です。
【2025年度のトピック】
これまで提供してきました内容に加えて、データサイエンスの集大成ともいえる最新のChatGPTについての概説と活用を追加します。
世の中ではデータビジネス/データサイエンティストの時代と言われている面がありますが、実際にはどのようなことを実施していて、そのためにはスキルとして何が必要か、実務での事例を踏まえて、理論と実践についてお伝えしたいと思います。
データマイニングとは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術です「Wikipedia」より)。その中でも特に文書データを扱う技術の総称としてテキストマイニングと呼びます。
テキストマイニングは、確率統計解析、自然言語処理およびデータマイニングなど多様な技術を組み合わせた技術です。対象となる文書データを扱うための自然言語処理に加え、膨大なデータから有用なパターンを発見するためのデータマイニングの技術、テキスト分類などの機械学習のアルゴリズムを適用します。これらの技術は目的をもって組み合わせることではじめて有効な結果が得られます。
テキストマイニングの適用によって新たな課題が発生し、それに対応する研究が各技術の向上にもつながっています。本科目は、テキストマイニングを実現するための自然言語処理、統計解析およびデータマイニング技術を講義と実習形式で提供します。
実務において、"これくらいは知っておいてほしい、できてほしい"ということをお伝えすることを重視したカリキュラムです。
科目目的
本科目は、文書データの分析に必要な自然言語処理を中心としたテキストマイニングで用いられる技術と、産業、学術等の実際の応用場面を理解できること。
また、科目を受講する学生みなさん各自の関心分野においてテキストマイニングの活用について効果と限界/課題を理解できることを目指します。
到達目標
2つの目標があります。
1)2つ以上のテキストマイニング/データマイニングの技術を使った分析レポートを作成提出していただき、テキストマイニングの活用について、効果と限界、課題を理解することです。
2)上記1つめの目標を達成するために、スキルとしてエクセルやフリーソフトを使って、テキストマイニングが実践できることです。
分析の結果があっているかどうかではなく、そのプロセス/スキルについて理解と実践ができているかを重視します。
授業は理論講義、ネット調査、小テスト/レポートおよび実習になります。
===授業を受けていただくにあたり===
ご自身のPCをもっていれば持参されることが望ましいです。
お持ちでない方は学校の貸与PCを利用いただきますが、特に、テキストマイニングのツール利用において、一部利用制限の機能があるかもしれません。その際は、レポート作成に必要なデータはこちらで用意します。
授業計画と内容
第1回:テキストマイニングの事例紹介
第2回:実践編:目的の設定とソフトウェアのインストールとツールの試行
第3回:理論編I:テキストマイニングと形態素解析
第4回:理論編I:テキストマイニングと構文解析
第5回:理論編I:テキストマイニングと辞書
第6回:理論編II:テキストマイニングと主成分分析
第7回:理論編II:テキストマイニングと数量化III類
第8回:理論編II:テキストマイニングとクラスタリング
第9回:実践編:スキル確認テスト
第10回:最新動向:【2025年度】ChatGPT概説と活用/テキストマイニングとAI/機械学習
第11回:理論編III:単語の自動抽出とテキストマイニング
第12回:理論編III:単語のネットワーク分析とテキストマイニング
第13回:理論編III:テキストの分類とテキストマイニング
第14回:レポート提出、プレゼン、到達度確認
授業時間外の学修の内容
指定したテキストやレジュメを事前に読み込むこと/授業終了後の課題提出/その他
授業時間外の学修の内容(その他の内容等)
1.小テスト
2.ネット上での文献リサーチ
3.文献リサーチ結果の報告書作成/レポーティング
授業時間外の学修に必要な時間数/週
・毎週1回の授業が半期(前期または後期)または通年で完結するもの。1週間あたり4時間の学修を基本とします。
・毎週2回の授業が半期(前期または後期)で完結するもの。1週間あたり8時間の学修を基本とします。
成績評価の方法・基準
種別 | 割合(%) | 評価基準 |
---|---|---|
期末試験(到達度確認) | 30 | 各自に設定してもらう課題(テキストマイニング)とその分析結果の報告 |
レポート | 40 | 文献リサーチのとりまとめと報告 |
平常点 | 30 | 毎回の授業における小テストへの回答とその発表 |
成績評価の方法・基準(備考)
補足:平常点=授業への出席およびレポート=授業における小テスト等の回答と発表や報告を行うことで70%は達成です。
課題や試験のフィードバック方法
授業時間内で講評・解説の時間を設ける/授業時間に限らず、manabaでフィードバックを行う
課題や試験のフィードバック方法(その他の内容等)
アクティブ・ラーニングの実施内容
PBL(課題解決型学習)/プレゼンテーション/実習、フィールドワーク
アクティブ・ラーニングの実施内容(その他の内容等)
授業におけるICTの活用方法
クリッカー/タブレット端末/その他
授業におけるICTの活用方法(その他の内容等)
各自持参のノートPC
実務経験のある教員による授業
はい
【実務経験有の場合】実務経験の内容
1)下記分野におけるコンサルティングビジネス/分析業務の経験
・クレジットカード (数値データベース、アンケート回答等)
・ヘルスケア(保健医療介護に関する各種データ)
・ヘルスケア(センサーデータ)
2)センシングデバイスを活用した新規事業開発および事業推進
【実務経験有の場合】実務経験に関連する授業内容
過去の授業
2021年度、データサイエンス(テキストマイニング)
テキスト・参考文献等
授業は、レジュメ/パワポ資料で説明します。
各回の事前にコースコンテンツとしてアップしますので、予習復習に役立ててください。
より詳しく自習を目指す方には、下記を参考文献とします。
参考文献
テキストマイニング
1)松村真宏/三浦麻子、人文・社会科学のためのテキストマイニング、誠信書房
2)末吉美喜、テキストマイニング入門、オーム社
3)樋口耕一、社会調査のための計量テキスト分析第2版、ナカニシヤ出版
テキストマイニングの結果を生かすための統計学
4)統計検定2級程度
5)統計検定 統計調査士 程度
データ分析/エクセル操作
5)玄場 公規, 湊 宣明他、Excel で学ぶ ビジネスデータ分析の基礎 ビジネス統計スペシャリスト・エクセル分析ベーシック対応、オデッセイコミュニケーションズ
6)Excel で学ぶ 実践ビジネスデータ分析 ビジネス統計スペシャリスト・エクセル分析スペシャリスト対応、オデッセイコミュニケーションズ
7)木村幸子、Excelピボットテーブル データ集計・分析の「引き出し」が増える本、翔泳社