シラバス
授業科目名 | 年度 | 学期 | 開講曜日・時限 | 学部・研究科など | 担当教員 | 教員カナ氏名 | 配当年次 | 単位数 |
---|---|---|---|---|---|---|---|---|
特殊研究Ⅲ(社会関係の調査法) | 2025 | 通年 | 火5 | 商学研究科博士課程後期課程 | 武石 智香子 | タケイシ チカコ | 3年次配当 | 4 |
科目ナンバー
CG-OM6-203L
履修条件・関連科目等
英語の text を理解できること、自分のPCで実習を行えること、統計とRの基本を理解していることを前提とします。
授業で使用する言語
日本語/英語
授業で使用する言語(その他の言語)
授業の概要
テキストマイニングをRプログラミングを使って実施する方法を学び, 自身の研究を実施します。量的分析を中心に研究を行いたい人,データサイエンスにおける分析方法に興味関心がある人に向いています。社会統計の基礎知識を学ぶ分析特殊研究Ⅰ(社会関係の調査法)と、スクレイピングを学ぶ特殊研究Ⅱ(社会関係の調査法)と合同で授業を実施します。
科目目的
人間の認知の多様性と経済社会的行動との関連を中心に,社会統計の知識とテキスト分析を含むデータ分析スキルを活用して商業学分野に適用する能力を身につけます。デジタルに大量に蓄積したデータを組織文化の理解のために実践的に活用した研究をするために,本科目の目的は,(1) テキスト分析により組織文化を可視化すること,(2) 定量化した文化・意識変数を含む仮説検定の結果を論文にまとめることです。
到達目標
商業学におけるデータ分析法の専門的知識と研究力の基礎を身につけるために,この科目は以下を到達目標とします。
・自らの独創的な課題(テーマ)に関して収集したテキストデータを分析する。
・分析結果を学術論文にまとめ上げる。
授業計画と内容
1. Algorithms and Inference; The Tidy Text Format, The Web Scraping with R
はじめに 1-1, 統計学の基本 1-2,
2. Frequentist Inference; HTML As A Cornerstone Of The Internet
確率の基本 1-3. 確率分布の基本 1-4、統計モデルの基本 1-5
3. Bayesian Inference: tf-idf; First Scraping With Rvest
ベイズ推論の基本 1-6, MCMCの基本 1-7
4. Fisherian Inference & Maximum Likelihood Estimation; Sentiment Analysis with Tidy Data
Rの基本 2-1, データの要約 2-2
5. Parametric Models & Exponential Families; CSS Selectors & Developer Tools
ggplotによるデータの可視化 2-3
6. Empirical Bayes; Scraping Of Tables & Dynamic Websites
Stanの基本 2-4
7. James-Stain Estimation & Ridge Regression; Scraping Of Multi-Page Websites
MCMC結果の評価 2-5
8. Converting to & from Non-Tidy Formats; Downloading & Saving Files
Stanコーディングの詳細 2-6
9. Analyzing Word & Document Frequency; Good Practice Of Scraping
一般化線形モデルの基本 3-1
10. Relationships Between Words: n-grams & correlations; Scraping Berlin Police Reports
単回帰モデル 3-2
11. Topic Modeling; Case Study: comparing Twitter archives
モデルを用いた予測 3-3
12. Case Study: mining NASA metadata; Transformation With dplyr
デザイン行列を用いた一般化線形モデルの推定 3-4
13. Case Study: analyzing usenet text; Graphical Analysis With ggplot
brmsの使い方 3-5
14. Regular Expressions of Scraping; Student Presentation (Questionnaire & Analysis Plans)
ダミー変数と分散分析モデル 3-6
15. Generalized Linear Models & Regression Trees; ダミー変数と分散分析モデル 3-6, 正規線形モデル 3-7
16. Survival Analysis & the EM Algorithm; ポアソン回帰モデル 3-8, ロジスティック回帰モデル 3-9
17. The Jackknife and Bootstrap; 交互作用 3-10, 階層ベイズと一般化線形混合モデルの基本 4-1
18. Bootstrap Confidential Intervals; ランダム切片モデル 4-2ランダム係数モデル 4-3
19. Cross-validation & Cp Estimates of Prediction Error
時系列分析と状態空間モデルの基本 5-1
20. Objective Bayes Inference & MCMC
ローカルレベルモデル 5-2
21. Large-Scale Hypothesis Testing & FDRs
状態空間モデルによる予測と補間 5-3
22. Sparse Modeling & the Lasso
時変変数モデル5-4
23. Random Forests & Boosting
トレンドの構造 5-5
24. Neural Networks & Deep Learning
周期性のモデル化 5-6
25. Support-Vector Machines & Kernal Methods
回帰モデルとその周辺 5-7
26. Inference After Model Selection
動的一般化線形モデル: 二項分布を仮定した例 5-8
27. Empirical Bayes Estimation Strategies
動的一般化線形モデル: ポアソン分布を仮定した例 5-9
28. Final Paper Presentation (Implications)
授業時間外の学修の内容
指定したテキストやレジュメを事前に読み込むこと/授業終了後の課題提出
授業時間外の学修の内容(その他の内容等)
授業時間外の学修に必要な時間数/週
・毎週1回の授業が半期(前期または後期)または通年で完結するもの。1週間あたり4時間の学修を基本とします。
・毎週2回の授業が半期(前期または後期)で完結するもの。1週間あたり8時間の学修を基本とします。
成績評価の方法・基準
種別 | 割合(%) | 評価基準 |
---|---|---|
平常点 | 100 | 84%: 3% x 28 授業への積極的参加 16%: 学生プレゼンテーションと論文 |
成績評価の方法・基準(備考)
課題や試験のフィードバック方法
授業時間内で講評・解説の時間を設ける/授業時間に限らず、manabaでフィードバックを行う
課題や試験のフィードバック方法(その他の内容等)
アクティブ・ラーニングの実施内容
反転授業(教室の中で行う授業学習と課題などの授業外学習を入れ替えた学習形式)/プレゼンテーション/実習、フィールドワーク
アクティブ・ラーニングの実施内容(その他の内容等)
授業におけるICTの活用方法
その他
授業におけるICTの活用方法(その他の内容等)
PCによる実習、MOOC動画を教材として利用
実務経験のある教員による授業
はい
【実務経験有の場合】実務経験の内容
コンサルティング会社勤務経験あり。コンサルティングのための調査経験がある。
【実務経験有の場合】実務経験に関連する授業内容
実務経験としてフィールドワーク、集合調査、データ分析等を実施して、顧客用の報告書にまとめていた。実務経験内容と「社会関係の調査法」は関連している。
テキスト・参考文献等
【テキスト】
・武石・佐々木『はじめてのAI・データサイエンス』
・Efron & Hastie, 2021, Computer Age Statistical Inference, Student Edition -- Algorithms, Evidence, and Data Science, Cambridge, UK: Cambridge University Press.
・Julia Silge, David Robinson, 2017, Text Mining with R: A Tidy Approach
【参考文献】
・馬場真哉(2019)『RとStanではじめる ベイズ統計モデリングによるデータ分析入門』講談社
・Jakob Tures, Web Scraping using R (https://jakobtures.github.io/web-scraping/index.html)
その他特記事項
RおよびRstudioを使います。学生の希望により、Python、SPSS、Amosも使います。学生は、基本的に自分のPCを使います。ただしAmosはWindowsのみ使用可能のため、自分のPCがMacの場合には大学院事務室から貸し出しを受けます。