日本の金融理論教育をリードするシグマインベストメントスクール


menu

データサイエンス・ワークショップ by 野村俊一

Rでスッキリわかる一般化線形モデル

~ 柔軟な回帰モデルの組み立て方 ~

【開催日】 2017年3月 18日(土) 11:00~16:30 (4.5時間)
【受講料】 54,000 円(税込)

ワークショップの特徴

R

 EXCELでは対応が難しい大量かつ複雑なデータの処理を行う実際の業務においては、統計解析フリーソフトRが利用・活用されています。それを踏まえ、弊社では、Rを活用したデータサイエンス・ワークショップをシリーズで開催することにしました。

 本ワークショップでは、最先端分野をコンパクトにまとめた市販書として好評の「Rで『カルマンフィルタ』:状態空間モデルによる時系列予測」の著者の野村俊一氏に、通常の回帰分析では上手くいかない様々なケースに柔軟にも対応できる統計モデリング手法として、一般化線形モデルとその拡張モデル(一般化線形混合モデル・一般化加法モデル)を紹介してもらいます。

 説明変数を並べるだけの線形モデルから脱却し、リンク関数やスプライン関数による非線形モデル、カウントデータ・2値データのモデル、交互作用・オフセット項・変量効果の導入など、自由で柔軟な発想をモデルに実現するための様々な方法について、Rへの実装方法までを含めて解説します。実際のビジネスシーン(保険設計、住宅価格分析)を想定したケーススタディを通じてリスクの定量的評価を実践していただき、皆様のキャリアアップに向けたデータ分析スキルおよびリスク管理能力の向上を目指します。


講師からのメッセージ

 「普通に回帰をしても上手くいかない、どうすればいい?」実際のデータに相対して分析していると、回帰分析に限界を感じる場面は多々あるかと思います。抱える問題は様々でも、近年発展してきた一般化線形モデル・一般化加法モデルにより多くの問題は解決できます。データ分析力の向上とキャリアアップにぜひ当講座をご活用ください。

 なお、時間によって変化する時系列データの分析を行う方には、当講座に続けて開講される「Rで『カルマンフィルタ』:時系列予測と状態空間モデル」を受講されるとさらにお役に立てると思います。

こんな方におすすめ

  • 回帰分析が上手くいかなくて困っている方
  • データサイエンス・スキル、データ分析スキルおよびリスク管理能力の向上によるキャリアアップを目指す方
  • 件数や有・無などのカウントデータ、2値データに対して回帰したい方
  • 保険料率算定など業務のため一般化線形モデルについて一通り学びたい方
  • 統計検定1級やアクチュアリー試験・損保数理科目を受験予定の方で、実務トレーニングしながら受験対策も行いたい方

皆様のご参加をお待ちしています。

実施スケジュール

日 程 ※開始時刻の30分前より、入場できます。
2017年3月18日(土) 11:00~16:30
定 員 25名
(先着順。定員を超えた場合、お申込順で締め切らせて頂きます)
会 場 シグマベイスキャピタル株式会社 教室
東京都中央区日本橋茅場町2-9-8 茅場町第2平和ビル 3階
アクセス 東京メトロ 東西線・日比谷線「茅場町」駅下車 2番出口より徒歩1分
東京メトロ 日比谷線「八丁堀」駅 徒歩4分
東京メトロ 銀座線・東西線、都営地下鉄 浅草線「日本橋」駅 徒歩8分

講師

講師写真

野村 俊一

  • 東京工業大学 情報理工学院 数理・計算科学系 助教
  • 日本アクチュアリー会正会員
  •  4年で1次試験・2次試験全科目に合格し、理事長賞受賞(2010年)
  •  損保数理、年金数理 平成19年度試験 成績優秀賞受賞(2008年)
  • 統計数理研究所 リスク解析戦略研究センター 地震予測解析プロジェクト 外来研究員
  • 慶応義塾大学大学院 システムデザイン・マネジメント研究科 研究員
  • シグマインベストメントスクール データサイエンスワークショップ/チュートリアル講師

所属学会:日本統計学会、日本行動計量学会、日本地震学会、日本地球惑星科学連合、日本オペレーションズ・リサーチ学会、日本保険・年金リスク学会


2005年東京大学工学部卒業。2007年東京大学情報理工学系研究科 修士課程 修了。2012年総合研究大学院大学複合科学研究科 博士課程 修了(博士(統計科学)「Stochastic Models and Forecast for Recurrent Earthquakes」)。株式会社 損害保険ジャパン、東京工業大学大学院 情報理工学研究科 数理・計算科学専攻 助教を経て現職。

books

主な著書・論文

  • 統計学One Point 2「カルマンフィルタ:Rを使った時系列予測と状態空間モデル」(共立出版、2016)
  • 「活断層で繰り返される地震の点過程モデルとその長期確率予測」(統計数理 第63巻 第1号、2015年6月)
  • “Space-time model for repeating earthquakes and analysis of recurrence intervals on the San Andreas Fault near Parkfield, California(with Ogata, Y. and Nadeau, R.M.)”(Journal of Geophysical Research, Vol.119, Issue9, September 2014)

カリキュラム

  • 一般化線形モデル(GLM)
     線形回帰モデルの復習
     GLMの構成要素(指数型分布族、リンク関数、交互作用、オフセット項)
     RによるGLMの組み立て方と解析方法(推定、検定、モデル選択)
     Rによる実践演習:自動車保険の料率算定を例に
  • 一般化線形混合モデル(GLMM)・一般化加法モデル(GAM)
     GLMM:過分散とは何か?(変量効果の導入)
     GAM:より柔軟な非線形モデルへ(スプライン関数の導入)
     RによるGLMM、GAMの組み立て方と解析方法
     Rによる実践演習 ~住宅価格の分析を例に~

※カリキュラム内容は一部変更になる場合がありますので、あらかじめご了承ください。

ワークブック

確率統計やRについての事前知識は不要ですが、下記資料に事前に目を通しておくと学習効果がアップします。

事前学習用

当日資料

講義資料とR演習データセット資料を当日配布します。

※R演習データセットはUSBメモリに格納してお持ち帰りいただけます。

参考書籍

  • ・久保 拓弥『データ解析のための統計モデリング入門:一般化線形モデル・階層ベイズモデル・MCMC』(2012年,岩波書店)
  • ・Simon N. Wood(2006), “Generalized Additive Models: An Introduction with R”, Chapman and Hall.
  • ・『損保数理』日本アクチュアリー会(平成23年2月改訂版)
  • ・岩沢宏和、黒田耕嗣著『損害保険数理』(2015年、日本評論社)

関連ワークショップ

受講料

54,000 円(税込)

お申し込み方法

WEB申込

下記申込みフォームに必要事項を入力し、送信してください。
(お申し込みボタンを押すと、新しいウィンドウまたはタブが開きます。)
送信されますと、弊社より確認メールが届きます。

セミナー お申込み

3月18日(土) 11:00~16:30

お申込みに関する注意事項

  • 定員になり次第、受け付けを終了いたします。
  • お申込み状況により、延期または中止になる可能性があります。
    開講前に中止の旨をご連絡しますので、ご了承ください。
    受講料をお支払い済みの方には、受講料を返金いたします。
  • セミナーの開催確定後、その旨のご連絡と併せ「受講証」「請求書(希望された方)」をメールにてお送りします。
  • お支払方法「銀行振込」でお申し込みの方には、開催確定後、受講料の請求書をお送り致しますので、所定の金額を全納してください。
    ※原則、実施日までにお振込をお願い致します。ただし、法人でお支払いの場合は、御社の「締め・支払い」規程に基づき、受講料をお振込頂ければ構いません。
  • セミナー当日は、「受講証」を必ずご持参ください。

お申込みに関するお問合せ

 電話番号:03-3665-8191


Rプログラム(事前学習用)


# 乱数シードを固定
set.seed(20160510)
# データ作成
date <- seq(as.Date("2016-04-01"), as.Date("2016-04-30"), by = "1 day")
item <- c("A", "B")
sale <- 100 * as.integer(c(rnorm(30, 10, 3), rnorm(30, 6, 2)))
data <- data.frame(
  Date = rep(date, times = 2),
  Item = rep(item, each = 30),
  Sale = sale
)

library(ggplot2)        # ggplot2
library(scales)         # 軸の変更など
library(RColorBrewer)   # カラーパレット

g <- ggplot(data, aes(x = Sale, group = Item)) +
   geom_histogram(aes(fill = Item), bins = 5)
print(g)

g <- ggplot(data, aes(x = Sale, group = Item)) +
   geom_density(aes(fill = Item), alpha = 0.75)
print(g)