日本の金融理論教育をリードするシグマインベストメントスクール


menu

データサイエンス・ワークショップ with DATUM STUDIO

<1日集中>Rで最先端データ分析実務1:統計解析

~ 入門から応用まで ~

【開催日】 2016年11月11日(金) 10:00~16:30
【受講料】 63,180 円(税込)

ワークショップの特徴

R EXCELでは対応が難しい大量かつ複雑なデータの処理において、統計解析フリーソフトである「R」が注目を集め、実際の業務で利用・活用する企業が増えています。それを踏まえ、弊社では、シリーズでデータサイエンス・ワークショップ「Rで最先端データ分析実務」を開催いたします。

さまざまなビジネス行動データを効率的かつ効果的に活用するための実践的な知識と技術(基礎から応用まで)に加え、機械学習などデータサイエンスのためのR言語プログラミングと統計解析の基礎が身につく貴重な機会になると思います。

  • 購買履歴や仕入履歴、来店履歴、営業履歴、アンケートや閲覧履歴など、さまざまなビジネス行動データを効率的かつ効果的に活用するための実践的な知識と技術(基礎から応用まで)について、R演習を中心に、データサイエンス・ワークショップでのコーチング経験が豊富な講師2名がインタラクティブに解説します。
  • データサイエンス実務についても解説・演習します。
  • 実際のビジネスデータを使った具体的な計算を通して、受講生自らRを操作しながら統計解析とデータ分析の基礎知識/技術やデータサイエンスのためのR言語プログラミングの基礎を実践的・体感的に理解できます。R言語や確率統計ツールの使い方、R統計解析のビジネス定量分析/データサイエンスへの実装が習得できます。
  • 確率統計やRについての事前知識は不要ですが、後掲「参考資料」などに事前に目を通しておくと、学習効果はアップします。
  • ワークショップ当日の内容すべてをカバーするパワーポイント資料とR資料をテキストとして配布します。使用したRは、USBメモリ等に格納してお持ち帰りいただけます。

皆様のご参加をお待ちしています。

こんな方におすすめ

  • 統計分析、ビッグデータ分析、データサイエンス、機械学習に興味を持っている方
  • 統計解析、データ解析、マーケティングリサーチ、サービス企画、定量分析、ITエンジニア、情報処理、システム、ネットワーク、信号処理、画像処理、音声処理、自然言語処理、セキュリティ(監視カメラ、警備、防犯)、異常行動検出、異常領域検出、クォンツ、金融工学、アクチュアリー、リスク管理、医療などの部署の新人・新規配属者の方
  • データを確率的に扱うための基盤理論に興味がある方
  • 統計検定、アクチュアリー試験、バイオインフォマティクス技術者認定試験などを受験予定の方

実施スケジュール

日 程 2016年11月11日(金) 10:00~16:30
定 員 25名
(先着順。定員を超えた場合、お申込順で締め切らせて頂きます)
会 場 シグマベイスキャピタル株式会社 教室
<事務所移転のお知らせ>
弊社は8月中旬に、下記事務所に移転いたします。
東京都中央区日本橋茅場町2-9-8 茅場町第2平和ビル 3階
アクセス 東京メトロ 東西線・日比谷線「茅場町」駅下車 2番出口より徒歩1分
東京メトロ 日比谷線「八丁堀」駅 徒歩4分
東京メトロ 銀座線・東西線、都営地下鉄 浅草線「日本橋」駅 徒歩8分

講師

講師写真

里 洋平

DATUM STUDIO 株式会社 取締役副社長

R言語の東京コミュニティ Tokyo.R の主催者。

ヤフー株式会社で、推薦ロジックや株価の予測モデル構築など分析業務を経て、株式会社ディー・エヌ・エーで大規模データマイニングやマーケティング分析業務に従事。その後、株式会社ドリコムにて、データ分析環境の構築やソーシャルゲーム、メディア、広告のデータ分析業を経て、DATUM STUDIO株式会社を設立。

books

主な著書

  • ・『データサイエンティスト養成読本 機械学習入門編』(技術評論社)
  • ・『データサイエンティスト養成読本 R活用編』(技術評論社)
  • ・『ビッグデータを活かすデータサイエンス』(東京図書)
  • ・『ビジネス活用事例で学ぶ データサイエンス入門』(ソフトバンククリエイティブ)
  • ・『データサイエンティスト養成読本』(技術評論社)
  • ・『戦略的データマイニング(Useful R)』(共立出版)
  • ・『Rではじめるビジネス統計分析』(翔泳社)
  • ・『Rパッケージガイドブック』(東京図書)

講師写真

安部 晃生

DATUM STUDIO 株式会社CTO、国立研究開発法人 国立成育医療研究センター共同研究員

国立成育医療研究センターにて、ゲノム・エピゲノム領域のデータ分析・研究に従事。その後、ウルシステムズ株式会社にて、機械学習を活用したシステムなど、開発の経験を積む。現在、システム開発・コンサルティング・社員教育と、データ分析を軸にクライアントの価値向上に貢献している。

主な著書

  • ・『データサイエンティスト養成読本 R活用編』(共著、技術評論社)

カリキュラム

1. データサイエンスのためのR言語入門・RStudioの基本操作
 ・データの入出力
 ・データハンドリング「クロス集計」
 ・データの可視化
 ・データの分類:2値分類、多値分類
 ・乱数生成とモンテカルロ・シミュレーションの活用

2. Rでケース演習して可視化しながら学ぶ統計分析実務
 ・統計モデル、数値シミュレーション、乱数生成、乱数シード
 ・確率分布:正規分布、ポアソン分布
 ・推測統計学:標本分布、区間推定、統計的仮説検定、p値
 ・相関分析:相関係数、共分散

3. Rでケース演習しながら学ぶ多変量解析実務
 ・単回帰分析、決定係数
 ・重回帰分析

4. Rでケース演習しながら学ぶ多変量解析実務
 ・データサイエンスの現状
  - データサイエンティストはどんな人で、何をしているのか?
  - ビジネスにおけるデータ分析のフローの概要
 ・時系列データ分析実務
  自己相関、AR/MA/ARIMA/SARIMAモデル
 ・ビッグデータ分析実務
  統計解析使用時の注意点、クラスター分析、k-means法、決定木
 ・機械学習実務
  分類、予測モデル、決定木を用いた回帰モデル、ランダムフォレストなど

※カリキュラム内容は一部変更になる場合がありますので、あらかじめご了承ください。

※カリキュラム内容をカバーしたパワーポイント資料とR資料を当日配布します。

ワークブック(使用テキスト、参考資料など)

確率統計や R についての事前知識は不要ですが、下記資料に事前に目を通しておくと学習効果がアップします。

事前学習用

  • ・『Rインストール手引き』(Rの事前演習用)
    受講者に事前に送信。
  • ・『Rの初歩』(R確率統計の事前学習用)
    https://oku.edu.mie-u.ac.jp/~okumura/stat/first.html
  • ・奥村晴彦(著)『Rで楽しむ統計 (Wonderful R 1)』(共立出版)
  • ・シグマインベストメントスクール「エクセルを使ったモンテカルロ・シミュレーション」
  • ・松原 望「確率論の入門基礎」(http://www.qmss.jp/prob/)
  • ・松原 望「基礎統計ワークショップ」(http://www.qmss.jp/e-stat/)
  • ・「Rプログラム」
    本講義で扱う内容の一部を掲載しておきますので試しに実行してみて下さい。ワークショップ受講前に、ここまで自力でこなしておけば、ワークショップではRで楽しく金利モデルの数理を学ぶことができます。
  • Rプログラム

参考書籍

  • ・里 洋平『データサイエンティスト養成読本 R活用編/機械学習入門編』(技術評論社)
  • ・里 洋平『ビジネス活用事例で学ぶ データサイエンス入門』(ソフトバンククリエイティブ)
  • ・酒巻隆治・里 洋平 著『ビッグデータを活かすデータサイエンス』(東京図書)
  • ・金 明哲 編・里 洋平 著『戦略的データマイニング(Useful R)』(共立出版)
  • ・里 洋平『Rではじめるビジネス統計分析』(翔泳社)
  • ・岡田 昌史、里 洋平 ほか『Rパッケージガイドブック』(東京図書)

関連セミナー

本ワークショップと12/5(月)開催の「Rで最先端データ分析実務2:機械学習」を合わせて受講すれば、最先端のデータ解析実務を2日間で効率的かつ効果的に学べます。また、10/2(日)から開催の「Rでスッキリわかる 統計検定1級・統計数理 対策講座」を合わせて受講されると統計数理をより深堀りできます。

<データサイエンスWS> Rで最先端データ分析実務2:機械学習
Rでスッキリわかる 統計検定1級・統計数理 対策講座

受講料

63,180 円(税込)

【割引料金のご案内】

  • ・弊社の通学制スクール・専門科コースを終了された方、および弊社の「アクチュアリー/統計検定/証券アナリスト対策講座」を受講された方は、定価の1割引である「56,862円(税込)」で受講できます。該当する方は、お申し込みフォームの備考欄に、受講されたコース名をご記入ください。
  • ・同一法人から2名以上同時にお申込み頂いた場合、1名あたりの受講料は1割引とさせていただきます。

お申し込み方法

WEB申込

下記申込みフォームに必要事項を入力し、送信してください。
(お申し込みボタンを押すと、新しいウィンドウまたはタブが開きます。)
お申し込みになる日程をご確認いただき、ボタンを押してください。
送信されますと、弊社より確認メールが届きます。

セミナー お申込み

11月11日(金) 10:00~16:30

お申込みに関する注意事項

  • 定員になり次第、受け付けを終了いたします。
  • お申込み状況により、延期または中止になる可能性があります。
    開講前に中止の旨をご連絡しますので、ご了承ください。
    受講料をお支払い済みの方には、受講料を返金いたします。
  • セミナーの開催確定後、その旨のご連絡と併せ「受講証」「請求書(希望された方)」をメールにてお送りします。
  • お支払方法「銀行振込」でお申し込みの方には、開催確定後、受講料の請求書をお送り致しますので、所定の金額を全納してください。
    ※原則、実施日までにお振込をお願い致します。ただし、法人でお支払いの場合は、御社の「締め・支払い」規程に基づき、受講料をお振込頂ければ構いません。
  • セミナー当日は、「受講証」を必ずご持参ください。

お申込みに関するお問合せ

 電話番号:03-3665-8191

Rプログラム(事前学習用)


# 乱数シードを固定
set.seed(20160510)
# データ作成
date <- seq(as.Date("2016-04-01"), as.Date("2016-04-30"), by = "1 day")
item <- c("A", "B")
sale <- 100 * as.integer(c(rnorm(30, 10, 3), rnorm(30, 6, 2)))
data <- data.frame(
  Date = rep(date, times = 2),
  Item = rep(item, each = 30),
  Sale = sale
)

library(ggplot2)        # ggplot2
library(scales)         # 軸の変更など
library(RColorBrewer)   # カラーパレット

g <- ggplot(data, aes(x = Sale, group = Item)) +
   geom_histogram(aes(fill = Item), bins = 5)
print(g)

g <- ggplot(data, aes(x = Sale, group = Item)) +
   geom_density(aes(fill = Item), alpha = 0.75)
print(g)