日本の金融理論教育をリードするシグマインベストメントスクール


menu

データサイエンス・ワークショップ(R機械学習tutorial) with DATUM STUDIO(株)

<祝日クラス>R-Studioで実践・機械学習

【開催日・全2回】 1日目:確率統計編 2017年5月4日(木・祝) 9:30-16:30
          2日目:機械学習編 2017年5月5日(金・祝) 9:30-16:30
【受講料】 86,400 円(税込)
※1日目のみ、2日目のみ受講される場合 54,000 円(税込)

ワークショップの特徴

R

EXCELでは対応が難しい大量かつ複雑なデータの処理において、統計解析フリーソフトである「R」が注目を集め、実際の業務で利用・活用する企業が増えています。それを踏まえ、弊社では、シリーズでデータサイエンス・ワークショップ「R-Studioで実践・機械学習~ 統計解析基礎から応用まで ~」を開催いたします。 1日目の確率統計編では、さまざまなビジネス行動データを効率的かつ効果的に活用するための実践的な知識と技術(基礎から応用まで)の習得を目指します。データサイエンスのためのR言語プログラミングと統計解析の基礎が身につく貴重な機会になるはずです。 2日目の機械学習編では、データに基づく意思決定を実践できるようになるための統計的機械学習の概要把握から実装までの一通りの知識と技術が身につきます。さらに、関連資料を読み解く際に重要となるキーワードも習得できる貴重な機会になります。

  • 購買履歴や仕入履歴、来店履歴、営業履歴、アンケートや閲覧履歴など、さまざまなビジネス行動データを効率的かつ効果的に活用するための実践的な知識と技術(基礎から応用まで)について、R演習を中心に、データサイエンス・ワークショップでのコーチング経験が豊富な講師2名がインタラクティブに解説します。
  • 実際のビジネスデータを使った具体的な処理を通して、受講生自らRを操作しながら、1日目では統計解析とデータ分析の基礎知識/技術やデータサイエンスのためのR言語プログラミングの基礎を、2日目は機械学習と統計解析やR言語プログラミングの応用知識/技術を実践的・体感的に理解できます。
  • R言語や確率統計ツールの使い方、R統計解析のビジネス定量分析/データサイエンスへの実装の習得、データに基づく意思決定を実践できるようトレーニングします。
  • 1日目の確率統計編では、確率統計やRについての事前知識は不要ですが、後掲「参考資料」などに事前に目を通しておくと、学習効果はアップします。
  • 2日目の機械学習編のみの受講も可能です。機械学習についての事前知識は不要ですが、同様に後掲「参考資料」などに事前に目を通しておくと、学習効果はアップします。
  • ワークショップ当日の内容すべてをカバーするパワーポイント資料とR資料をテキストとして配布します。使用したRは、USBメモリ等に格納してお持ち帰りいただけます。
  • 皆様のご参加をお待ちしています。

    こんな方におすすめ

    • ビッグデータ分析、機械学習、データサイエンスに興味を持っている方
    • パターン認識やベイズ推定のための技術を基礎から学びたい方
    • 統計解析による機械学習の理論や手法の全体的なイメージを掴みたい方
    • データを確率的に扱うための基盤理論に興味がある方
    • 統計解析、データ解析、マーケティングリサーチ、サービス企画、定量分析、ITエンジニア、情報処理、システム、ネットワーク、信号処理、画像処理、音声処理、自然言語処理、セキュリティ(監視カメラ、警備、防犯)、異常行動検出、異常領域検出、クォンツ、金融工学、アクチュアリー、リスク管理、医療などの業務において機械学習で課題を抱えている方

    実施スケジュール

    日 程 ※全2回
    ※開始時刻の30分前より、入場できます。
    1. 1確率統計編=2017年 5月 4日(木・祝) 9:30~16:30
    2. 2機械学習編=2017年 5月 5日(金・祝) 9:30~16:30
    定 員 25名
    (先着順。定員を超えた場合、お申込順で締め切らせて頂きます)
    会 場 シグマベイスキャピタル株式会社 教室
    東京都中央区日本橋茅場町2-9-8 茅場町第2平和ビル 3階
    アクセス 東京メトロ 東西線・日比谷線「茅場町」駅下車 2番出口より徒歩1分
    東京メトロ 日比谷線「八丁堀」駅 徒歩4分
    東京メトロ 銀座線・東西線、都営地下鉄 浅草線「日本橋」駅 徒歩8分
    詳しい地図はこちら(新しいウィンドウが開きます)

    講師

    山南 俊章

    DATUM STUDIO 株式会社 取締役副社長

    R言語の東京コミュニティ Tokyo.R の主催者。

    2007年から大手通信企業において顧客管理データベースを利用したデータ分析業務を担当。携帯電話、スマートフォンの販売レコメンドシステムの構築や運用、顧客情報に対するデータマイニングなどのマーケティング分析業務を経験。 2016年、DATUM STUDIO(株)へ転職。大手金融企業における為替レートの動向分析や顧客取引分析、大手音楽エンターテイメント企業におけるファンクラブ会員のWEBショップの購買動向分析業務などに従事。現在、データ分析を軸にクライアントの価値向上に貢献している。


    安部 晃生

    DATUM STUDIO 株式会社CTO、国立研究開発法人 国立成育医療研究センター共同研究員

    国立成育医療研究センターにて、ゲノム・エピゲノム領域のデータ分析・研究に従事。その後、ウルシステムズ株式会社にて、機械学習を活用したシステムなど、開発の経験を積む。現在、システム開発・コンサルティング・社員教育と、データ分析を軸にクライアントの価値向上に貢献している。


    主な著書

    • 『データサイエンティスト養成読本 R活用編』(共著、技術評論社)
    • カリキュラム

      <1日目:確率統計編>
      1. データサイエンスのためのR言語入門・RStudioの基本操作

    • ・データの入出力
    • ・データハンドリング「クロス集計」
    • ・データの可視化
    • ・データの分類:2値分類、多値分類
    • ・乱数生成とモンテカルロ・シミュレーションの活用
    • 2. Rでケース演習して可視化しながら学ぶ統計分析実務

    • ・統計モデル、数値シミュレーション、乱数生成、乱数シード
    • ・確率分布:正規分布、ポアソン分布
    • ・推測統計学:標本分布、区間推定、統計的仮説検定、p値
    • ・相関分析:相関係数、共分散
    • 3. Rでケース演習しながら学ぶ多変量解析実務

    • ・単回帰分析、決定係数
    • ・重回帰分析
    • 4. Rでケース演習しながら学ぶ多変量解析実務

    • ・データサイエンスの現状
    •   データサイエンティストはどんな人で、何をしているのか?
    •   ビジネスにおけるデータ分析のフローの概要
    • ・時系列データ分析実務
        自己相関、AR/MA/ARIMA/SARIMAモデル
    • ・ビッグデータ分析実務
        統計解析使用時の注意点、クラスター分析、k-means法、決定木
    • ・機械学習実務
        分類、予測モデル、決定木を用いた回帰モデル、ランダムフォレストなど
    • <2日目:機械学習編>
      1. 機械学習のための道具

    • ・機械学習の全体像、位置付け、他の分析手法との関わり
    • ・機械学習のプロセス:ビジネスの理解~分析~施策~展開
    • ・道具としてのR言語プログラミング基礎
    • ・データの分類:2値分類、多値分類
    •   特徴選択と抽出の演習(相関分析、主成分分析PCA等)
    •   回帰分析(重回帰分析、ダミー変数の実装等)
    •   モンテカルロMC法
    •   時系列分析(プロット、自己相関関数図等)
    •   ロジスティックス回帰分析(オッズ比等)
    •   尤度・最尤推定
    •   ベイズ推定
    •   クロス集計の特徴と方法(活用場面、外れ値と欠損値の扱い方等) など
    • 2.Rでケース演習しながら学ぶ機械学習の基礎と実践

    • ・教師あり学習の考え方と実践
    •   最小2乗法
    •   サポートベクターマシンSVM(カーネル法等)
    •   ナイーブベイズ
    •   階層ベイズ
    •   マルコフ連鎖モンテカルロ法MCMC
    •   ニューラルネットワーク など
    •   演習課題:各種アルゴリズムの実装
    • ・アンサンブル学習の考え方と実践
    •   ランダムフォレスト
    •   バギング
    •   ブースティング
    • ・教師なし学習の考え方、アプローチの方法と実践
    •   クラスタリング(k-meansクラスタリング含む) など
    •   演習課題:各種アルゴリズムの実装
    • 3. 訓練データから学んだ「既知」の特徴に基づく予測モデルの実践

    • ・モデルの構築
    • ・モデルの評価
    • ・演習課題
    •   過去データを元に該当店舗における購入者の予測を行い、予測精度を示す。
    • 4.Rでケース演習しながら学ぶデータサイエンスのための機械学習基礎

    • ・ディープラーニングの実装
    • ・機械学習とデータマイニング(「未知」データの特徴の発見)
    • ・テキストマイニングのためのパターン認識と機械学習の基礎
    • ※カリキュラム内容は一部変更になる場合がありますので、あらかじめご了承ください。

      ※カリキュラム内容をカバーしたパワーポイント資料とR資料を当日配布します。

      ワークブック

      確率統計や R についての事前知識は不要ですが、下記資料に事前に目を通しておくと学習効果がアップします。

      参考サイト

    参考書籍

    「Rプログラム」

    関連ワークショップ

    受講料

    86,400 円(税込)

    <単日受講のご案内>
     本ワークショップは「1日目のみ」「2日目のみ」の受講が出来ます。
     この場合は54,000 円(税込)となります。

    【割引料金のご案内】

    お申し込み方法

    WEB申込

    下記申込みフォームに必要事項を入力し、送信してください。
    (お申し込みボタンを押すと、新しいウィンドウまたはタブが開きます。)
    お申し込みになる日程をご確認いただき、ボタンを押してください。
    送信されますと、弊社より確認メールが届きます。

    セミナー お申込み

    <祝日クラス>R-Studioで実践・機械学習 
    申し込み

    単日受講される方 お申込み

    1日目のみ受講 お申込み
    2日目のみ受講 お申込み

    お申込みに関する注意事項


    お申込みに関するお問合せ

     電話番号:03-3665-8191


    Rプログラム(事前学習用)

    
    	# 乱数シードを固定
    	set.seed(20160510)
    	# データ作成
    	date <- seq(as.Date("2016-04-01"), as.Date("2016-04-30"), by = "1 day")
    	item <- c("A", "B")
    	sale <- 100 * as.integer(c(rnorm(30, 10, 3), rnorm(30, 6, 2)))
    	data <- data.frame(
    	  Date = rep(date, times = 2),
    	  Item = rep(item, each = 30),
    	  Sale = sale
    	)
    
    	library(ggplot2)        # ggplot2
    	library(scales)         # 軸の変更など
    	library(RColorBrewer)   # カラーパレット
    
    	g <- ggplot(data, aes(x = Sale, group = Item)) +
    	   geom_histogram(aes(fill = Item), bins = 5)
    	print(g)
    
    	g <- ggplot(data, aes(x = Sale, group = Item)) +
    	   geom_density(aes(fill = Item), alpha = 0.75)
    	print(g)