データサイエンス・ワークショップ(R機械学習tutorial) with DATUM STUDIO(株)
<祝日クラス>R-Studioで実践・機械学習
【開催日・全2回】 1日目:確率統計編 2017年5月4日(木・祝) 9:30-16:30
2日目:機械学習編 2017年5月5日(金・祝) 9:30-16:30
【受講料】 86,400 円(税込)
※1日目のみ、2日目のみ受講される場合 54,000 円(税込)
MENU
ワークショップの特徴
EXCELでは対応が難しい大量かつ複雑なデータの処理において、統計解析フリーソフトである「R」が注目を集め、実際の業務で利用・活用する企業が増えています。それを踏まえ、弊社では、シリーズでデータサイエンス・ワークショップ「R-Studioで実践・機械学習~ 統計解析基礎から応用まで ~」を開催いたします。 1日目の確率統計編では、さまざまなビジネス行動データを効率的かつ効果的に活用するための実践的な知識と技術(基礎から応用まで)の習得を目指します。データサイエンスのためのR言語プログラミングと統計解析の基礎が身につく貴重な機会になるはずです。 2日目の機械学習編では、データに基づく意思決定を実践できるようになるための統計的機械学習の概要把握から実装までの一通りの知識と技術が身につきます。さらに、関連資料を読み解く際に重要となるキーワードも習得できる貴重な機会になります。
皆様のご参加をお待ちしています。
こんな方におすすめ
- ビッグデータ分析、機械学習、データサイエンスに興味を持っている方
- パターン認識やベイズ推定のための技術を基礎から学びたい方
- 統計解析による機械学習の理論や手法の全体的なイメージを掴みたい方
- データを確率的に扱うための基盤理論に興味がある方
- 統計解析、データ解析、マーケティングリサーチ、サービス企画、定量分析、ITエンジニア、情報処理、システム、ネットワーク、信号処理、画像処理、音声処理、自然言語処理、セキュリティ(監視カメラ、警備、防犯)、異常行動検出、異常領域検出、クォンツ、金融工学、アクチュアリー、リスク管理、医療などの業務において機械学習で課題を抱えている方
実施スケジュール
日 程 |
※全2回 ※開始時刻の30分前より、入場できます。
|
---|---|
定 員 |
25名 (先着順。定員を超えた場合、お申込順で締め切らせて頂きます) |
会 場 |
シグマベイスキャピタル株式会社 教室 東京都中央区日本橋茅場町2-9-8 茅場町第2平和ビル 3階 |
アクセス |
東京メトロ 東西線・日比谷線「茅場町」駅下車 2番出口より徒歩1分 東京メトロ 日比谷線「八丁堀」駅 徒歩4分 東京メトロ 銀座線・東西線、都営地下鉄 浅草線「日本橋」駅 徒歩8分 詳しい地図はこちら(新しいウィンドウが開きます) |
講師
山南 俊章
DATUM STUDIO 株式会社 取締役副社長
R言語の東京コミュニティ Tokyo.R の主催者。
2007年から大手通信企業において顧客管理データベースを利用したデータ分析業務を担当。携帯電話、スマートフォンの販売レコメンドシステムの構築や運用、顧客情報に対するデータマイニングなどのマーケティング分析業務を経験。 2016年、DATUM STUDIO(株)へ転職。大手金融企業における為替レートの動向分析や顧客取引分析、大手音楽エンターテイメント企業におけるファンクラブ会員のWEBショップの購買動向分析業務などに従事。現在、データ分析を軸にクライアントの価値向上に貢献している。
安部 晃生
DATUM STUDIO 株式会社CTO、国立研究開発法人 国立成育医療研究センター共同研究員
国立成育医療研究センターにて、ゲノム・エピゲノム領域のデータ分析・研究に従事。その後、ウルシステムズ株式会社にて、機械学習を活用したシステムなど、開発の経験を積む。現在、システム開発・コンサルティング・社員教育と、データ分析を軸にクライアントの価値向上に貢献している。
主な著書
- 『データサイエンティスト養成読本 R活用編』(共著、技術評論社)
- ・データの入出力
- ・データハンドリング「クロス集計」
- ・データの可視化
- ・データの分類:2値分類、多値分類
- ・乱数生成とモンテカルロ・シミュレーションの活用
- ・統計モデル、数値シミュレーション、乱数生成、乱数シード
- ・確率分布:正規分布、ポアソン分布
- ・推測統計学:標本分布、区間推定、統計的仮説検定、p値
- ・相関分析:相関係数、共分散
- ・単回帰分析、決定係数
- ・重回帰分析
- ・データサイエンスの現状
- データサイエンティストはどんな人で、何をしているのか?
- ビジネスにおけるデータ分析のフローの概要
-
・時系列データ分析実務
自己相関、AR/MA/ARIMA/SARIMAモデル -
・ビッグデータ分析実務
統計解析使用時の注意点、クラスター分析、k-means法、決定木 -
・機械学習実務
分類、予測モデル、決定木を用いた回帰モデル、ランダムフォレストなど - ・機械学習の全体像、位置付け、他の分析手法との関わり
- ・機械学習のプロセス:ビジネスの理解~分析~施策~展開
- ・道具としてのR言語プログラミング基礎
- ・データの分類:2値分類、多値分類
- 特徴選択と抽出の演習(相関分析、主成分分析PCA等)
- 回帰分析(重回帰分析、ダミー変数の実装等)
- モンテカルロMC法
- 時系列分析(プロット、自己相関関数図等)
- ロジスティックス回帰分析(オッズ比等)
- 尤度・最尤推定
- ベイズ推定
- クロス集計の特徴と方法(活用場面、外れ値と欠損値の扱い方等) など
- ・教師あり学習の考え方と実践
- 最小2乗法
- サポートベクターマシンSVM(カーネル法等)
- ナイーブベイズ
- 階層ベイズ
- マルコフ連鎖モンテカルロ法MCMC
- ニューラルネットワーク など
- 演習課題:各種アルゴリズムの実装
- ・アンサンブル学習の考え方と実践
- ランダムフォレスト
- バギング
- ブースティング
- ・教師なし学習の考え方、アプローチの方法と実践
- クラスタリング(k-meansクラスタリング含む) など
- 演習課題:各種アルゴリズムの実装
- ・モデルの構築
- ・モデルの評価
- ・演習課題
- 過去データを元に該当店舗における購入者の予測を行い、予測精度を示す。
- ・ディープラーニングの実装
- ・機械学習とデータマイニング(「未知」データの特徴の発見)
- ・テキストマイニングのためのパターン認識と機械学習の基礎
- シグマインベストメントスクール「エクセルを使ったモンテカルロ・シミュレーション」
- 松原 望「確率論の入門基礎」
- 松原 望「基礎統計ワークショップ」
カリキュラム
<1日目:確率統計編>
1. データサイエンスのためのR言語入門・RStudioの基本操作
2. Rでケース演習して可視化しながら学ぶ統計分析実務
3. Rでケース演習しながら学ぶ多変量解析実務
4. Rでケース演習しながら学ぶ多変量解析実務
<2日目:機械学習編>
1. 機械学習のための道具
2.Rでケース演習しながら学ぶ機械学習の基礎と実践
3. 訓練データから学んだ「既知」の特徴に基づく予測モデルの実践
4.Rでケース演習しながら学ぶデータサイエンスのための機械学習基礎
※カリキュラム内容は一部変更になる場合がありますので、あらかじめご了承ください。
※カリキュラム内容をカバーしたパワーポイント資料とR資料を当日配布します。
ワークブック
確率統計や R についての事前知識は不要ですが、下記資料に事前に目を通しておくと学習効果がアップします。
参考サイト
参考書籍
- ・里 洋平『データサイエンティスト養成読本 R活用編/機械学習入門編』(技術評論社)
- ・里 洋平『ビジネス活用事例で学ぶ データサイエンス入門』(ソフトバンククリエイティブ)
- ・酒巻隆治・里 洋平 著『ビッグデータを活かすデータサイエンス』(東京図書)
- ・金 明哲 編・里 洋平 著『戦略的データマイニング(Useful R)』(共立出版)
- ・里 洋平『Rではじめるビジネス統計分析』(翔泳社)
- ・岡田 昌史、里 洋平 ほか『Rパッケージガイドブック』(東京図書)
「Rプログラム」
-
本講義で扱う内容の一部を掲載しておきますので試しに実行してみて下さい。ワークショップ受講前に、ここまで自力でこなしておけば、ワークショップではRで楽しく確率統計の数理を学ぶことができます。
関連ワークショップ
-
統計検定2級レベルの確率統計の基礎を勉強したい方は、4/22(土)、4/29(土)開催の「GW統計検定2級基礎問題&過去問演習」を、統計検定準1級レベルの統計解析の基礎を勉強したい方は、4/29(土)、5/3(水・祝)開催の「GW統計検定準1級基礎問題&過去問演習」を、統計検定2級レベルの確率統計や統計検定準1級レベルの統計解析の基礎を勉強したい方は、「統計検定 GW完全パック(2級・準1級)」を合わせて受講されることをおすすします。
- ・弊社の「アクチュアリー1次試験対策講座」「統計検定直前対策講座」「証券アナリスト1次試験対策講座」を受講された方は、定価の2割引である「69,120 円(税込)」で受講できます。該当する方は、お申し込みフォームの備考欄に、受講されたコース名をご記入ください。
- ・弊社の通学制スクール・専門科コースを終了された方は、定価の2割引で受講できます。該当する方は、お申し込みフォームの備考欄に、受講された専門科コース名をご記入ください。
- ・同一法人から2名以上同時にお申込み頂いた場合、1名あたりの受講料は2割引とさせていただきます。
- ※単日受講の場合は割引適用外です。
- 定員になり次第、受け付けを終了いたします。
- お申込み状況により、延期または中止になる可能性があります。
開講前に中止の旨をご連絡しますので、ご了承ください。
受講料をお支払い済みの方には、受講料を返金いたします。 - セミナーの開催確定後、その旨のご連絡と併せ「受講証」「請求書(希望された方)」をメールにてお送りします。
- お支払方法「銀行振込」でお申し込みの方には、開催確定後、受講料の請求書をお送り致しますので、所定の金額を全納してください。
※原則、実施日までにお振込をお願い致します。ただし、法人でお支払いの場合は、御社の「締め・支払い」規程に基づき、受講料をお振込頂ければ構いません。 - セミナー当日は、「受講証」を必ずご持参ください。
- 開催前日および当日のキャンセルはお受けしかねます。予めご了承ください。
受講料
86,400 円(税込)
<単日受講のご案内>
本ワークショップは「1日目のみ」「2日目のみ」の受講が出来ます。
この場合は54,000 円(税込)となります。
【割引料金のご案内】
お申し込み方法
WEB申込
下記申込みフォームに必要事項を入力し、送信してください。
(お申し込みボタンを押すと、新しいウィンドウまたはタブが開きます。)
お申し込みになる日程をご確認いただき、ボタンを押してください。
送信されますと、弊社より確認メールが届きます。
セミナー お申込み
<祝日クラス>R-Studioで実践・機械学習申し込み
単日受講される方 お申込み
1日目のみ受講 お申込み 2日目のみ受講 お申込みお申込みに関する注意事項
お申込みに関するお問合せ
電話番号:03-3665-8191
Rプログラム(事前学習用)
# 乱数シードを固定
set.seed(20160510)
# データ作成
date <- seq(as.Date("2016-04-01"), as.Date("2016-04-30"), by = "1 day")
item <- c("A", "B")
sale <- 100 * as.integer(c(rnorm(30, 10, 3), rnorm(30, 6, 2)))
data <- data.frame(
Date = rep(date, times = 2),
Item = rep(item, each = 30),
Sale = sale
)
library(ggplot2) # ggplot2
library(scales) # 軸の変更など
library(RColorBrewer) # カラーパレット
g <- ggplot(data, aes(x = Sale, group = Item)) +
geom_histogram(aes(fill = Item), bins = 5)
print(g)
g <- ggplot(data, aes(x = Sale, group = Item)) +
geom_density(aes(fill = Item), alpha = 0.75)
print(g)