Jan
16
PyData Tokyo Meetup #3 - 分散型機械学習 with PySpark
「分散型機械学習 with PySpark」をテーマにした「濃い」勉強会
Organizing : PyData Tokyo
Registration info |
参加枠 ¥1000(Pay at the door)
Standard (Lottery Finished)
運営枠(山本、柴田、池内、田中) ¥1000(Pay at the door)
Standard (Lottery Finished)
|
---|
Description
PyData Tokyoについて
企業・スタートアップ・学会等の各方面で活躍しているPythonistaの皆さんが、データ分析・機械学習関連のトピックについて深く議論、交流するためのコミュニティです。「Python+Dataを通じて、世界のPyDataエクスパートと繋がれるコミュニティを作る」ことを目標としています。
こちらのグループでメンバーを募集しています。
ディスカッショングループ
Python+Dataに関するディスカッションの場所として、Google Groupを作成しました。どなたでも参加頂けますので、勉強会外のディスカッションの場所としてご活用下さい。
PyData Tokyo Meetup #3について
第3回勉強会としてPyData Tokyo Meetup #3を開催します。今回のテーマは「分散型機械学習 with PySpark」。最近特に機械学習の分野でHadoopに代わる新しいデータ解析インフラとして激しく注目を浴びているSpark。バッチ処理/ストリーム処理の統合、迅速な開発を実現など、様々な特徴を持っています。今回はPythonを使いSparkの分析プラットフォームの構築および、MLlibを使った機械学習の実践までを第一線で活躍している二人のエンジニアに実例を交えて紹介していただきます。
アジェンダ
時間 | 内容 | スピーカー |
---|---|---|
19:00 | 開場 | |
19:30 - 19:45 | 「PyData Tokyoについて」 | PyData Tokyo 池内 孝啓 |
19:45 - 20:00 | 自己紹介 | 全員 |
20:00 - 20:50 | 「Sparkによる分散処理入門」 | 株式会社グノシー マネージャー 粟飯原 俊介さん |
20:50 - 21:00 | 休憩 | |
21:00 - 21:50 | 「Apache Spark / MLlib で始める分散型機械学習」 | soonraah |
21:50 - 22:00 | 次回勉強会について | 全員 |
22:00 - 23:00 | 懇親会 & ライトニングトーク | 全員 |
- 発表は講演25分+議論25分
発表概要
-
スピーカー:株式会社グノシー マネージャー 粟飯原 俊介さん
-
タイトル:「Sparkによる分散処理入門」
-
概要:SparkはHadoopのエコシステムの上で動くオンメモリ分散処理系です。生のHadoopやHiveでは計算の途中経過の入出力を分散FSを介して行うところをオンメモリで行う事で高速化を実現しています。本発表では、並列計算の簡単な歴史を説明した上で、他の分散処理システムとの比較を通したSparkの特徴を解説します。また実例として、Elastic MapReduce上でSparkクラスタを構築し、IPython NotebookでAmazon S3上のログの処理や機械学習フレームワークMLlibを簡単に試す方法の解説を行います。
-
スピーカー:soonraah
-
タイトル:「Apache Spark / MLlib で始める分散型機械学習」
-
概要:MLlib は Apache Sparkのフレームワーク上で動作するスケーラブルな機械学習ライブラリです。本発表では MLlib の概要や実装されているアルゴリズムについて解説した上で、実際の案件で使用している例を紹介します
参加枠について
PyData Tokyo Meetupの開催に際してお世話になっている方々の参加枠を一部優先的に確保させて頂いております。予めご了承下さい。
会場
- 株式会社デンソーアイティーラボラトリさん(地図)のセミナースペースをお借りして開催します。
- 渋谷クロスタワーのエレベータで28Fまでお越しください。
- 飲食物の持込みは可能です。
- 電源の数が限られているため、電源タップ持参のご協力をお願いします。
- 使用人数によってはWi-Fiが不安定になる可能性があります。モバイルWi-Fiルーターをお持ちの方はそちらを使用頂けると幸いです。
参加費
1000円
懇親会の飲食代として受付の際に1000円の準備をお願い致します。参加者同士の交流を重視しているため、懇親会への参加は必須とさせて頂いております。どうしても懇親会に参加できない方も、参加費としてお支払いお願い致します。
懇親会とLT
22:00から同会場で懇親会を行います。ライトニングトーク(1人5分以内)の時間を設定していますので、お気軽にご参加ください。最近やっていることや悩んでいることなど何でもありです。希望される方は参加申込みの際にテーマの記入をお願い致します。
ライブ配信及びアーカイブについて
Ustreamでのライブ配信及び、Youtubeでのアーカイブを予定しております。詳細につきましては、connpass及びTwitterにてご案内致します。
- Ustream Channel(ライブ配信): http://www.ustream.tv/channel/pydatatokyo
- Youtube Channel(アーカイブ): https://www.youtube.com/user/pydatatokyo
ご質問・ご相談
この勉強会に関するご質問等は@PyDataTokyoまでお願い致します。