2014年11月、スペインのバルセロナでStrata+Hadoop Worldカンファレンスが開催されました。
このカンファレンスはO’ReillyとあのClouderaが主催する世界最大規模のBig Dataカンファレンスです。
「Hadoop World」と銘打ってますが、必ずしもHadoopプラットフォームに限ったことではなくCassandra, Storm, Spark/Shark, Drillなどのトラックもあるよ、と謳われていました。
開催場所のCCIBに到着するとStrata + Hadoop Worldの表示が出ていて、テンションがあがります(´∀`∩)↑age↑
会場内へ入ります。
自動チェックインでチェックインしてから
受付を済ませます。
さてStrata Hadoop1日目、私は9:30〜17:30までSpark Campに参加しました。
Spark CampはDatabricksのPaco Nathanがファシリテータで登壇し、ハンズ・オンでApache Sparkに触ってみよう、というものでした。
Spark Campの事前準備として、
- MacOSX, Windows, Linuxでネットワーク接続可能なノートPC
- JDK 6/7/8のインストール
- Python 2.7のインストール
が必要になります。
ハンズオンに必要なSparkのソースコード、バイナリ、テストデータは当日USBにて配布されました。
※事前にzipダウンロード可能にもなっています。
USBが会場内にまわると、早速ハンズオン開始です。
Spark Shellを起動し、USBにて配布されたデータをcollectしたりしました。
内容的にはSpark公式ドキュメントのQuick Startプラス・アルファくらいなのでSparkを使いこんでいるユーザには物足りなかったのではないかと思いました。
13:00からは休憩のランチです。
ビュッフェスタイルでした。
内容はヨーロッパらしいです。
結構並びます:(;゙゚’ω゚’):
天気が良かったので外のテラス席で頂きました。
周りの方々から普段どんな仕事をしているのか?とか、使っている言語は?とか、結構聞かれます。
つたない英語で必死に答えました。
I am Scala Programmer.
ランチが終わるとSpark Camp再開です。
後半は同じくDatabricksのHossein FalakiやAaron DavidsonによるGraphXの紹介やLive Demoが行われました。
Aaron Davidsonさんは日本で開催されたScala Matsuriにもいらっしゃっていましたよね。
Live DemoではやはりDatabricks Cloudが使用されました。
Databricks Cloudはやはり何度見てもすごいなと思います。
2015年の2月〜3月にサービス・イン予定だとのことでした。
後半はハンズオンがほとんどありません。
若干眠くなりつつ(=_=;)1日を終えました。