【書評】『ビッグデータの衝撃』(城田真琴)

LINEで送る
Pocket

 お薦めの本の紹介です。
 城田真琴さんの『ビッグデータの衝撃』です。

 

 城田真琴(しろた・まこと)さんは、ITアナリストです。
 現在、大手証券会社系の総合研究所の上級研究員として、先端テクノロジーの動向調査などを手掛けておられます。
 ITの将来予測もご専門で、以前にも「クラウド」技術の浸透することによる社会への影響を世に知らしめるなど、注目の方です。

「ビッグデータ」とは何か?

 

 城田さんが、今、注目してるキーワードは、「ビッグデータ」です。

 一般に、ビッグデータとは、「既存の一般的な技術では管理するのが困難な大量のデータ群」と定義されています。

「大量のデータ群」とは、どれくらいの情報量をいうのかというと、現状では「数十テラバイトから数ペタバイト程度」というのが大方の見解です(「テラ」は10の15乗、「ペタ」は10の18乗の意味)。
 
 ちょっと想像のつかない大きさの数字です。
 IT技術の進歩により、このような大量のデータを、同時に短時間で、処理することが可能となりました。
 今後、一度に処理できるデータの量は、更に増加していくことでしょう。

 城田さんは、上記の定義では不十分として、

「ビッグデータとは3V(Volume(量)/Variety(多様性)/Velocity(速度)という3つの頭文字から)の面で管理が困難なデータ、および、それらを蓄積・処理・分析するための技術、さらに、それらのデータを分析し、有用な意味や洞察を引き出せる人材や組織を含む包括的な概念である」

と広義的に解釈します。

スポンサーリンク

「過去の見える化」から「将来予測」へ


 なぜ、今、「ビッグデータ」なのでしょうか?
 それを理解するためには、「BI(ビジネスインテリジェンス)」の潮流との関係も理解しておく必要があります。

 BIは、これまで「過去から現在までに何が起きたのか」「なぜ、それは起きたのか」を分析し、レポーティングすること、つまり「過去、および現在の見える化」が主な目的でした。

 しかし、今後の企業活動で、より重要となるのは、「これから何が起きるのか」といった「将来予測」です。
 

 将来予測を行うためには、膨大なデータから有用なルールやパターンを発見する「データマイニング」が有用だ。「ビールを購入した人は紙おむつもあわせて購入することが多い」といった話をどこかで耳にしたことがある人は多いと思うが、ここで使われているのがデータマイニングである。
 そして、このデータマイニングを効率的に行うために使われている技術が、大量のデータから有益なルールを自動で学習する「機械学習」である。この機械学習というのは、その特性上、データが多ければ多いほどよい。すなわち「ビッグデータ」との相性がよいのである。
(中略)
 つまり、ビッグデータを活用することによって、BIの進化として現在求められている将来予測が効率的に実行できると同時に、その予測精度の向上も期待できるということになる。

  「ビッグデータの衝撃」 第1章 より  城田真琴:著  東洋経済新報社:刊

 これからの時代、変化はますます大きく、急激になります。

 国や企業が生き残るために、手に入れたい「データマイニング」による、正確な「将来予測」。
 その大元の情報源が、「ビッグデータ」だということです。

グーグルにおけるビッグデータ活用例


 すでに一部の国際的な大企業では、「ビッグデータ」を利用した情報分析が、企業戦略の大きな武器となっています。
 ここでは、「グーグル」における活用例を紹介します。

 城田さんは、情報戦略におけるグーグルの凄さを、以下のように述べています。

 グーグルの凄さは検索ログというユーザーからしてみれば不要な「データ廃棄物」から、「もしかして」機能や「手書き入力」機能、「グーグル翻訳」「音声検索」など価値あるサービスを次々と生み出している点にある。これらの機能・サービスに共通するのは、「統計的な学習手法」である。パターン認識の世界では、「より多くのデータはよりよいアルゴリズムを凌駕する」という言葉がある。この言葉の意味するところは、「新たに入力されるデータを複雑なアルゴリズムの組み合わせによって認識するのではなく、大量に蓄積された正しいデータを分析すれば、統計的にもっとも適した結果が導き出される」ということである。
(中略)
 検索エンジンはもちろんのこと、翻訳サービスにしても音声検索サービスにしても、グーグルは各種サービスを無料で提供しているが、その理由の1つは大量のサンプルデータを収集するためでもある。

  「ビッグデータの衝撃」 第3章 より  城田真琴:著  東洋経済新報社:刊

 さすが、グーグルです。

 世界中の数十億人というユーザーが残す、検索結果のログ(履歴の記録)。
 この、一見ただのゴミのように見える情報に、もっとも大きな価値がある。

 それを、かなり早い段階で気づいていたのでしょう。

 検索や翻訳などの個別のサービスを、有料化して使用料を取る。
 それよりも、無料でサービスを提供することで利用者を増やし、より多くのログを手に入れることで自らの価値を更に高めていく。

 その戦略を徹底したことが、グーグルが成功を収めてきた、一つの大きな要因です。

ニーズが高まる「データサイエンティスト」


 ビッグデータブームに沸く米国で、現在引く手あまたとなっている人材が「データサイエンティスト」と呼ばれる人たちです。

 データサイエンティストとは、蓄積された大量のデータを分析し、その結果を明瞭かつ簡潔な方法で他のメンバーに示すことができる人材のことです。

 彼らの仕事は、例えると、「数字と文字の羅列」という広大な“地下鉱山”から、「価値ある統計結果」という“金脈”を探し当てるようなものです。

 城田さんは、ほんの数年前まで、データサイエンティストは確立した職種ではなかった。しかし、瞬く間に「今後10年のIT業界において、もっとも重要な人材になる」といわれるようになってきたとして、グーグルのチーフエコノミストのハル・バリアン氏の以下の言葉を紹介しています。 

「私は次の10年で魅力的な仕事は『統計の専門家である』と言い続けている。世間は私がジョークをいっていると思うかもしれない。だけど、コンピュータ・エンジニアが1990年代の魅力的な仕事になるなんて、一体だれが予想できた?
 データを取り出す能力、データを理解する能力、データを処理する能力、データから価値を引き出す能力、データを視覚化する能力、データを人に伝える能力—―これらは次の10年できわめて重要なスキルになるだろう。それは専門家のレベルだけでなく、小学校や高校、大学といった学生の教育の段階においてもだ。なぜなら、現在われわれは基本的に自由にどこからでもデータにアクセスできる。それゆえ、優遇される希少な要素はデータを理解し、そこから価値を取り出す能力だ」

  「ビッグデータの衝撃」 第8章 より  城田真琴:著  東洋経済新報社:刊

スポンサーリンク

☆    ★    ☆    ★    ☆    ★    ☆

 ますます膨大になっていくであろう、情報の洪水。

 その中から、フィルターを掛け、組み合わせ、必要な価値ある情報だけを取り出して伝える力。
 それは、データサイエンティストに限らず、これからの社会が必要としている能力です。

 それを考えると、暗記力と計算の速さを競うような、今の日本の教育方針には、大いに疑問です。

 今求められている能力は、「データを覚える力」ではなく、「必要なデータを自分で選択して処理する力」です。
 一刻も早く、今の学習カリキュラムを変えないと、世界から完全に置いていかれます。

「ビッグデータ」が、IT技術の分野だけでなく、日本社会全体を大きく変える“衝撃”となることを期待しています。

(↓気に入ってもらえたら、下のボタンを押して頂けると嬉しいです) 
にほんブログ村 本ブログ 書評・レビューへ

 

シェアする

  • このエントリーをはてなブックマークに追加
  • 15

フォローする

コメントをどうぞ

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA