[書評] ビッグデータ分析に巻き込まれた時に読むとよい本
今の仕事はいわゆる「戦略コンサルタント」ともう少し業務よりの「ITコンサルタント」の間のような仕事をしているのだが、やっぱり世の中で言われるようなbig dataに関する問い合わせというのは特に昨年度下半期ぐらいからかなりある。
このbig dataという言葉、世の中に積極的に広めている会社の一つに間違いなく今自分が働いている会社があるので、功罪ともにあるというのは感じるのだが、実に曖昧かつ適当な使われ方をしているんだな~と感じる。
例えばお客さんのところにいくと「上司から○○分野でbig dataを使って、何か施策を考えろと言われまして・・・・」みたいな話をされるわけだが、だいたい7割ぐらいは「それってExcelでも十分Okですね」みたいな回答をしている※1。重要なのはデータの量ではなくて、何のためにどういったデータを利用するべきか・・・ということを考える必要があるんですよ~という話をするわけだが、だいたいの場合はお客さんは満足してくれない。なぜなら上司から求められているのは、「big dataで何かをすること」であって、今の技術で出来ることをするというわけではないのだから。
ちなみにこの傾向と言うのは何もお客さん側だけではなく、社内でも見ることが出来るのが結構厄介だ。さすがに、自分がいるような部署は実際にサービスを提供するほうなのでそういったことはあんまりおこらないが、営業のようにとにかくたくさんの商品を扱う側になるとイチイチ一つ一つの商品を詳しく勉強してくる時間もないので、とりあえずbig dataといって話を持ってきたりする(そこで修正するのが、自分がいる部署の役割だったりするわけだ)。
そんな感じで猫も杓子もビッグデータ状態なIT業界なのだが、実際に何が出来て、何が出来ないか・・ということを真正面からちゃんと解説した本と言うのは意外にない。だいたいの本は、「ビッグデータで○○が出来る」系のあおり本か、テクニカルな解説を行っていて数学に慣れていない人には開いた瞬間から眠くなってしまうような本だ※2。そういった「何が出来て、何が出来ない」という話に真正面から答えようとするのが本書だ。ただし、実際の内容の半分ぐらいは「ビッグデータでなくてもできることはたくさんありますよ」という内容なので、ビッグデータ真正面からの本というわけでもない(公平のために記しておくと、著者は僕の恩人というべき方)
Amazonを見ても章立てがなかったので書きだしたのだが、これを見るとわかるとおり本書は「どうやって」を追求するよりも、「何のために」を伝えるために書かれている。そして、そのメッセージはすごくシンプルで、要約してしまえば「ビッグデータを使って、顧客と自社の関係を正しく把握しましょう」ということに他ならない。
Par1では、ビッグデータを利用する前にまず最低限、自社の理解を行おうということを言う。ここで重要なのは「本当に把握をするためには、何もビッグデータである必要はありません」ということだ。著者は経営コンサルタントの経験が長く、すらっと書き下してしまっているが、まずはデータを使うためにはそれを理解するための構造を正しくイメージする必要があるということ、を伝えている。
ちなみに、この部分は「ビジネスに限っていえばそうだよな・・」とは思うのだが、研究生活の端っこをかじったことがあるぐらいの自分からすると、未知の分野では必ずしもそういうアプローチをする必要はない、とも思っている。例えば物性科学の世界では「論理関係はまだよくわからないけど、並べてみたらパターンが浮かび上がってきたので、空いているところをめがけて研究を行う」というアプローチがあり得る。論理的な関係性を作るというのは、多くの場合においては調査のための時間を削減してくれるし、アプローチの方向性を定めてくれるのでよいのだが、一方で認知バイアスになってしまう可能性があるということには注意が必要。
Part2では、一歩進んで実際にビッグデータを利用することが出来る事例について紹介している。ここで紹介されるのは基本的な方法論で、データに二次属性を追加して分析を行うという手法なのだけれど、これは実務の世界においてはかなり役に立つ。特にデータ量が少ない場合には全データ解析を行ってもあまり意味がないので、人の手を使ってしまったほうがずっと楽。少なくとも、この本を手に取る層にとってはまずこういった手法を身につけることは重要だろう。
ちなみに、この部分もビッグデータ分析をアカデミックに行おうとすると「邪道」な方法である(著者はそのことを自覚していると思うけど)。人の手を入れて二次属性を付与してしまうと、どうしても判断にばらつきが出てしまうため、本来であれば多次元空間上で距離を参考にしたり、参照データをもってきて分類学習用のデータセットを準備してあげるほうが、よりアカデミックなアプローチではある※3。
繰り返しになるが本書は「まずビッグデータを使って何かやらなければ」となった企画部門の人が対象であって、本格的に統計解析を学びたいという人は別の本を読む必要があるし、自分のテーマにビッグデータがふさわしいかどうかを真剣に考えたいという人には、また別の参考書が必要となる。そういった「まずは何が出来るの」を考えたい人にとっては巻末に実際の事例があるというのはうれしい処で、とりあえず何か上司にレポートを出さなければいけない、という時にはここをまとめるだけでも、時間を稼ぐことができるのではないだろうか。
個人的には、このビッグデータ関連の話はデバイス側と組み合わせたり、いわゆる「モノのインターネット」と絡まないと活用できる領域は限定的なんだろうな・・と理解をしているのだが、否も応もなくこの世界に巻き込まれてしまった人には、本書のようなガイドブックがスタートを切るのに参考になるだろうと思う。
※1・・・最新のExcelは100万行を越えるデータを扱えるので、たいしてデータ量がないものに関しては十分に解析可能。
※2・・・理数系である自分にはこういう本も嬉しいのだが、なかなか実務イメージがつくような本がないというのも難点。
※3・・・とはいえ、こういう話をしだすといきなり「見た目上は」難しくなってしまうので、そんなのは蘊蓄を語りたい人だけが考えればよいのだ・・・というのが本書の眼セージだと思っている。
« [書評] 中国を学ぶためにこんな本を読んでみた2 -現指導者層の選出前後を振りかえる- | トップページ | Happy New Year 2015 (その1) »
「パソコン・インターネット」カテゴリの記事
- 大衆皆喜に関わった人間による”『ゼクシィ』のメディア史: 花嫁たちのプラットフォーム”の感想(5/5) : 大衆皆喜はなぜ撤退したのか?(2023.08.06)
- 大衆皆喜に関わった人間による”『ゼクシィ』のメディア史: 花嫁たちのプラットフォーム”の感想(4/5) : リクルートのビジネスモデルはプラットフォームか?(2023.07.14)
- 大衆皆喜に関わった人間による”『ゼクシィ』のメディア史: 花嫁たちのプラットフォーム”の感想(3/5) : 情報誌としての視点(2023.07.12)
- 大衆皆喜に関わった人間による”『ゼクシィ』のメディア史: 花嫁たちのプラットフォーム”の感想(2/5) : 編集としての視点(2023.06.20)
- 大衆皆喜に関わった人間による”『ゼクシィ』のメディア史: 花嫁たちのプラットフォーム”の感想(1/5)(2023.06.13)
「仕事」カテゴリの記事
- Amazonの人事政策と自らの仕事を結びつける「構成の巧さ」: (書評)テックラッシュ戦記 Amazonロビイストが日本を動かした方法 (その2)(2024.05.07)
- 結局は人間関係こそが命になる: (書評)テックラッシュ戦記 Amazonロビイストが日本を動かした方法 (その1)(2024.05.05)
- SNSで話題になっている『鬼時短』を読んでみた: 文化を変えないといいつつも神輿の動き方は変える必要あり(2024.03.11)
- 巨大企業は国を守るための盾となれるのか: 書評 半導体ビジネスの覇者 TSMCはなぜ世界一になれたのか?(2023.11.16)
- [書評]仮説とデータをつなぐ思考法 DATA INFORMED(田中耕比古)(2023.10.19)
「On」カテゴリの記事
- (勉強内容備忘録): Next 教科書シリーズ 国際関係論[第3版] 第II編 国際関係の現状分析(2024.05.09)
- Amazonの人事政策と自らの仕事を結びつける「構成の巧さ」: (書評)テックラッシュ戦記 Amazonロビイストが日本を動かした方法 (その2)(2024.05.07)
- 結局は人間関係こそが命になる: (書評)テックラッシュ戦記 Amazonロビイストが日本を動かした方法 (その1)(2024.05.05)
- (勉強内容備忘録): Next 教科書シリーズ 国際関係論[第3版] 第I編 序論と歴史分析(2024.04.15)
- 勉強している内容の備忘録: マンキュー経済学 マクロ経済 第11章(貨幣システム)(2024.03.14)
« [書評] 中国を学ぶためにこんな本を読んでみた2 -現指導者層の選出前後を振りかえる- | トップページ | Happy New Year 2015 (その1) »
コメント