マスタリング・データマイニング
<事例編>

―CRMのアートとサイエンス―

マイケルJ.A.ベリー/ゴードン・リノフ 著
江原淳/斉藤史朗/佐藤栄作/清水聰/守口剛 共訳
A5・316頁・定価(本体3,200円+税)
ISBN4-303-73432-2
初版2002年7月発行

 概 要
本書は2000年にアメリカで発表された『Mastering Data Mining ― The Art and Science of Customer Relationship Management』の邦訳である。原著者のベイリーとリノフは我が国でも前著の『データマイニング手法』(海文堂出版、1999)で知られている。

本書は不思議な本である。なぜなら、本書を書店のどの棚に置くべきなのかよくわからないからである。コンピュータサイエンス、マーケティング、経営、あるいはIT関連であろうか。そのどこに置かれてもおかしくはない。これは、さまざまな分野の重なり合うところで発展してきたデータマイニングの宿命であろう。

本書は現在、日本で出版されている他のデータマイニングの本と異なり、データマイニングをビジネスに利用するという観点から書かれている。その意味で、本書は貴重である。

前著である『データマイニング手法』が発表された1997年というのはデータマイニングにとっては輝かしい年として記憶されるだろう。それまでは非常に特殊で、まさに「統計学の博士号を持っている人」でなければ不可能だったことが、市販されるマイニングツールによって可能になった年であるのだから(SASのEnterprise Minerのbeta版、SGIのMineSet Ver.2.0、IBMのIntelligent Miner(市販は1998)、富士通やNECも1997年にマイニングツールの販売を開始した)。だが、我が国ではその多くが市場に必ずしも受け入れられずに、データマイニング活用は数年遅れることとなった。

先行する米国では、たとえば本書の著者のベイリーとリノフのように、すでに多くの事例をこなし、データマイニングによるソリューションをもたらすという経験を積んでいた。その経験をもとに1995年頃から著作として準備が始められていたのが前述の『データマイニング手法』である。しかし当時は、そこで使われていた多くの技術(決定木やニューラルネットワークなど)がまだあまり知られていないものであったため、著作の大半は、まさに「手法」を論じたものになっている。本書はそれを踏まえた上で、ビジネスのためのデータマイニングを直接論じた本である。

『データマイニング手法』の出版後、原著者は自分たちの会社、Data Miner社をつくって、より一層多くの事例にあたることになり、本書の事例もそうした彼らの活動の成果から選び出されたものである。前著では、事例は触れられてはいるものの、ごくわずかのページしか与えられていなかったが、本書では半分がケーススタディである。この差が、すでに米国ではデータマイニングは「目新しい技術」から「実務で運用される技術」へと発展していることの反映であるともいえよう。データマイニングはあくまで実学であり、実際に使ってみなければ、何の意味もない。実際に使ってみるためのよいガイドは、実際に活用している著者らの経験を踏まえて初めて実現できるのであり、統計学者やシステム開発者にはツールのガイドはできてもマイニング全体のガイドは不可能である。その意味で、本書のビジネス上の価値は大きい。

本書はもともとは一冊の本であるが、大部になってしまうので便宜的に「理論編」と「事例編」に分けて出版する。内容的にはそれぞれ独立に読んでも意味は通じるのであるが、両方を通読することをお薦めする。理論編で扱われた問題が事例編でより深く掘り下げられ、また、事例編における問題点や課題などを明確に理解するためには理論編での叙述が大いに参考になるであろう。(「訳者まえがき」より)
 
 各章の内容
第1章「カバンの香油やズボンプレッサーを必要とするのは誰か?」では、従来の古めかしいデータ分析が、データマイニングによって、どのように変身していくのかがわかる。また、データマイニングシステムを新たに導入することのメリットを「証明」するプロセスが示されている。マイニングによる「増益」をどのような根拠でどのような計算から求めるかなど現場に必要な点が示されている。

次の章の「誰が何を買うのか?」では、クロスセリングの分析の過程を細かく追っていくことにより、従来、このタイプの書物では「あえて問われる」ことのなかった、個々のデータをどのように扱うべきか、また、そのためにどのような技術が必要なのかという、「めんどうな」作業の一端を明らかにしてくれる。実際にデータマイニングによる分析を行う際には、マイニングツールを使うのは最後の10%程度で、後の90%近くの作業はデータの整理である。その「泥臭く」「骨の折れる」作業については実務家同士の会話で「愚痴」として語られることはあっても公にはされなかった部分であったが、この章ではそうした場面で何をすべきかということを明らかにしている。

また、通常、クロスセリングというとマーケットバスケット分析が用いられることが多いのであるが、著者らは、あえてマーケットバスケット分析を採っていない。どうしてそうなのか、また、そのかわりにどのような分析方法を採っているのか、ぜひ実際にお読みになることをお薦めする。

続いての「どうか行かないで! 無線通信事業における乗り換えモデルづくり」であるが、マイニング成功事例のデモによくある領域である。興味深いのは、そうした(多くの場合、見事な)デモの前の段階における、複雑な問題を対象にしていることである。すなわち、そもそも離れていった=乗り換えた顧客とは何のことか、顧客とは誰のことを言うのか、という根本的な問題をである。本書はそうした根本的問題を解決しない限り分析は不可能であるということ、そしてどのように解決するのかという一例を示している(たとえば、時間軸を100年とれば解約率は100%になるだろうし、時間軸を1時間と設定した場合、解約率は0%に限りなく近づくであろう)。分析対象をどう定義するかからはじめなければならないのである。IT化やe-commerceでも、顧客をどう定義するかということは不可避の課題である。

次の章「顧客への集中:遠隔通信産業における顧客行動の理解」は、大量データをどのように扱うのかということを課題としたケーススタディである。これは必然的に「並列化」(SMP(共有メモリ)ばかりでなく、クラスタリングも含めて)を必要とする(計算を始めて2週間も結果が返ってこないようなスピードでは、ビジネスには使いものにならない)。多くのデータ分析アプリケーションは、未だに32ビット対応で、純粋に64ビットで処理できるものはわずかしかない。すると、メモリ空間が4ギガに制限されてしまう。この章で扱われている通信業のトランザクションデータは、1日に数ギガにも及ぶのである。本書では、現在の環境下で巨大なデータをどのように扱うのかについての工夫が語られている。

次の「誰が何を買っているのか? スーパーマーケットの買物客を知る」では、いわゆるPOSデータの分析と、会員カードを使った個人別の消費購買データの分析が取り上げられている。この分野は我が国でも多くの研究が存在している。ここで面白いことの1つは、「可視化」=ビジュアライゼーションが問題解決にとって複雑な分析よりよほど有効である場合が存在するという指摘である。また、消費者により近いところにいる業者が、その消費者データを有効に活用することにより、単なる小売業から情報産業に転身することが可能であり、そのことは、従来の製造業と小売業の関係を根本から覆すことになるだろうという指摘は示唆に富んでいる。

次の章「不足なく、ムダなく:製造工程の改善」では印刷業の製造プロセスでのコスト改善を分析対象としている。どんなアプローチでデータマイニングが生産管理に役立つのかが詳述されているだけでなく、プロセス改善という目的ではモデルの精度が必ずしも重要とはされないという指摘も興味深い。実際の工程に応用するには精度よりもモデルの「見通しやすさ、適用しやすさ」のほうが重要であると言う。それを欠くと業務改善ができないからである。要は「手法」は使いかたが重要なのであり、データマイニングにおいてもそれぞれの手法をどのように適用すべきかは、業務全体を考慮して判断すべきだということである。

最後の「社会経済的状況:データマイニングとプライバシー」では、データマイニングの抱える社会的問題である、「プライバシーの保護」との両立の問題が取り上げられている。データマイニング、とくに本書のように分析のターゲットを顧客情報とする場合には、マイニング対象となるデータ=個人情報の管理をどのように行うのかは非常にデリケートな問題を生じうる。ただし、プライバシー問題を考える際にも、国による事情の違いを理解しておく必要がある。アメリカでは一方においては手厚いプライバシー保護を求める動きがあるが、他方、実情においては、非常に手軽にプライバシー情報を手に入れることができる。本書の中でも言及されている通り、国勢調査のデータまでが誰にでも簡単に手に入るし、さまざまな個人情報をもとにした名簿の販売は、日本におけるようなブラックマーケットの業務ではなく、公然たる業務、1つの産業となっている。このあたりの規制と個人の保護のやりかたは、不幸な過去を持つヨーロッパの国々には到底、許容できないものである。amazon.comがドイツに進出するにあたり、ドイツ国内と同じレベルの個人情報の保護が行われるのでなければ、ドイツ国民に対する営業・販売活動を許さないとした判決により、amazon.comをそのままドイツ語対応させるのでは足りず、ドイツ法人をつくらざるをえなかった。e-businessにおけるプライバシー保護をはじめ、昨今、我が国でも個人情報の取り扱いは多くの注目を集め、立法化もされているが、法的保護を厚くすればそれで済むのか、足りないとすれば何が足りないのかを考える必要があるだろう。そのためにも、現実の業務の中での問題とその解決が語られている本章は十分参考になると思われる。

以上のように、本書はビジネスでのデータマイニングについて、類例をみない貴重な経験と示唆に富んだものである。あなたのビジネスや研究に対して新しい観点を見いだすことができることを確信している。 (「訳者まえがき」より)


情報(情報一般)のページへ
トップページ
弊社へ直接ご注文の場合はこちらから