自己組織化マップの応用
多次元情報の2次元可視化
コホネンの自己組織化マップ(SOM)は、そのソフトがインターネットを通して入手できることもあり、工学的応用が盛んに行われている。本書はSOMを可視化情報処理機として捉え、著者らの豊富な応用経験を基に、研究者、工場技術者、大学院生らが実験およびデータ整理で出てきた問題を可視化処理できるようになることを目的に、実践的に解説。
[2005年1月、2版2刷発行]
書籍データ
発行年月 | 1999年2月 |
判型 | A5 |
ページ数 | 184ページ |
定価 | 2,750円(税込) |
ISBNコード | 978-4-303-73230-1 |
概要
コホネンの自己組織化マップはあまりにも有名である。最初は1984年に『Self-Organization and Associated Memory』として出版され、中谷和夫先生らによる訳本が『自己組織化と連想記憶』として1993年に出版された。このときに初めて単行本としてSOM(自己組織化マップ)とLVQ(学習ベクトル量子化)の概念が整理され発表された。以後のSOMとLVQ の工学的応用は目をみはるものがある。それには、そのソフトがSOM_PAKおよびLVQ_PAKとしてコホネンの研究所よりインターネット(http://nucleus.hut.fi/nnrc/nnrc-programs.html)を通して誰でも自由に最新のバージョンが手に入るということが大いに影響している。
さて、以後のSOMおよびLVQの発展に新たに焦点を当ててコホネンは『Self-Organizing Maps』を1995年に出版した。その第9章にSOMおよびLVQの応用例が約1300件にわたる膨大な参考文献として紹介されている。我々は以前からSOMおよびLVQに興味を抱いており、SOMおよびLVQの工学的応用に焦点を当てて研究に取り組んでいる。だから、この新しい本が世に出たとき、これは研究上のバイブルだと感じ、我々のグループ全員で翻訳にかかった。およそ1年後の1996年6月に『自己組織化マップ』としてシュプリンガー・東京から出版されている。その訳者前書きにも書いたが、「動くもの、動かないもの、そして、工学はもちろん、医学、農学、さらには社会科学の領域まであらゆる分野に応用できる脳の機能を模した視覚的情報処理の決定版、関係技術者、研究者、必携の書」というのが正直、この本を訳した感想である。我々は主に、データ整理や処理に使っており、その代表例を後で紹介する。
ニューラルコンピューティングとして使われているニューラルネットワークは、ラメルハートらが導き出した階層型BP(誤差逆伝搬型)とホップフィールドが発展させた相互結合型に分かれる。コホネンのネットワークは階層型であり、そのネットワークは入力層と出力層の2層のみからなっている。動物の感覚様相の情報処理(位相マップ化)は、主として大脳皮質で行われている。脳での学習は教師なし学習である。つまり、最初(生まれたとき)にランダムに配置された脳の処理ユニットは入力(刺激)によって学習し、長時間経た後には、外界からの入力信号にうまく追随するように反応する。これをコホネンは学習アルゴリズムに活用している。
ここではSOMを可視化情報処理機として捉えた。本書は、研究者、工場技術者、さらには大学院の学生諸君が実験およびデータ整理で出てきた問題を可視化処理できることを主眼とした。
その他
<各章の内容>
第1章ではニューロコンピューティングとしてのSOMの位置づけ、さらにコホネンがSOMを思いつくまでを振り返っている。なお、本書はSOMに焦点を絞って議論するので、普通のニューロコンピューティングの入門書のようにニューロコンピューティング全体を見渡した一般的な議論はしていない。その方面に関しては他書にゆずる。
第2章ではSOMアルゴリズムを簡潔に記述するために、使用する数式は数行にとどめた。さて、まず初めてSOMに接する読者にはSOMの概念が非常に理解しにくい。そこでSOMを視覚的に理解するためのいくつかのSOMマップを用意した。
第3章ではSOMのアルゴリズムをクラスタ分類に発展させた、つまりLVQ(学習ベクトル量子化)について述べている。
続いて、第4章、第5章、第6章はSOMの化学分析データへの応用を示す。これらの結果を得るまでの裏話を少ししてみよう。ある研究会で96年に出版したコホネンのSOMの翻訳書を紹介した。国立金属材料技術研究所の吉原一紘部長がその後、昼食に立ち寄った寿司屋で、適当な紙がなかったので紙の箸袋を破り開いてその裏にいろいろなスペクトルの図を描かれ「これらがSOMで分類できないだろうか?」との提案を受けた。その方法をずっと会合からの帰り道で考えていて思い付き、得られた結果がすべて第4章に記述されている。これをラウンド・ロビンの大量データに応用したものを第5章に記述した。そして、第6章ではこの方法のもっと定量的な限界を議論した。
さらに第7章では、SOMに出力ネットワークを加味し、SOMの構成各ユニットが入力データのどれにいちばん良く分類されているか(ユニット上での入力データの頻度分布)を識別できるようにした。そして、MCP(修正対向伝搬ネットワーク)と名づけた。これは第3章のLVQとはまた別の角度からのクラスタ分類ができる。そして、この方法をガラスの用途別分類問題と人事適正配置問題に応用した。それぞれ記述されているように非常に良い結果が得られており、これからますます発展する分野である。
第8章と第9章では1次元SOMをTSP(巡回セールスマン問題)に応用した例について述べる。第8章ではSOM-TSP法の基本原理を議論した。第9章はその応用編である。これは、たとえば、工場でのプリント基板の穴開け問題に有効であり、実例を示した。さらに、TSPアルゴリズムを多次元に拡張し、より複雑な最適化問題であるプリント基盤上への電子部品素子配置問題(チップマウンター)へも応用し、非常な成功を納めた。
さて、我々は第4、5、6章での結果を、コホネンが所属しているHUT(ヘルシンキ工科大学)から発信しているSOMのソフトSOM_PAKを使用して得た。非常に使いやすく編集されており、我々の経験に基づいたその取り扱いをまとめて付録に記述した。(以上、「はじめに」より)