wisdomtex mark logo

Services & Solutions


GridMiner
グリッド・データマイニングの視覚化システム



概要

近年,膨大なデータの中から規則性を発見するデータマイニングに注目が集まっています.しかしながら,対象データが大規模になれば,データマイニングを行うのに多くの処理時間が必要となります.そこで,グリッド・コンピューティングの技術を用いてデータマイニングの処理を分散して行うことで,この処理時間を短縮します.本システムは,グリッド・データマイニングシステムの稼動状況をモニタリングするとともに,発見された規則性をリアルタイムに視覚化する機能や外部ソフトウェアとの連携機能を提供します.実際に,バイオインフォマティクスの分野における酵母ゲノムの規則性に関する問題( KDD Cup 2002 )に対して本システムを適用しました.


背景/目的

グリッドを活用した大規模データベースからの知識発見に関する研究[加藤・溝口 02]では,発見されるルールが多くなる場合があり,また,分散環境に依存するシステムの不安定さという問題がありました.これらの問題を解決するためには,データマイニングの進捗および発見されたルールの視覚化が必要となります.本研究ではこれらの機能を実装したグリッド・データマイニングの視覚化システム(GridMiner)を構築します.


グリッドコンピューティング

グリッドコンピューティングとは複数の計算機を接続し,それぞれの持つ計算機資源やアプリケーションを統合することによって,仮想的な高性能計算機を作り出す技術の総称で,近年,大変注目されています.グリッドコンピューティング技術を用いることにより,ネットワーク上の計算機を集約し,必要としている計算機資源を低コストで確保することが可能になります.なお,本研究ではグリッドを実現するためのソフトウェアとして,VisualGrid[大迫・溝口 04]を利用しています.


データマイニングの視覚化概要

探索前および探索中における白い長方形の集合は探索空間を,長方形一つ一つは事例を表現しています.各事例に対してルールが発見されれば,ルールに基づく値から個々に色がつき,長方形の高さが変化します.このときの値は,発見されたルールにおける正事例・負事例の包含数等から任意に選択できます.






活用方法

GridMinerは,グリッド・データマイニングシステムの出力をもとに視覚化を行いますが,過去にデータマイニングを行った結果をもとに視覚化を行うことも可能です.データマイニングが終了した後は,ルールをあらわす長方形をマウスでダブルクリックすることにより,ルールの詳細を取得したり,同様の文字列を含むルールを検索したりすることが可能です.さらに,任意のホストに対してルールに関するデータを送信する機能も備えておりますので,任意のアプリケーションと連携して使用することも可能です.例えば発見されたたんぱく質に関するルールのデータを立体構造表示システム(D3/3D)に対して送信し,立体構造を表示させるといったことが可能になります.




発表論文

加藤久慶,山崎航,西山裕之,溝口文雄
「Grid及びクラスタ上における並列データマイニングシステムの設計」
第16回人工知能学会,2002

大迫勇哲,山崎航,西山裕之,溝口文雄
「グリッドにおけるタスク処理履歴情報に基づく計算機資源選択方式の設計」
第21回日本ソフトウェア科学会,2004

大迫勇哲,山崎航,西山裕之,溝口文雄
「Grid環境における動的なタスク優先度の生成と計算機資源の分配方式の設計と実装」
第66回情報処理学会全国大会,2004



Wisdomtex.com

Copyright WisdomTex Inc. Meguro Meguro-ku, Tokyo, Japan. All rights reserved.


| ホームへ | 新着情報 | サービス一覧 | 新聞雑誌 |
| 特許・論文 | 関連サイト |
| English Page |

株式会社ウイズダムテック