電力中央研究所

報告書「電力中央研究所報告」は当研究所の研究成果を取りまとめた刊行物として、昭和28年より発行されております。 一部の報告書はPDF形式で全文をダウンロードすることができます。

※ PDFのファイルサイズが大きい場合には、ダウンロードに時間がかかる場合がございます。 ダウンロードは1回のクリックで開始しますので、ダウンロードが完了するまで、複数回のクリックはなさらないようご注意願います。

電力中央研究所 報告書(電力中央研究所報告)

報告書データベース 詳細情報


報告書番号

R99018

タイトル(和文)

蓄積文書の自動的再整理による自己組織化方式

タイトル(英文)

Self-Organization of Stored Documents with Automatic Grouping

概要 (図表や脚注は「報告書全文」に掲載しております)

社会環境の変化が激しくなるに従い、組織を柔軟に変化させる必要がある。そのような状況で、蓄積された文書を効果的に再利用するために、組織の変化に従って文書を自動的に再整理させる自己組織化が重要である。本報告書では、蓄積文書の自己組織化として、次の2つのアプローチを示す。 1.文書の利用に基づくグループ化。 2.文書の内容のみに基づくグループ化。文書の利用に基づくグループ化には、教師つき学習の手法の一つ、Support Vector Machine (SVM) が適している。SVMは、文書データのような多次元データの効率的で精度の高い分類が可能である。また、文書集合の変化に対応するために、SVMの解法として最適化問題の分割による解法を用いることが適している。文書の内容のみに基づくグループ化には、教師なし学習の手法の一つ、独立話題分析が適している。この手法によるグループは、話題で特徴付けられるため、ユーザが把握しやすいという特徴がある。こられの2つのアプローチと、それに適用する手法によって、本報告書では、蓄積文書の自己組織化のありかたを明らかにする。

概要 (英文)

Under dynamic social environment, enterprises must be more flexible. According to the change of enterprises, it is necessary to re-organize stored documents in enterprises for effective reuse.This report shows the two approaches of self-organization of stored documents: 1. Grouping according to the current use of documents. 2. Grouping only based on the contents of documents.For the first approach, Suppert Vector Machine (SVM), one of supervised machine learning methed, is suitable. SVM is well suited for the problems with high feature dimensions, dense concept and sparse instance, for example, text classification. For incremental grouping and portability, Sequential Minimal Optimization algorithm is suitable to implement the SVMs.For the second approach, Independent Topic Analysis, one of unsupervised machine learning method, is suitable. The groups composed by Independent Topic Analysis are well recognizable, because they are characterized by topics.With these two approaches and methods to apply, this report shows the architecture of the system for self-organization of stored documents.

報告書年度

1999

発行年月

2000/08

報告者

担当氏名所属

嶋田 丈裕

情報研究所

キーワード

和文英文
文書管理 Document Management
自己組織化 Self-Organization
機械学習 Machine Learning
文書からの知識発見 Knowledge Discovery in Texts
情報共有 Information Sharing
Copyright (C) Central Research Institute of Electric Power Industry