電力中央研究所 報告書(電力中央研究所報告)
報告書データベース 詳細情報
報告書番号
R99036
タイトル(和文)
文書データベースの主要話題の発見と変化の追跡を行う文書閲覧支援システムの開発
タイトル(英文)
Development of Browsing Assistance System for finding Primary Topics and Tracking their Changes in a Document Database
概要 (図表や脚注は「報告書全文」に掲載しております)
近年の文書データベースでは、その内容が、頻繁な文書追加により、どんどん変化していく。データベース中の文書の活用を考える場合には、このようなダイナミックな変化に応じて、文書の整理方法を変えていく必要がある。さらに、どのような内容の変化が全体的に起こっているのかといった諸点を効率的に把握することが不可欠である。このため、我々は、話題の独立性という概念を導入し、データベース中の主要話題を抽出する手法「独立話題分析」を開発した。さらに、本手法による分析結果に基づいて、データベース中の各時点での主要話題に基づいて文書を整理・閲覧するWWW上の文書閲覧システムを開発した。本システムでは、話題の新規性の判定や以前の関連話題を的確に追跡することができるので、話題の時間的変化を効率的に把握することが可能となった。
概要 (英文)
Recent document databases rapidly changes their contents by frequent entries of new documents.For effective usage of stored documents in such databases, it is indispensable to change the indexing dynamically and to get hold of the current topics and the changes of topics in the database. We developed a new method 'independent topic analysis'(ITA) to extract a given number of primary topics in a document database by introducing the concept of 'independence among topics'. We also developed a WWW-based document browing system 'IT-DMS'(independent topic-based document managment system) using the ITA, which update indices of stored documents by the current topics, makes judgement of the novelity of topics and retrieve past related topics precisely. IT-DMS helps to track the changes of topics effectively.
報告書年度
1999
発行年月
2000/08
報告者
担当 | 氏名 | 所属 |
---|---|---|
主 |
篠原 靖志 |
情報研究所 |
キーワード
和文 | 英文 |
---|---|
独立成分分析 | Independent Component analysis |
文書検索 | Information retrieval |
話題追跡 | Topic tracking |
文書閲覧 | Document browsing |