電力中央研究所

報告書「電力中央研究所報告」は当研究所の研究成果を取りまとめた刊行物として、昭和28年より発行されております。 一部の報告書はPDF形式で全文をダウンロードすることができます。

※ PDFのファイルサイズが大きい場合には、ダウンロードに時間がかかる場合がございます。 ダウンロードは1回のクリックで開始しますので、ダウンロードが完了するまで、複数回のクリックはなさらないようご注意願います。

電力中央研究所 報告書(電力中央研究所報告)

報告書データベース 詳細情報


報告書番号

582008

タイトル(和文)

業務別カナ漢字変換辞書の簡単な作成法─効率的な日本語データ処理のために─

タイトル(英文)

AN ALGORITHM TO COMPILE SPECIAL-PURPOSE DICTIONARIES FOR JAPANESE INPUT METHOD BY KANA-KANJI TRANSLATION

概要 (図表や脚注は「報告書全文」に掲載しております)

近年,電気事業の事務処理の各分野において日本語データを取扱うシステムの利用が盛んになってきているが,それに伴って,日本語データを効率よく入力・整備するための技術の確立が望まれている。本報告では,ユーザにとって利用しやすいカナ漢字変換方式を考察の対象とする。そして,対象業務別の専用カナ漢字変換辞書を手軽に作成するための新しい方法を提案する。本報告で述べるカナ漢字変換辞書作成法は,日本語データに対し,再帰的にパターン照合を繰り返すことによって,頻度の多い用語,を複合語を含めて自動的に収集するものである。さらに,本方法を,当研究所の特定業務システムに必要な専用カナ漢字変換辞書作成に適用した結果を示し,具体的なデータにもとづいて,その有効性を確認する。

概要 (英文)

A VERY LARGE SET OF KANJI CHARACTERS MAKES IT DIFFICULT TO PROCESS JAPANESE DATA BY COMPUTERS. AMONG SEVERAL METHODS OF JAPANESE INPUT, KANA-KANJI TRANSLATION METHOD, WHICH AUTOMATICALLY CONVERTS SIMPLE ALPHA-NUMERIC DATA TO COMPLEX KANJI CHARACTERS, IS THE MOST CONVENIENT FOR NOVICE COMPUTER USERS.HOWEVER,THE EXISTENCE OF HOMONYMS IN JAPANESE LANGUAGE DECREASES THE EFFICIENCY OF TRANSLATION. TOIMPROVE THE EFFICIENCY,APPLICATION DEVELOPERS SHOULD PREPARE DOMAIN SPECIFIC DICTIONARIES FOR TRANSLATION. IN THIS REPORT, WE PROPOSE AN EFFECTIVE ALGORITHM TO COMPILE A SPECIFIC DICTIONARY FOR KANA-KANJI TRANSLATION. THE ALGORITHM, WHICH IS BASED ON THE IDEA OF RECURSIVE PATTERN MATCHING, ANALYZES JAPANESE TEXTS, AND AUTOMATICALLY SELECTS CANDIDATE TERMS. WE APPLIED THE ALGORITHM TO DEVELOP A USEFUL DICTIONARY FOR A JAPANESE DATA PROCESSING SYSTEM IN CRIEPI,AND THE EFFECTIVENESS OF THE ALGORITHM IS SHOWN.

報告書年度

1982

発行年月

1983/04/01

報告者

担当氏名所属

寺野 隆雄

経済研究所情報システム部システム開発研究室

キーワード

和文英文
日本語入力方式 JAPANESE INPUT METHOD
カナ漢字変換辞書 KANJI CHARACTER
パターン照合 KEY WORD SELECTION
キーワード抽出 TRANSLATION
日本語データ処理 BUSINESS APPLICATION
Copyright (C) Central Research Institute of Electric Power Industry