<< 20081130 雨の中、伐採...      20081128 「パソコン関... >>

2008年 11月 29日
20081129 システムユーザー辞書を作成する
 何日か前から、ユーザーシステム辞書をつくっています。日常的に「辞書登録」しているのですが、年に一度、それらを統合してユーザーシステム辞書をつくるのです。
 その方法を以下に記します。

1.ユーザーシステム辞書のチェックをはずす
① 「辞書のプロパティ」を開く。
② 「辞書/学習」タブの「システム辞書」に登録されている「ユーザーシステム辞書 xxxxxxxx」のチェックをはずす。
③ 「辞書のプロパティ」を閉じる。

2.ユーザー辞書に登録されている単語を調整し、テキストファイルとして書き出す
① 「辞書ツール」を開く。
② 「ツール」→「テキストファイルで削除」で、前回作成したテキストファイルを使って重複分を削除する。
③ 「ツール」→「一覧の出力」で、ユーザー辞書に登録されている単語を「WorkDic\output1.txt」として、書き出す。

3.「WorkDic\output1.txt」をExcelに読み込み、Excelファイルとして保存する
① 「WorkDic\output1.txt」を開き、冒頭の辞書ヘッダーを切り取り、これを「DicHeader.txt」として保存する。
② ヘッダーを取り除いた残りを上書き保存する。「WorkDic\output1.txt」は、タブ区切りのCSVファイルなので、Excelに読み込める。
③ Excelに読み込み、Excelファイル「WorkDic\output1.xls」として保存する。

4.ワークシートを作成し、データを整理する
① このページを複製(ワークシート)し、こちらを作業用として使う。
② ワークシートを「品詞」で並べ替える。
③ 違っている「品詞」を訂正し、再度並べ替える。
④ 単語の説明をできる限り書き加える。

5.ワークシートのデータを各ファイルに配分し、読み込み用テキスト(CSV)ファイルを作成する
① 「登山辞書」フォルダの「Tozan.xls」には、「登山用語」「山岳名」「動植物名」「Tozan」のシートがある。「WorkDic\output1.xls」のワークシートから登山にかかわるものを抽出して、それぞれのシートに移動する。
② 「ふりがな」で並べ替え、ダブリをチェックし、必要な修正を加える。
③ 「Tozan」シートを削除し、「登山用語」「山岳名」「動植物名」を統合して新たに「Tozan」シートを作成する。
④ 「ファイル」→「名前をつけて保存」を選択し、「ファイルの種類」を「テキスト(タブ区切り)(*.txt)」にして保存する。
⑤ 「Tozan.txt」をエディターで開き、保存しておいた辞書ヘッダーをファイルの先頭に挿入する。この時、ヘッダーと本文の間を1行空ける。
⑥ 同様に「地名辞書」フォルダの「Chimei.xls」(「地名-上越市」「上越市の施設」「地名その他」)を調整して「Chimei」シートを作成する。「JChoumei.xls」は、上越市の町名なので、そのままにしておく。
⑦ 「人名辞書」フォルダの「Jinmei.xls」(「姓名」)を調整して「Jinmei」シートを作成する。
⑧ 「一般辞書」フォルダの「Ippan.xls」(「自立語」「日本共産党」「諸団体」「行政用語」「その他」)を調整して「Ippan」シートを作成する。
⑨ 「Chimei.txt」「JChoumei.txt」「Jinmei.txt」「Ippan.txt」を作成し、ヘッダーを挿入する。

6.システム辞書を作成する
① 「辞書のプロパティ」を開き、「ユーザー辞書」の「辞書名」を「imjp10u-1.dic」に変える。
② imejpusr-1.dicが新規作成される。「辞書のプロパティ」を閉じる。
③「辞書ツール」を開く。「単語の一覧」が、空欄であることを確認する。空欄でない場合には、上記「①」に戻り、「ユーザー辞書」の「辞書名」を変える。
④ 「ツール」→「テキストファイルからの登録」で、「Tozan.txt」「Chimei.txt」「JChoumei.txt」「Jinmei.txt」「Ippan.txt」を読み込む。
⑤ 「ツール」→「システム辞書の作成」で、「WorkDic\MyDicxxxx.dic」として、ユーザーシステム辞書を作成する。
⑥ 「辞書のプロパティ」が開くので、次のデータを入力する。
  辞書名   ユーザーシステム辞書 xxxxx年版   (xxxxは作成年)
  著作権   杉本敏宏  上越市東本町5丁目1番38号
        TEL 025(524)3787  FAX 025(524)3832
        t-sugi@joetsu.ne.jp
  説明    この辞書は、ユーザー辞書に登録した単語により作成したユーザーシステム辞書です。

⑦ 「ツール」→「一覧の出力」で、ユーザー辞書に登録されている単語をMyDic.txtとして、書き出す。
⑧ 「辞書ツール」を閉じる。

7.システム辞書として登録する
① 「WorkDic\MyDicxxxx.dic」を「Data\Dic\UserDic\MyDicxxxx.dic」にコピーする。
② 「辞書のプロパティ」を開く。
③ 「システム辞書」に「D:\Data\Dic\UserDic\MyDicxxxx.dic」を登録する。
④ 「ユーザー辞書」の「辞書名」を「imjp10u.dic」に戻す。「単語の一覧」で全てを選択し、「編集」→「削除」で全てを削除し、空にする。
⑤ 「辞書のプロパティ」を閉じる。

8.作成した辞書を保存する
① 「UserDic」ディレクトリに「xxxxxxxx」(xxxxxxxxは作成年月日)ディレクトリを作成する。
② ここに、作成した辞書をコピーする。

※今回作成した辞書は、約608KB、約4500単語でした。
[PR]

by TOSHIHIRO_SUGIMOT | 2008-11-29 23:10 | ●パソコンのこと | Comments(0)

<< 20081130 雨の中、伐採...      20081128 「パソコン関... >>