.. highlightlang:: none 辞書検索ツール ============== 名前 ---- groonga辞書検索ツール 説明 ---- 様々な商用・非商用の辞書ファイルをインポートしてgroongaで検索できるようにします。 対応している辞書 ++++++++++++++++ 現状では下記の辞書に対応しています。 * EDICT EDICTは、Monash大学Jim Breen教授が提供している和英辞書です。下記から入手できます。 http://ftp.monash.edu.au/pub/nihongo/edict.gz * GENE95 GENE95は、Kurumiさん(NiftyID: GGD00145)が作成された英和辞書です。下記から入手できます。 http://www.namazu.org/~tsuchiya/sdic/data/gene95.tar.gz * 英辞郎 英辞郎は、EDPという団体によって編纂されている英和・和英辞書です。 http://www.eijiro.jp/ 書店やオンラインショップなどで購入できます。 データベースの初期化 ++++++++++++++++++++ 本ディレクトリで下記のように実行し、辞書データを格納するデータベースファイルを下記のようにして初期化します。 ./init-db.sh データベースパス名 このようにして作成したデータベースについて、様々な辞書のデータをインポートすることができます。 インポートの方法 ++++++++++++++++ * EDICT edictディレクトリ配下で以下のように実行します。 edict.gzは自動でダウンロードします。 ./edict-import.sh データベースパス名 * GENE95 gene95ディレクトリ配下で下記のように実行します。 gene95.tar.gzは自動でダウンロードします。 ./gene-import.sh データベースパス名 * 英辞郎 英辞郎に付属のPDICツールを用いてCSVファイル形式に辞書をエクスポートします。(このとき「登録項目」ですべての項目を出力するようにします) eijiroディレクトリ配下で下記のように実行します。 ./eijiro-import.sh データベースパス名 出力したCSVファイルのパス名 (英辞郎第四版で動作を確認しています)