2009年11月08日

英辞郎第四版のPDIC形式をstardict形式に変換

PDIC(辞書ソフト)でPDIC形式の英辞郎を1行テキスト形式にエクスポートすることができる。テキスト形式であれば、stardict-tools等の変換ソフトで、stardict形式にしてStardict(無料の辞書ソフト)で活用できる。しかしながら、英辞郎第四版を1行テキスト形式にエクスポートしたところ、発音記号が変換されず消えてしまった。解決せねば。。。

少し複雑だが、なんとか発音記号も変換に成功したので変換方法を記録する。

1.PDICの辞書に英辞郎を設定する。
2.発音記号のみの辞書を作成する。
  英辞郎の.dicを選択してから、辞書変換の設定ウインドウを立ち上げる。
  変換先ファイル形式 -> CSV形式
  変換先辞書 -> 適当な名前 (たとえば eijiro_stardict.csv)
  登録項目 -> 発音記号部のみマークする。
  OKをクリックして変換。
3.変換後のeijiro_stardict.csvをテキストエディターでオープンする(xyzzzyをお勧め)。ヘッダーの"pron"を"trans"に修正する(CSVの項目名を発音記号から訳語になる)。
4.修正後のeijiro_stardict.csvをPDICに"既存辞書の追加"を行う。これで、訳語のところに発音記号が表示される辞書が完成した。
5.eijiro_stardict.dicに、オリジナルの英辞郎をマージさせる。
  変換元辞書 -> オリジナルの英辞郎の.dic
  同一単語の処理 -> 改行付きで付け加える
  登録項目 -> 訳語部には必ずマークする
  OKをクリックして実行
  これで、訳語部に発音記号と訳語が表示される辞書が完成された。
6.eijiro_stardict.dicをPDIC 1行テキスト形式でエクスポートする。
  変換先ファイル形式 -> PDIC 1行テキスト形式
  変換先辞書 -> 適当な名前 (たとえば eijiro_stardict.txt)
  OKをクリックして実行
7.stardict-toolsで変換できるように、eijiro_stardict.txtをタブファイル形式の書式にする。
  テキストエディターでオープンする(xyzzzyをお勧め)。
  /// を タブ に置換する。(見出しと訳語の区切り)
  \ を \n に置換する。(改行)
  Unicode (UTF-8)でセーブする。(UTF-8はstardict-toolsの都合)
8.stardict-toolsでeijiro_stardict.txt(タブファイル)をstardict形式に変換する。
  Ubuntuにeijiro_stardict.txtを移動してから、stardict-tools/tabfileコマンドを実行する。 
  /usr/lib/stardict-tools/tabfile eijiro_stardict.txt
  。。。これらのファイルが生成される。
  eijiro_stardict.dict.dz
  eijiro_stardict.idx
  eijiro_stardict.ifo

発音記号も表示される、stardict形式の英辞郎が完成。

stardict2.jpg

参考にしたサイト
中道左派で行こう
スコスコ blog
【関連する記事】
posted by アリゾニアン at 16:43| Comment(0) | TrackBack(0) | dictionary | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。
この記事へのトラックバックURL
http://blog.seesaa.jp/tb/132344046
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。