伊達要一@とうきょうDD954の書棚と雑記

伊達要一の読んだ本の紹介と書評、それと雑記

FEP辞書うぉっちゃあ(3):日本語入力システム用はてなキーワード変換辞書・ニコニコ大百科変換辞書

早いものでこの企画も第3回となりました。
そろそろアイコンでも作って目立たせますかね。

前回、前々回はこちら。

yohichidate.hatenablog.com

yohichidate.hatenablog.com

今回はnBookmark氏の提供する「日本語入力システム用はてなキーワード変換辞書・ニコニコ大百科変換辞書」です。

web-apps.nbookmark.com

これはもう、読んで字の如くはてなキーワードニコニコ大百科の情報をFEP辞書化したものです。
ただ、更新頻度が凄い。

基本的に毎日更新です

もう一度いいます。基本的に毎日更新です。

毎日0時頃(日本時間)これらのサイトをクロールして自動的に辞書データを生成しておられるようです。

その為、FEPと重複する可能性の高い郵便番号データの地名NAIST Japanese Dictionaryのデータ、それからFEP辞書に向かない以下のようなデータの排除が好みで選択出来るようになっています。

「ふりがな」が16・32文字(はてなキーワード)
    「ふりがな」の上限は16・32文字であり、文字数が足りず不正確な
    読みであることが多いため。
「ふりがな」が64文字(ニコニコ大百科)
    「ふりがな」の上限は64文字であり、文字数が足りず不正確な読み
    であることが多いため。
「ふりがな」が「キーワード」より短い
    一般的な単語で変換前より変換後の方が長くなることはないため。
「キーワード」が1文字
    内蔵辞書に登録されている可能性が高く、変換候補が上位に
    上がって変換の阻害になるため。
「キーワード」に英数字・記号が含まれる(例:えむえすあいえむいー→MS-IME)
    そのまま打った方が速いと思われるため。
「キーワード」に含まれる仮名文字が「ふりがな」に含まれていないか
順序が間違っている(例:あじゅばんど→アジュバント)
    読みが間違っている可能性が高いため。

日本語入力システム用はてなキーワード変換辞書・ニコニコ大百科変換辞書

データ量が大きいため、場合によっては不便になることも無いわけではないのですが(特に両者ともWeb上のジャーゴンに強いため、一般的な変換を求めるときにともすれば逸般的な変換が先に出てくることがままある)大抵の場合はテキスト打ちをより便利にしてくれます。
両方入れると少し微妙かもしれませんが、どちらかお好みの方を入れると宜しいかと。