ナンクロにはまる(3)辞書

ナンクロ用の単語辞書作成手順を以下に示します。
辞書には次の2つを使用することにしました。
(1)豚辞書(第12版)……. ①
(2)SKK辞書(SKK-JISYO.L)..②
豚辞書(第14版)が最新らしいが、現在は公開していないらしく入手できませんでした。
版を重ねている分、14版の方が単語数が多いのだろうと推測できるので、その少ない分をSKK辞書から追加しようとの作戦です。

SKK辞書を使用するに当たり、次の変更を加えています。
(1)動詞の活用形部分等は不要なため、先頭から英字単語までの全体を削除
(2)かな部分に “>” や “#” を含むものを削除
(3)拗促音「ぁぃぅぇぉっゃゅょ」を「あいうえおつやゆよ」に変換

この ①、② からcsvファイル(1フィールドの単純なプレーンテキストファイル)を作成し、sqlite3 にインポートしました。
この DB 操作には、「DB Browser(SQLite)」がお勧めです。

このデータを公開するには、著作権上問題なしとはしないので公開は控えます。
個人的にプログラミングの練習に必要な方は、コメントを残してください。
対応を検討します(2019年内のみ)。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA


This blog is kept spam free by WP-SpamFree.

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください