いろいろ備忘録

雑記です。

英単語帳を作ってみる

欲しい単語帳を直前の記事で以下のように定義した。それぞれについて取得場所を調べて、一画面にまとめる流れになる。

  • YouGlishが表示される
  • 画像が表示される(AI生成かどうかは問わない)
  • 発音が再生される
  • 発音記号が表示される
  • 英語での説明が表示される
  • 日本語の対応する単語が表示される
  • 自動で次の単語に遷移する
  • 知っている作品での使用例が表示される

YouGlishはAPIウィジェットが提供されていた。

Javascript API

これで画像と発音の再生を代替してしまおう。画像はDALL-Eなんかでも良いと思う。

 

英語での説明についてだが、ここは選択肢が色々とあり、悩ましい。

インターネット上に辞書のCSVはいくつかあるようだ。

English Dictionary in csv format - BragitOff.com

GitHub - benjihillard/English-Dictionary-Database: a CSV of every english word, part of speech, and definition. as well as a web scraping script that generates that data for you

APIを使用する選択肢もある。これなら発音記号も一緒に取得できるが、APIのリクエスト上限の問題が出てくる。今回はこっちを使おうかな。

WordsAPI

 

次は日本語の対応する単語の取得場所だ。

こちらもインターネット上にCSVがある。

GitHub - kujirahand/EJDict: English-Japanese Dictionary data (Public Domain) EJDict-hand

たったの500円で英辞郎公式のテキストデータもダウンロード出来る。発音記号は付いていない。今回はこっちを使おう。

英辞郎 Ver.144.8(2015年3月20日版)のテキストデータ - EDP - BOOTH

ポピュラーな単語帳をベースにするなら、Quizletに落ちていることもあるだろう。

 

作品ベースでの使用例は、有名なシットコムであればKaggleに落ちていたりする。

Search | Kaggle

歌詞なら、GeniusのAPIが便利だ。

Genius API

単語表示時に全文検索するのは時間がかかるので好ましくなさそうだ。

 

作品ベースでの使用例は一旦無視して、こんな感じになりました。