最近、mrubyのIssuesを英語で書くのが厳しく、やっぱり英語は勉強しなきゃなと日々痛感しています。
勉強するにしても普通の英語とは違うので、Issueを英語で書くためにどれぐらいの単語力が必要なのか調べてみました。
GitHub上のmrubyとnodejsのIssuesをダウンロードして形態素解析をして、単語の頻度をグラフにしてみました。
ものすごく偏っていることがわかります。
ここから1000だけ切り出してみます。
これを見ると3-500でほとんど部分をカバーできそうです。固有名詞もあるからもっと少ないはず。
これをベースにして「300語で書くオープンソースの英語」とか出来ないかな?
あとは、Phrasal verbs(get into, put onみたいなヤツ) なんだけど、代表的な物を公開しているリストないかな?それもランキングできると面白そう。
なお、この単語数は形態素解析をGENIA Taggerで行ってbase formで4文字以上の単語を数えています。
トップ1000の単語はこちら。形態素解析済みのJSONはmruby.json, node.jsonです。このデータはGitHub APIでmruby/mrubyと、joyent/nodeのIssuesから生成しています。
p.s
よく「海外で仕事してるんだから英語しゃべれるでしょ?」と言われますがホントにダメです。
私の英語をプログラマに例えると、プログラムが分かってないけど「ググってコピペでアプリ作れます」 ぐらいの感じです。理解はしてないけどかろうじて動いてる感じ。なのですぐクラッシュもするし意図する通りに伝わっていない事も多い。
それでは支障を来す事が多くなったので、この記事を書いてみました。
p.s – 2
はてブのコメントで知りましたが、Zipfの法則ってあるんですね。頻度の分布がほぼ一緒。
catch
パッチとテストコードと実行結果のビフォーアフターをつけるんじゃ、だめなのかなー。
masuidrive
バグ修正などであれば、それで良い場合もあるのですが、機能変更や追加は「なぜそれが必要なのか」を求められる事が多いので。