タグ

UnicodeとUTF-8に関するsnobsnogのブックマーク (2)

  • 人名用漢字と文字コードの対応表

    人名用漢字と文字コード(JIS X 0213、Unicode)の対応表を、機械可読なCSV形式で用意しました。2010年の常用漢字表改定に伴う変更を反映しています。現時点では861文字を含んでいます。 文字コードとしては、JIS X 0213の面区点番号、7ビットコード(GL)、EUC-JIS-2004のコード(GR)、SJISコード(Shift_JIS-2004)、および、 ISO/IEC 10646 UCS (Unicode)の符号位置のそれぞれについて記しています。 ダウンロード: (下の3つのリンクは同一の内容で、ファイルの文字コードだけが違います) UTF-8版の人名用漢字コード表 EUC-JIS-2004版の人名用漢字コード表 Shift_JIS-2004版の人名用漢字コード表 この対応表は第3水準漢字を含んでいます。したがって、JIS第3・第4水準に対応した環境でご利用くださ

  • fudist - UTF-8 → cp932(Shift_JIS)変換表

    UTF-8にはcp932(Shift-JIS)に存在しない文字があるため、cp932(Shift_JIS)前提のシステムで使用することができないことがあります。 基的に ♥ ♠ ♦ ♣ のようにcp932(Shift_JIS)に存在しない記号は (はぁと) や外字などへ適当に変換するしかありません。 ただし実際にはcp932(Shift_JIS)でも置換可能な文字だけが問題で変換エラーになっているケースが多数あります。 ページでは文書ファイルをUTF-8からcp932(Shift-JIS)に変換するとき単純置換してさほど問題ない文字の対応表を記します。 cp932(Microsoft定義のShift_JIS) と Shift_JIS とは厳密に言うと ~ など一部の文字コードが異なります。 このためWindowsLinuxでunicode(UTF-8)へ変換した場合異なる文字コードに

  • 1