> つまりだいたいの日本語は > ユニコードのコードポイント値を10進数にすると0~65535までの数値でおさめている訳ですよね? 日本語,というよりも,Unicode制定当時の主要な文字コードで使われていた文字集合は,BMPに含まれます。 なので,日本語に限らず,ヨーロッパ各国語等 (ISO-8859ファミリ) や韓国語,中国語なども0~65535におさまっています。 > BMPというのはUnicodeの初期における定義ですよね。 はい。Unicodeの,であって,ISO/IEC 10646-1ではないです。 # ISO/IEC 10646は全く別ですし,ISO/IEC 10646-1は31bit系。 > ん?ていうことは、常に16bit(2バイト固定長?といういのでしょうか)で符号化された規格 > UTF-16というのは非常に使えない?(用途としては?)エンコード方式となるのですかね?
