warudのブックマーク / 2015年1月15日

warud id:warud

2015年1月15日のブックマーク (4件)

UTF-8とUTF-16について質問です。
> つまりだいたいの日本語は > ユニコードのコードポイント値を１０進数にすると0～65535までの数値でおさめている訳ですよね？日本語，というよりも，Unicode制定当時の主要な文字コードで使われていた文字集合は，BMPに含まれます。なので，日本語に限らず，ヨーロッパ各国語等 (ISO-8859ファミリ) や韓国語，中国語なども0～65535におさまっています。 > BMPというのはUnicodeの初期における定義ですよね。はい。Unicodeの，であって，ISO/IEC 10646-1ではないです。 # ISO/IEC 10646は全く別ですし，ISO/IEC 10646-1は31bit系。 > ん？ていうことは、常に１６bit（2バイト固定長？といういのでしょうか）で符号化された規格 > UTF-16というのは非常に使えない？（用途としては？）エンコード方式となるのですかね？
warud 2015/01/15
リンク
OSXで作成されたファイルの濁点、半濁点をWindows側で解決する方法
MacOSXで保存されたファイルをWindowsXPへ持っていった場合、濁点や半濁点部分が『・』になったり、『?』になってしまいます。これはOSXのファイル名がUTF-8-MAC（NFD）で付けられており、通常のUTF-8（NFC）では、濁点、半濁点部分を解決できないことまでは、ネットで調べて分かりました。更にネットで調べると解決策なども見つけられるのですが、その殆どがOSX側での解決策で、Windows側での解決策が見つけられませんでした。濁点、半濁点が文字化けしているファイルを、Windows側で修正する方法はないのでしょうか？ C言語でファイル名をチェックして変換することも考えましたが、コード変換はやったことがなく、良く分かりませんでした。本当は『MacOSXで作成されたファイルの濁点・半濁点に関する文字化けを修正するようなWindows用ソフト』が見つかれば、問題は無いので
warud 2015/01/15
nfd,

nfc,

unicode,

utf-8,

filesystem,

hfs,

ntfs,

mac,

windows,

normalization
リンク
Mac OS XでのUTF-8とWindowsでのNFC/NFD : numa's diary
2014年03月28日 Mac OS XでのUTF-8とWindowsでのNFC/NFD MacではNormalization Formが違うというので調べてみた。資料によれば、MacのHFS Plusファイルシステムでは、ファイル名は基本的にDecomposedを使うが、一部はDecomposeしない。その範囲は次のとおり： U+2000−U+2FFF U+F900−U+FAFF U+2F800−U+2FAFF U+2000−U+2FFFは、各種記号類（としかいいようがないような、雑多な文字。丸付数字やローマ数字や罫線素片も入っている。温泉マーク♨もあれば、はぁとまあくもあるよ♡）が入っていて、U+F900−U+FAFFおよびU+2F800−U+2FAFFは互換漢字になっている。たしかに、下手な変換をするとややこしそうなところではある。注意： UnicodeのNormalization
warud 2015/01/15
リンク
IBM Index of system requirements for Notes, Domino, Domino Administrator, Domino Designer & Notes Traveler - United States
warud 2015/01/15
Notes, Domino, IBM, Lotus, prerequisite, requirements
リンク
- 2015年1月16日
- 2015年1月15日
- 2015年1月14日