タグ

encodingとUnicodeに関するk_37toのブックマーク (3)

  • シフトJIS / EUC-JPとUnicodeとの妥当な変換表: Netsphere Laboratories

    2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。 最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなければ、文字化けが発生することになる。 おかしな変換表は、これまでは、特にLinuxなどの上で動作するオープンソースソフトウェアで多く見られた。おそらく規格原理主義者が多かったためだろう。そもそも、規格どおりに変換表を作ると、実用的な変換表にはならない。しかし、最近ではまともな変換表を実装しているものも増えてきて、うまく選ぶだけでいいようになってきている。 変換表の違いをまとめたページはよく見かけるが、実際にどのような条件を満たして変換するものを選べばいいか不明なので、まとめてみた。 変換表に求めら

  • [鏡] しっぽのさきっちょ 2006年11月 -- Spiegel's Trunk ケータイ族は受動的?

    ネーミングセンス悪いなぁ, 日経。 「ITメタボリック症候群」に,ご用心! チェックリストを見る限り「ITメタボリック症候群」というよりはむしろ IT Addiction だよな。 IT 投資自体が目的化し, それをしないといけないような強迫観念に駆られる。 典型的な嗜癖行動じゃん。 ケータイ族=テレビが好きな層と考えてみる あーあ, ほらね, やっぱり「文明の衝突」もしくは「優越感ゲーム」になっちゃうんだよな。 道具なんてのは二次的なものに過ぎない。 そうでなければ日人ユーザの多くが Yahoo! Japan や楽天や mixi に安住している理由がわからないだろう。 「携帯はコミュニケーションデバイスの面が強い」と言うが, ケータイ上で行われているのがコミュニケーションかどうかも疑わしいし。 あれは単なるコネクションで互いに Keep Alive 信号を送りあってるだけでしょ。 だか

  • Unicodeは文字集合か符号化方式か : 404 Blog Not Found

    2006年11月24日12:30 カテゴリLightweight Languages Unicodeは文字集合か符号化方式か 以下は、電脳で文字を扱う場合の基礎中の基礎なのだが、肝心の記事に重大な誤りがいくつもある。 文字コード規格の基礎:ITpro そろそろ具体的な説明に入ろう。最初にはっきりさせておく必要があるのは次の点だ。一般に「文字コード」と言う場合, 文字の集合 エンコード方法 という要素がある。この二つを区別して考えることが重要だ。もちろん大きな関連はあるのだが,ごちゃごちゃのままでは「わからなく」なる大きな要因となる。ここだ。 これによると、Unicodeは明らかに「エンコード方法」であるが、これは間違い。ここで書かれているものはUCS-2という名前のUnicodeが定めるいくつかの「エンコード方法」の一つであり、しかもUTF-16によって陳腐化した方式である。 まずUnic

    Unicodeは文字集合か符号化方式か : 404 Blog Not Found
  • 1