タグ

utf-8に関するtorumのブックマーク (6)

  • UTF-8で変換できない機種依存文字を置換する

    Summary UTF-8 のページから (株) や ローマ数字の I などの文字をメールで送信すると,文字化けする. 文字化けしそうな文字を,ad hoc に機種依存しない文字に変換する. ローマ数字もカッコで括るか,スペースを挿入したほうが良いかも. Source function replaceText($str){ $arr = array( /* --- 0x2100 - 0x2138 (文字種記号) --- */ // 0x2100 - 0x210F '\xE2\x84\x80' => 'a/c', '\xE2\x84\x81' => 'a/s', '\xE2\x84\x82' => 'C', '\xE2\x84\x83' => '?', '\xE2\x84\x84' => '?', '\xE2\x84\x85' => 'c/o', '\xE2\x84\x86' => 'c/u

    torum
    torum 2006/06/20
  • CGI.pm と CGI::Util::utf8_chr - naoyaのはてなダイアリー

    15. CGI::Util::utf8_chr now correctly sets the UTF8 flag on 5.006 or higher perls (fix courtesy Slaven Rezic). CGI.pm の最近のバージョンから、CGI::Util::utf8_chr という関数により、一部の入力パラメータに UTF-8 フラグが立つようになったみたいです。ざっくり見てみたところ、CGI::Util::unescape を通るときにフラグが立つらしい。 最も正しい UTF-8 の扱い方は、入力で ON、出力で binmode するなり encoding 指定するなり (参照)、ということみたいで、そういう方針でこの変更が入ったのだと思います。 でも、気付かないよなあ、これw かなり深追いして変数一個一個 Devel::Peek で Dump して、CGI->p

    CGI.pm と CGI::Util::utf8_chr - naoyaのはてなダイアリー
  • use encoding 'utf-8' & encoding::warnings: blog.bulknews.net

    use encoding 'utf-8' & encoding::warnings Perl ネタ。 XML まわりなんかを扱うときについて回る UTF-8 フラグ (Unicode フラグ)をどう落とすか的ネタがもりあがっていますねぇ。このネタは拙書の Blog Hacks でも 1 Hack さいて解説してあります。 Blog Hacks ―プロが教えるテクニック&ツール100選posted with amazlet on 05.09.30宮川 達彦 伊藤 直也 オライリー・ジャパン (2004/08/07) 売り上げランキング: 20,714 Amazon.co.jp で詳細を見る たしかに内部的に UTF-8 フラグを落としてバリバリつなげちゃえば、場当たり的に楽は楽なんだけど、内部的に Unicode フラグをもったまま処理して、最後に出力するときに落とす(encode する)と

  • 亚洲伊人色欲综合网,三级国产三级在线,亚洲婷婷五月激情综合查询,久久国产欧美日韩精品

    最懂你的优质手机视频网站,禁止未满18岁人员进入,站视频永久免费、免下载、最佳看片体验。亚洲伊人色欲综合网,三级国产三级在线,亚洲婷婷五月激情综合查询,久久国产欧美日韩精品,夜夜添夜夜添夜夜摸夜夜摸,国产精品乱码高清在线观看,欧美成人精品视频在线不卡,免费提供最火爆最优质的好电影,性感的美女波霸、迷人的午夜诱惑是您寂寞消遣的网站!

  • Shift_JIS に含まれない文字をエスケープ (Jcode.pm編)

    しかし HTML での利用においては、 最近のブラウザは &#xHHHH; 形式で Unicode のコード(UCS2)を指定すると、 クライアント側に該当フォントがあれば、表示できるようになります。 ページでは、Perl+Jcode.pm を使って その自動変換を行うパッチをご紹介します。 更新履歴 2006/11/05 - Encode::FB_XMLCREF は、Encode の特定のバージョン(2.08~2.12)で不具合が発生します。 Encode::FB_XMLCREF でなく Encode::XMLCREF を利用するように、記述を修正しました。 2005/06/20 - Jcode.pm 2.00 に合わせてパッチ適用手順を変更しました。 2005/02/18 - Perl 5.8.1以降+Jcode.pm 1.99以降に関する記述を追加しました。 2005/02/17

    torum
    torum 2005/09/30
    でもレンタルサーバーではパッチをあてられない
  • UTF-8の「〜」と「〜」 - Ogawa::Memoranda

    Posted by: Hirotaka Ogawa @ May 07, 2003 03:21 AM | Movable TypeのBookmarkletやTrackbackの文字化けを回避するためにShift_JISからUTF-8に文字コードを変換したのだが、また例によって『「~」と「〜」』問題にぶち当たった。 「~」はFULLWIDTH TILDE(U+FF5E, EFBD9E)で、「〜」はWAVE DASH(U+301C, E3809C)なのだが、Shift_JISの「~」をWindows付属のNotepadなどを用いてUTF-8形式で保存した場合には前者になるが、MeadowのMule-UCSなどを用いた場合には後者になる。 さらにPerl 5.8.0などに標準で付属しているEncode.pmを使って、 (1) perl -MEncode -ne 'print encode("utf

    torum
    torum 2005/07/18
    そうそう、これWin上では「〓」になるんだよな~…結局置換処理カマスことにしたけど
  • 1