タグ

utf8に関するlamichのブックマーク (9)

  • The UTF-8-Everywhere Manifesto

    As can be seen, UTF-16 takes about 50% more space than UTF-8 on real data, it only saves 20% for dense Asian text, and hardly competes with general purpose compression algorithms. The Chinese translation of this manifesto takes 58.8 KiB in UTF-16, and only 51.7 KiB in UTF-8. Text operations on encoded strings The popular text-based data formats (e.g. CSV, XML, HTML, JSON, RTF and source codes of c

  • 【MySQL】mysql5.5での文字コード設定 at softelメモ

    MySQL5.5+php5.3(mysqlnd)で使うときの設定メモ。 問題 MySQL5.5を導入して、MySQL5.1以前と同じように設定したら、エラーが出るんですけど! 答え ・default-character-set = utf8 などの設定をおこなうと、「default-character-setなんて設定項目知りません」と言われます。 ・サーバー側の設定([mysqld]セクション)には、次の設定をします。 character-set-server = utf8 ・mysqlコマンドを使うときに効いてくるクライアント側の設定([client]セクション)には次の設定を書いておいてOKです。 default-character-set = utf8

    【MySQL】mysql5.5での文字コード設定 at softelメモ
  • 【jQueryプラグイン】 jquery.ajaxSuggest.js を公開しました。 - すたら日記

    ※ 更新終了 ajaxComboBoxへ合流しました。 Updating is closed. This plugin was unified with "jquery.ajaxComboBox". jquery.ajaxComboBox simple mode: http://www.usamimi.info/~sutara/ajaxComboBox/#sample07 Latest version : 1.5.4 (2012/02/10) jQuery 1.7以降で動作します 目次 (Contents) → デモ、ダウンロード (Demo, Download) → 特徴 → 設置方法 → オプション → 更新履歴 デモ、ダウンロード (Demo, Download) 【デモ (Demo)】 ajaxSuggest【日語版】 (for Japanese) ajaxSuggest【英語

    【jQueryプラグイン】 jquery.ajaxSuggest.js を公開しました。 - すたら日記
  • UTF-8ファイル名対応版 Git for Windows

    お知らせ ('12/4/10) 「msysGit」「Git for Windows」v1.7.10が公開、UTF-8のファイル名に対応('12/4/10 窓の杜) ようやく家 Git for WindowsUTF-8ファイル名に対応しました。このページで公開していた UTF-8 ファイル名対応 Git for Windows はこれでお役御免となります。一応、資料としてページはここに残しておきますが、今後は家 Git for Windows をお使いください。 なお、家にはここで公開しているパッチは取り込まれていません。家のパッチは Karsteen Blees 氏によるものです。 やっている内容はここに記載した方針と少し違い、POSIX API レベルで差し替えるのではなく、mingw.c 内にある ANSI API 呼び出しを Unicode API に変更しているようで

  • Nix::WebLab: Cannot decode string with wide characters

    XML::RSS と Encode の組み合わせで以下のエラーが発生。 Cannot decode string with wide characters 最初に目にした記事がこちら。 Encode.pm ではまった なるほど。(って実は良く分かってない...) 次に見つけたのがこちら。 perl//Encode Q&A にこんなやり取りがありました。 質問: >Wide character in subroutine entry at /path/to/perl/lib/Encode.pm line 154. と言われて死にます。 Encode の bug ですか? いえ、おそらく仕様です。 このエラーが出て死ぬ原因は、 decode の入力文字列が utf8 (Wide character) 形式になっている、つまり U+0100 以上の文字が含まれていることにあります。 Enc

    lamich
    lamich 2009/02/14
    _utf8_off(STRING),_utf8_on(STRING)
  • ウェブリブログ:サービスは終了しました。

    「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧

  • JavaScriptの基礎からはじめよう - JavaScript講座

    変数は以下のように値を代入したり出力することができます。 # 変数に文字列を代入 $value = "テストです"; # 変数を出力 print $value; 【参照ページ】 変数 配列 複数の値を1つの変数で管理したい場合は、『配列』という変数が最適です。 配列を初期化する場合は、要素をカッコで囲み、各要素毎にカンマで区切ります。 @week = ('日曜', '月曜', '火曜', '水曜', '木曜', '金曜', '土曜'); 配列はインデックスを使って参照します。インデックスは 0から始まるので注意してください。たとえば1番目のデータ "日曜" を呼び出すときは、$week[0]、"月曜"なら $week[1] とします。 # 配列 @week の1番目の要素を表示 print $week[0], "\n"; > 日曜 # 配列 @week の2番目の要素を表示 print $

    lamich
    lamich 2009/01/18
  • Wide character in print at ...

    [Perl] Wide character in print atというエラーはUTF-8フラグが付いた文字列をprintしようとしているからである。なのでUTF-8フラグを取り外してからprintすればエラーがでなくなります。UTF-8フラグが付いているかどうかはutf8::is_utf8を使用すればよい。 #UTF8フラグが付いているかの確認 utf8::is_utf8では実際の文字列がUTF-8かどうかではなく、あくまでフラグがついているかどうかを確認します。そのため、UTF-8の文字列もフラグが付いていなければ上記の出力はno flagとなります。またutf8::is_utf8はuseしなくても使用できる。useすると全然違う意味あいになるので注意。 UTF-8フラグが付いていたら、encodeを使用してフラグをはずします。以下の例では$stringをutf-8に変換して出力します

    lamich
    lamich 2009/01/17
    Wide character in subroutine entry at...
  • 404 Blog Not Found:perl - Encode 入門

    2008年04月09日01:00 カテゴリLightweight Languages perl - Encode 入門 すでにOSCONでもYAPCでも、あちこちそちこちでこの基方針に関しては話したのですが、ここ 404 Blog Not Found でも改めて。 Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改め だまってコードを書けよハゲ 入り口で decode して、内部ではすべて flagged utf8 で扱い、出口で encode する。これがすべてです!とにかくこの基方針をまもっていれば幸せになれます。ここでは、EUC-JPでエンコードされたファイル中の「小飼弾」「こがいだん」「コガイダン」「Kogai Dan」を正規表現で書き換えて標準出力にEUC-JPで出力するプログラムを例にとって説明します。 decode() then encode(

    404 Blog Not Found:perl - Encode 入門
  • 1