タグ

2006年11月25日のブックマーク (47件)

  • 小形克宏の「文字の海、ビットの舟」 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(7) 番外編:改正JIS X 0213とUnicodeの等価属性/正規化について(上)

    小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの 特別編24 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(7) 番外編:改正JIS X 0213とUnicodeの等価属性/正規化について(上) ■Unicodeの正規化と改正JIS X 0213の関係 今回はMac OS Xにおける改正JIS X 0213の実装を分析する予定だった。しかしこれを変更し、番外編として2回に分けUnicodeの等価属性/正規化と改正JIS X 0213についてお伝えしたいと思う。Mac OS Xについても並行して書いているので、そんなに遅れないで公開できるはずだ。どうかご了解ください。 等価属性/正規化のどこが改正JIS X 0213と関係あるのだろう? それは、これにより改正JIS X 0213のうちで、UnicodeのCJK互換漢字と対応付けられた文字が、期待通

  • プラットフォームに依存しない日本語対応

  • 【レポート】Black Hat Japan 2005 - Unicode文字によるDirectory Traversal攻撃 (1) 文字コードでフォレンジックに関係しそうな領域はそれほど広くないはずだが…… - 伊原氏 | ネット | マイコミジャーナ

    BlackHat Japan Briefings(以下BlackHat)では、セキュリティ関連の様々な話題に関するセッションが開かれたが、中には「よくもまあこんな方法を考えた」というようなものも数多い。稿ではそんなセッションの中からいくつかをピックアップしてご紹介する。 見えない文字の混入によるフォレンジック回避策 最初にご紹介するのは、ネットエージェントの伊原秀明氏による「国内のフォレンジック」。一般に英語圏では文字コードというとほとんどASCIIコードのみを意識していればいいのに対し、日語ではJIS(ISO-2022-JP)やEUC-JP、シフトJISなど多様な文字コードを意識しなければならない上、最近ではUnicodeに対応したソフトもかなり増えてきており、それを利用してフォレンジックを回避するような方法も開発されてきているという。そこで伊原氏はそれらのフォレンジック回避手法と、

  • 某日記(前期): Unicode 嫌いによる Unicode 擁護

    大阪: .加古川 103: .西脇市で乗り換え: .へそ: .谷川 113: .福知山着: .福知山から特急きのさきでワープ: .綾部 113: .東舞鶴から 125: .若狭湾の小島: .敦賀からサンダーバード: .富山にて TLR (乗らなかったけど): .富山から南下: .猪谷にて神岡鉄道おくひだ1号(乗らず): .猪谷駅舎。ここからはバス: .バス。道狭い: バラストが真新しい線路: 作業車: 国交省の応急組立橋: 線路つぶして道にしてる: 製作中: ここも線路の上に道を通してる。道路が直らない限り鉄道も復旧しない: 今日はおだやかな宮川: 鉄橋用橋脚製作中: 別の鉄橋組み立て櫓: さらに別の鉄橋の取付部製作中: 網で覆われた橋桁: .角川: 飛騨の観光には車が必要: .古川からは特急ひだ: .高山: 増結するために、古川から来た方の編成は 3 番線→ 1 番線と渡る: .今日の

  • 【レポート】Black Hat Japan 2005 - Unicode文字によるDirectory Traversal攻撃 (2) 多くのSIP関連製品は未だに1999年レベルのセキュリティに留まっている - Ejovi Nuwere氏 | ネット | マイコミジャーナル

  • JIS X 0213:2000に関する追加解説

  • 【インフォシーク】Infoseek : 楽天が運営するポータルサイト

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • XMLと文字メーリングリスト メッセージ閲覧

    Bookmarker
    Bookmarker 2006/11/25
    JIS X 0213にまつわる錯誤FAQ
  • veritas9 - コンピュータ・ネットワークにおける文字コードについて

  • Unicodeについて,もしくはUCSについて

    《愚者の後知恵》文字コード標準化に係わりを持ち始めたごく初期の論考。まあ、今にして思うと、理解の浅い面や誤解もあるけれど、これもぼくが経てきた道程の一部には違いないので、当時のまま再掲する。 今をときめくJAVAは、文字コードを表現するデータタイプとして,Unicode型をサポートしている. 他にも,マイクロソフトを中心にWindows NTにおいて,Unicodeのコードセットをベースにして,その外字拡張の様式を策定したり,文部省や通産省の外郭団体が,それぞれにUCS準拠のフォントセットを発注したりと,UnicodeとUCSを巡る議論が喧しくなっている. 今,筆者は注意深くUnicodeとUCSとを使い分けたが,この2つの言葉は,往々にして混同して使われ,また,その混同が様々な誤解を招く局面が多々ある.インターネットを中心とする情報の国際化が猛烈な勢いで進行している現在,unicod

  • Media Literacy Report1: report - 文字のデジタル化と日本人

  • UCS(ISO10646)とUnicodeの現状

    《愚者の後知恵》今は解散した電子ライブラリーコンソーシアムの機関誌のために連載していた「電子化文書規格シリーズ」の第1 回。 独立した全文データベースであれ,ネットワークを経由してアクセスするデータベースであれ,電子化されたテキストの問題を考えるとき,テキストを電子化する際用いられる文字コードを避けて通ることはできない.中でも,我々が電子ライブラリーという言葉で漠然と考えている学術文書や各国各分野の古典的な文書のアーカイブを対象とすると,文字コードの問題は,さらなる広がりを見せてくる. 今号から文字コードを中心に,電子ライブラリーの関係者を対象として,電子化文書の規格に係わる様々なトピックについての解説を試みる.対象読者の限定は難しいけれど,電子化テキストについての全くの素人ではないが情報規格の専門家でもないというレベルを想定する.すなわち,日ごろからコンピューターを通して様々な形で電子

  • ほら貝:文字コード

    1.誤解していたこと 2.小文字セットと大文字セット 3.文字包摂の問題点 1.誤解していたこと ほら貝に「文字コード問題」特設ページを開設したのは、昨年(1996年)9月のことだったが、今にして振りかえると、誤解や不適切な見方がすくなくなかった。 事実関係の間違いについては、そのつど記述を直してきたが、全般的な考え方については誤解を訂正する機会がなかったので、ここに、現時点(1997年10月)における文字コード問題の展望を書いておきたいと思う。 昨年 9月時点では、マイクロソフト社の推進するUnicode 対 坂村健氏のTRONコードという図式にとらわれ、JCS委員会(JIS原案調査委員会)は Unicode推進側と思いこんでいたが、この見方は誤りだった。 また、Unicodeの文字種の上限が 6万5千字余(16bit)で、拡張の余地がまったくないと即断したのも間違っていた。ユニコード・

  • [ruby-dev:11306] Ruby I18N

    Subject: [ruby-dev:11306] Ruby I18N From: matz@ t i . m Y i r M s o ) Date: Sun, 29 Oct 2000 00:07:09 +0900 まつもと ゆきひろです I18Nについてこんなこと考えてみました。 --- = 前提条件 * 現行のAPIを変更しない すべてのRubyプログラムが99%変更無しに動作する。ただし、 「構造体の内容を直接変更しない」などの制約が付くのはあり える。(現状でも暗黙のうちに仮定しているので) * 移植性がある 現状Rubyが動作しているすべてのプラットフォームで動作する 必要がある。外部コマンドやライブラリによる対応は仮定でき ない(よってlocaleもiconvも使えない)。 * 実行効率が悪くない I18N対応による実行速度の低下はわずかしか許容できない。具 体的には、GCやV

    Bookmarker
    Bookmarker 2006/11/25
    何時になったら trunk にマージされるんだろう…
  • 文字コード入門

    コンテンツ一覧 インデックスページ←いまここ コンピュータ上での数値の扱い コンピュータで文字を扱うには? ASCIIとJISローマ字 JIS漢字コード:JIS第一・第二水準 JIS補助漢字・第三・第四水準漢字 中国の文字コード 台湾の文字コード Unicode 大規模文字集合 参考資料(書籍) ページを作るにあたって参考にした書籍です。 川俣晶『パソコンにおける日語処理文字コードハンドブック』技術評論社 芝野耕司編『JIS漢字字典』日規格協会 漢字文献情報処理研究会編『電脳中国学』『電脳中国学II』『電脳中国学入門』好文出版 小池和夫/府川充男/直井靖/永瀬唯/『漢字問題と文字コード』 太田出版 1999 安岡孝一/素子『文字コードの世界』 東京電気大学出版局 1999 ユニコード漢字情報辞典編纂委員会編 『ユニコード漢字情報辞典』 三省堂 2000 小林/安岡/戸村/三上編 bi

  • Unicode―文字コード入門―

    Unicodeとは 多くの国でコンピュータが利用されるようになってきて、文字を扱うための仕組みである文字コードも、その国の数だけ増えていく状態であり、情報交換のために様々な不都合が生ずるようになってきました。また、企業の側でも各国個別の言語に合わせたソフトウェアを開発するためには膨大なコストが必要なため、これを解消する手段が求められるようになってきたのです。 そこでこの問題を解消すべく、IBM、MicrosoftApple等が加盟(他のメンバーについてはこちらを参照)するNGOであるUnicodeコンソーシアムが中心となって、全ての文字を16ビット(65536文字)に収録してしまおうという、野心的な多重言語文字セット規格の制定を企図していました。またそれとは別に、国際標準化機構(ISO)が、世界中の主要な文字を一括して扱う多重言語文字セット規格を開発していました。国際規格が複数制定される

  • 停止中

     当サイトは障害のため一時的に停止しています。 This site is temporarily suspended due to failure.

  • プログラムの出力メッセージの国際化について

    メッセージカタログファイルは一般にバイナリファイルであり、 OS・機種間の互換性はありません。 4.3 メッセージカタログの利用 メッセージカタログファイルをオープンするには、catopen(3)を使います。 #include <nl_types.h> nl_catd catopen (const char *name, int oflag); nameはメッセージカタログファイル名です。 oflagは0を指定します。 これは、$LANGによってlocaleを決定することを意味します。 これにより、所定のディレクトリ(または$NLSPATHで指定されたディレクトリ)でメッセージカタログファイルを検索し、オープンします。 拡張子.catが自動的に付加されるようです。 成功した場合、カタログ記述子(ファイル記述子のようなもの)を返します。 失敗した場合は、(nl_catd)-1を返します。 た

  • 従来の文字コードとUnicodeの対応に関する諸問題

    最終更新: 1998.12.20 目次 はじめに 似た文字 旧JISと新JIS ベンダー固有文字 「全角」「半角」 ASCIIとJIS X 0201ローマ文字 おわりに 余談 1. はじめに ISO/IEC 10646とUnicode(以下Unicode)は、いろいろと論議をかもしてきましたが、 すでにいろいろなところで陰に陽に使われるようになってきました。 Windows NTの内部コードがUnicodeであるのはよく知られています。 BeOSでは、内部だけでなく全面的にUnicodeが使われています。 また、Javaのchar型もUnicodeです。 しかし、とくに入出力においては、当分は従来の文字コードと共存することになります。 すなわち、意識するしないに関わらず、Unicodeと従来コードの変換が頻繁に行われます。 変換といっても、Unicodeコンソーシアムが提供しているテーブル

  • 価格比較サイト [coneco.net] コネコネット

  • ISO-IEC 2022 - Wikipedia

    ISO/IEC 2022(旧称 ISO 2022)は、 文字集合を7ビット符号または8ビット符号で表現するための技術、および 複数の文字集合を単一の文字符号化方式に含める技術 を規定するISO規格である。JISの対応規格はJIS X 0202 「情報技術-文字符号の構造及び拡張法」[1]。Ecma Internationalの対応規格はECMA-35。 ISO/IEC 2022 の符号化方式は、一般に、1文字に1バイトか2バイト以上を使う可変長の文字符号化方式である。いくつかの符号化表現がISO/IEC 2022の機構を使っている。たとえば、ISO-2022-JPは日語で広く使われている符号化表現であり、いわゆる「JISコード」というのもこれを指すことが一般的である。 コンピュータによる文字情報処理が可能になって以来、さまざまな言語のために、コンピュータ上で文字データを表現したいという要

  • 波ダッシュ・全角チルダ問題 - Wikipedia

    Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界標準規格。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 従来、各国の標準化団体あるいは各コンピュータメーカーによって独自に開発されていた個々の文字コードの間には互換性がなかった[1]。ISO/IEC 2022のように複数の文字コードを共存させる方法も考案されたが、例えば日語の漢字と中国語の漢字のように、文字が重複する短所がある。一方Unicodeは、微細な差異はあっても質的に同じ文字であれば一つの番号を当てる方針で各国・各社の文字コードの統合を図った規格である[1]。1980年代に、Starワークステーションの日語化(J-Star)などを行ったゼロックスが提唱し、マイクロソフト、Apple、IBM、サン・マイクロシステムズ、ヒ

    波ダッシュ・全角チルダ問題 - Wikipedia
  • はてな

    知りたいこと、伝えたいこと、 全部はてなで。はてなIDがあれば あなたの知的好奇心を刺激する 様々なサービスが楽しめます はてなIDを作る(無料)

    はてな
  • yukan-fuji.com - yukan fuji リソースおよび情報

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • 本当はすごい「Windowsの互換性維持」

    Microsoft Application Compatibility Toolkit 4.1」に含まれる「Compatibility Administrator」 マイクロソフトは4月26日,2週間前に出したばかりのセキュリティ更新プログラム(MS06-015,KB908531)をリリースし直した。当初のパッチを適用すると,日ヒューレット・パッカード(HP)やNVIDIAが提供するソフトウエアで不具合が発生した。マイクロソフトはこの問題に対処するために,パッチをリリースし直したのである。 MS06-015のパッチは主に,エクスプローラのセキュリティぜい弱性を修正するためのものである。ただし,パッチを適用すると,エクスプローラ上でユーザーによって起動されたプログラムを検証する「Verclsid.exe」というプログラムがOSに追加された。 このVerclsid.exeと,HPやNVID

    本当はすごい「Windowsの互換性維持」
  • マイクロソフト,新文字セット「JIS2004」への移行措置を明らかに

    マイクロソフトは5月16日,Windows Vista以降で実施される「JIS2004文字セット」への移行計画を明らかにした。文字セットの変更に伴い,新たに漢字約900文字などが表示可能になる一方で,122文字の漢字の字形が変わる。そのためマイクロソフトは移行措置として,Windows Vistaのユーザーに対して,122文字を古い字形で表示できる「旧JIS90互換MS書体」を提供する。マイクロソフトディベロップメントの阿南康宏プログラムマネージャーは「Windows VistaとWindows 2000/XPで字形を合わせたいユーザーに対応した」と説明している。 現在のWindowsWindows 98/Me/NT 4.0/2000/XP/Server 2003)に搭載されたマイクロソフト製フォント(MS Font,MS明朝やMSゴシックなど)は,「JIS90」規格の例示字体と同じ字体

    マイクロソフト,新文字セット「JIS2004」への移行措置を明らかに
  • 小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの

    Bookmarker
    Bookmarker 2006/11/25
    第2部 これが0213の特徴とその問題点 - 第3回 符号化方法編(下)
  • 小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの

    小形克宏の「文字の海、ビットの舟」 ――文字コードが私たちに問いかけるもの 第2部 これが0213の特徴とその問題点 第2回 符号化方法編(上) ●符号化方法からJIS X 0213:2000を考える 文字コードは、文字を定義する文字集合と、その符号位置を定義する符号化方法のふたつからなる。JIS X 0213:2000(以下0213と略)の文字集合については前回を参照していただくとして、もうひとつの符号化方法について要点とその問題点を整理すると、下記のようになるだろう。 *シフトJISで符号化されることを前提に収録文字数を決定 -構造としてはISO/IEC 2022の符号化方法によるもの -当は17,672文字を収録可能だが、シフトJISと日語EUCに対応させるために全 11,223文字にした *現行のJIS漢字コード(JIS X 0208:1997、以下0208と略)を土台に拡張

    Bookmarker
    Bookmarker 2006/11/25
    第2部 これが0213の特徴とその問題点 - 第2回 符号化方法編(上)
  • 文字コードの話

    稿は、1996年に筆者が大学の所属サークルの機関誌に寄稿した記事をもとに加筆訂正したものです。(最終更新 1999.7.31) 目次 はじめに 第1章 日語のコード体系 第2章 ASCIIと1バイト文字コード 第3章 JIS漢字コードとエンコーディング法 第4章 ISO 2022 第5章 ISO 2022の実例 第6章 中国語・韓国語の文字コード 第7章 ISO 10646とUnicode おわりに 参考文献 はじめに ASCIIだけで用が足りるアメリカと違って、 私たちは日語を扱わなくてはならないため、 より深く文字コードの問題と関わらざるをえません。 それでも、MS-DOS/WindowsMacを使う限りでは、 ASCIIとシフトJIS(たまにJIS)を知っていれば済みますが、 UNIXやインターネットを使い始めると、 JIS・EUC・シフトJISとさまざまな日語コードに頭を

  • jisx0213 infocenter

    わたしは――この命にかえても、“字”という魔術をおさめたい。この世の中の不思議を知りたいんです。…………神様、お願いです、わたしに教えて下さい。“字”という魔術を JISX0213 InfoCenter JIS X 0213:2000 関連データです。ご自由に(利用したり加工したり配布したりして)お使いください。データは、死にたい程度にはチェックしていますが、保証しろといわれても困ります。なにか問題があったら、earthian@tama.or.jpにメールすると直るかも。 ● allファイル(all0c23.zip,zip圧縮,944k) 全データまとめてダウンロード。といってもコード表2種にmiscファイル、この3つをまとめただけのもの。 ● miscファイル(misc0c23.zip,zip圧縮,523k) コード表以外のデータファイルをまとめてあります。 ● コード表(jisx021

  • JIS X 0213 (JIS2004) の代表的な符号化方式

    (1面の終端バイト51は、この規格の2000年版のISO-2022-JP-3では4fでした) ただし、ISO-2022-JPとの互換性のため、1面の指示には「1b 24 42」を使 うこともできます。この指示を行った状態では、規格票の附属書2表1(64ペー ジ) および追補1の附属書2表2 (追補1の20ページ)にある文字を使用することはできません〔編注: 表を自作する予定〕。使っ てはいけない文字は、JIS X 0208に無い文字、包摂規準が変更された文字が中 心です。これらの文字を表すには必ず「1b 24 28 51」の指示を使わなければ なりません。 また、ISO-2022-JP-3との互換性のため、1面の指示には「1b 24 28 4f」を 使うこともできます。このときは、追補1の附属書2表2 (追補1の20ページ)に ある文字を使用することはできません。 さらに、状態について以下

  • 日本語と文字コード

    コンピュータは主にアメリカで発達してきたため、未だにアルファベットや数字などの1バイト(7/8ビット)を基単位として扱う前提で作られているものが中心です。そのなかで日語のように多くの文字を必要とする言語は、1文字を表わすのに2バイト以上を要するため、いろいろな困難が伴います。特にインターネットを通じて様々な環境の情報を交換するにあたって、思わぬ問題に遭遇するケースが増えてきました。ここでは、こうしたことを考えるために必要な、日語の文字コードに関する基を整理しておきます。 JIS漢字コード(情報交換用符号化漢字集合) 区点コード JISコード(符号化方式) シフトJISコード EUCコード ASCIIとJISローマ字 Unicode 主要コード規格のまとめ 参考文献、リソース 文字化けしたメールの復元 | The Web KANZAKI ホームページ JIS漢字コード(情報交換用符号

  • 小形克宏の「文字の海、ビットの舟」

    小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの 速報 マイクロソフト・プレスセミナー報告 「Windows Vista」におけるJIS X 0213:2004の実装をさぐる(下) ● MS書体とメイリオで96字体を変更 Windows VistaではJIS2004を、どのように実装するのだろう。阿南氏は「MS書体とニューフェイスであるメイリオで、JIS2004字体がサポートされる」と言う。ここで言う「MS書体」とはMS明朝、MSゴシック等のシステムフォントの総称。だからこれらとメイリオでだけ、JIS2004の例示字体に基づく形になる。ということは他の日フォントではJIS2004対応は行なわれない。 となれば次に知りたいのは、これら新フォントで変わった文字数はどのくらいなのかということだ。これについて、阿南氏の示した資料によれば以下の通り。 ここで注意すべきは、

    Bookmarker
    Bookmarker 2006/11/25
    速報 マイクロソフト・プレスセミナー報告 「Windows Vista」におけるJIS X 0213:2004の実装をさぐる(下)
  • 小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの

    小形克宏の「文字の海、ビットの舟」 ――文字コードが私たちに問いかけるもの 特別編4 Windows OSとJIS X 0213、そしてカッコつきUCS符号位置の問題 ●積み残していた問題の解決。まずは『追記』のまとめから 前回“リサの返信”は次に書きますといいましたが、今回も無理です。すいません。ふと振り返れば、僕はもう特別編だけを4回も続けているんですね。つまり編を最後に書いたのは、はるか1カ月も前。「最近くだけた文体になってきましたね」ってメールをよくいただきますが、特別編と編で文体を意識的に変えているんですよ。でもいっこうに編を再開しないから、現状では変わったと思われてもしょうがないですよね。2回も休載しているしなぁ。 とまあ、よしない話はさておき、その編の続きを書く前に、どうしてもすませておかないと前に進めない話がある。ひとつは“Windows OSでJIS X 0213

    Bookmarker
    Bookmarker 2006/11/25
    特別編4 Windows OSとJIS X 0213、そしてカッコつきUCS符号位置の問題
  • 小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの

    小形克宏の「文字の海、ビットの舟」 ―― 文字コードが私たちに問いかけるもの [Reported by 小形克宏] 第1部 2000JISがやってきた 第1回 2000JISとはなんだ? (2000年1月19日) 第2回 2000JISの原案はなぜ修整されたか? (2000年1月26日)加筆修正 2000年2月22日 第3回 前回までの訂正と補遺 (2000年2月2日)加筆修正 2000年2月22日 第4回 JCS委員長、芝野耕司の反論(前編) (2000年2月9日)加筆修正 2000年2月12日 第5回 JCS委員長、芝野耕司の反論(後編) (2000年2月16日)加筆修正 2000年2月22日 特別編 MacOS Xの新フォントと2000JISの関係 (2000年2月23日) 特別編2 ISO/IEC 10646で却下された(?)

  • ものすごい速さで紙をめくる方法

    会議資料をめくったり、ファイルに綴られた伝票をめくったりと、ビジネスで紙をめくるシーンは数多い。紙をめくることが業務効率アップに直結する経理部門などであれば指サックを用意して対処しているだろうが、どの部署にでも指サックがあるわけでもない。かといって、指先にツバをつけて紙をめくるのは衛生的にもなるべくパスしたい行為である。 誌のT記者によれば、紙の4隅のうちの1つをめくる場合、右手親指で下方向から紙を持ち上げ、たわんだ紙を右手人差し指で伸ばし、伸ばした瞬間に左手親指と人差し指で紙をめくる方法がお勧めだという。この際、ある程度たわみをつけたほうが「より確実にめくれる」(T記者)というのだ。 このやり方は、T記者が「銀行員の先輩から聞いた」方法だ。銀行員といえば、しょっちゅうお札という紙を数える仕事をしているので、当然「紙めくり」のスキルは高い。われわれのような一般ビジネスパーソンが簡単にでき

    ものすごい速さで紙をめくる方法
  • 2004 JIS をめぐる混乱

    2004 JIS ( JIS2004 )について、問題となる混乱を解説します。 [ 2005.08.12. ] ※ この文書の目的は、誰かを非難または攻撃することではなくて、 世間にある誤解または錯覚をほどくことです。 ★ 「個々の文字をどう使えばいいのか」という 実用的な結論については、 下記のページをご覧ください。 → Open ブログ 「文字使用の指針・まとめ」 このページには、「指針1」「指針2」「指針3」というリンクもあります。 ★ 文書では、学術的 ・理念的 ・原理的 な 話題 を主に扱います。 文書を公開したあとの新しい情報ついては、次のページをご覧ください。 → Open ブログ 「文字規格」 ここには、細々とした話題がいろいろとあります。 「2004 JIS をめぐる混乱」について語ろう。 新しい漢字規格の問題については、2005年7月末にマイクロソフトが方針を示して

  • http://www2.xml.gr.jp/log.html?MLID=xmlmoji&TID=1635&F=0&L=10&R=1

    Bookmarker
    Bookmarker 2006/11/25
    Windows VistaにJIS X 0213:2004対応の新日本語フォント「メイリオ」
  • 日本語文字セットがVista最大の問題として急浮上

    「どこでどういった問題が起こるのか分からない。まさかデータベースが壊れるということはないと思うが」――。国内大手ベンダーの幹部は不安そうに話す。この幹部が懸念するのは、Windows Vistaで採用された新文字セットの情報システムへの影響である。別の大手ベンダーのシステム構築部門も、「情報システムのクライアントとしてVistaを見た場合、最大の問題は日語の文字セットだ。現在、共通の基盤技術セクションで影響を調査している」という。 企業向けVistaの出荷開始を目前に控え、Vistaの新文字セット採用が大きな問題として浮上してきた。 Windows Vistaは、新しい文字セットに関するJIS規格「JIS X 0213:2004」に準拠した日フォントを標準で搭載する。これにより、既存の漢字のうち122文字の字形が変更になり、約900文字の漢字、約200文字の非漢字(英語の発音記号や記

    日本語文字セットがVista最大の問題として急浮上
  • Windows Vistaで追加された文字の利用にはご注意

    図2●Windows Vistaで字形が追加された文字の例。字体の変更ではなく文字の追加なので,同じフォントのまま2つの字体を同時に利用できるのは一見便利なようだが,検索性などの面では不便だ。Windows VistaのMS-IMEでは,「環境依存文字」と表示される 図3●Windows Vistaで追加された文字を使った文書をWindows XPで開いたときの例。中央のVMware Workstation上で動作しているのがWindows Vista。その文書をWindows XPで開いたのが左上のメモ帳。「叱」の正字が「・」になる。だが,「剥」の正字は正しく表示される。ただし,ゴシック体に変更しても明朝体で表示される 既に報道されているとおり,Windows Vistaでは,日語の扱いについて大きく2つの変更がある。1つは,一部の文字について形(字形)が変わること。もう1つは,利用で

    Windows Vistaで追加された文字の利用にはご注意
  • JIS X 0213 - Wikipedia

    オイラー図(JIS X 0208、JIS X 0212、JIS X 0213等の漢字集合) JIS X 0213は、JIS X 0208:1997を拡張した日語用の符号化文字集合を規定する日産業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である[1]。 2000年1月20日に制定、2004年2月20日、2012年2月20日に改正された[1]。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。 JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS

    JIS X 0213 - Wikipedia
  • Technological : JIS X 0213:2004対応進んでます?

    JIS X 0213:2004対応進んでます? VistaでいよいよJIS X 0213:2004がやってきます。メイリオはJIS X 0213:2004対応なので、何も考えずにデータを受け取ってしまうと、意図しない文字が入ってきて、システムにまずい問題が出るかもしれません(というかたぶん出ます)。内部で統制ができる、いわゆるイントラならともかく、どこからどんなデータが入ってくるかわからないWebシステムだとどうするのでしょう。今、「Vistaのベータ版での動作確認しました」というソフトが結構あると思うんですが、Unicodeのデータ流し込まれても大丈夫でしょうか?しかも拡張面のデータだってやってきます。無いデータはともかく、グリフ(字形)が入れ替わってしまった文字もあります。有名な葛飾ですね。  じゃあみんな葛飾は旧字体でいいじゃないかと思う人もいるかもしれませんが、新字体の葛を使っ

  • JIS2004対応と既存システムとの互換性について - TechNet フォーラム

    Windows VistaではJIS2004対応のフォントに変更になり JIS第3水準、JIS第4水準の文字が追加されます。 と言う訳で当然、今まで無かった文字が新たにWindows Vistaで入出力出来る ようになるので 既存システムに環境依存文字が入力される可能性があります。 【環境依存文字(unicode)】を使うな・・・と言う運用で逃げる事も 考えましたが数千人規模になると守りきれるかどうか。。。 この問題について既存システムの対策はを何かお考えでしょうか? サーバ/ホスト系OS、サーバー/クライアントアプリケーション ミドルウェア、ライブラリなどなど・・・影響が大きそうな気がします。 ↓以降はおまけです。 □UnicodeのJIS 2004(JIS X0213)対応状況 2001年/Unicode3.1(JIS X0213一部対応) 2002年/Unicode3.2(J

  • 小形克宏の「文字の海、ビットの舟」

    小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの 速報 マイクロソフト・プレスセミナー報告 「Windows Vista」におけるJIS X 0213:2004の実装をさぐる(上) 5月16日午前、マイクロソフト新宿オフィスにてWindows VistaでのJIS X 0213:2004の対応と、システムフォントとして搭載される『メイリオ』に関するプレスセミナーが開催された。これにより年末にも出荷が予定されているWindows Vista(ビジネス版のみ年末。コンシューマ版は来年1月予定)における日語環境の実装がだいぶ明らかになってきた。 今回は予定を変更し、これについて2回に分けて報告したい。まとめるにあたっては、同日午後に行なわれたフォント開発者向けセミナー、および今年2月3日に開催された『PAGE2006』(日印刷技術協会主催)でのセッション「日語文字セ

    Bookmarker
    Bookmarker 2006/11/25
    速報 マイクロソフト・プレスセミナー報告 「Windows Vista」におけるJIS X 0213:2004の実装をさぐる(上)
  • Windows VistaはJIS X 0213:2004に対応しないらしい: 文字符号化blog

    「文字の海、ビットの舟」などの報道によると、Windows VistaはJIS X 0213に対応したフォントを搭載するものの、JIS X 0213の符号化方式にはまだ対応していないようです。これでは、JIS X 0213:2004に対応とは言えませんね。 そもそもJIS X 0213のような符号化文字集合規格というものは、文字の集合を定めてその各文字に対応するコード値を定義する規格であるわけです。例えば、JIS X 0213では「亜」という漢字に対して「x0110000 x0100001」というビット組合せ (MSBは呼出し先がGLなら0、GRなら1) を定義しています。こうした符号化表現を用いないのであれば、符号化文字集合を採用したとは言い難い。 同様の理由で、「WindowsはJIS X 0212補助漢字に対応している」という命題も偽となります。実態は、JIS X 0221の実装にお

  • Windows Vistaの登場で顕在化する問題 - Cafe Babe

    C#言語のJIS改訂作業の委員会に出ていて,もうすぐWindows Vistaがリリースされるために現在各社で懸命に検証作業をおこなっているが,その中で見つかったという興味深い問題の話を某氏に聞いた.なお,私自身はまだ使っていないので,伝聞の話として読んでほしいし,間違いがあれば指摘して欲しい. Windows VistaがJIS X 0213に対応することは,みなさん聞いているかもしれない.これは一体どういうことかというと,使う側から見たらより多くの文字を表示できるようになるだけでなく,仮名漢字変換の段階で,それらの文字を含んだ候補が提示されるということだ.また,開発者の側から見ると,プログラム内部でEUC符号化やシフトJIS符号化で扱うことができなくなるのでUnicodeとして扱えるように移行していくだろうこと,そしてUnicodeを採用したシステムであっても,仕様に忠実な文字の扱い…

    Windows Vistaの登場で顕在化する問題 - Cafe Babe
  • はてなブックマーク

    キーボードショートカット一覧 j次のブックマーク k前のブックマーク lあとで読む eコメント一覧を開く oページを開く ✕

    はてなブックマーク