タグ

IVSに関するkanemu1117ncのブックマーク (20)

  • Welcome to nginx!

    If you see this page, the nginx web server is successfully installed and working. Further configuration is required. For online documentation and support please refer to nginx.org. Commercial support is available at nginx.com. Thank you for using nginx.

    kanemu1117nc
    kanemu1117nc 2013/11/07
    異体字セレクタのデータベース。
  • IVS本刊行記念セミナー(2013.3.29)

    「Unicode IVS/IVD入門」刊行記念セミナー http://kokucheese.com/event/index/74447/ 小形さんがセミナー当日の昼、「電話でMSの担当者にIVS実装のインタビューをした」と連投。ほとんど間をおかずにセミナーが開催。IVSでは分からなかった「MSのIVSに対する姿勢」がようやく明らかにされました。

    IVS本刊行記念セミナー(2013.3.29)
  • IVS本に容赦なく突っ込みまくるNAOIさん

    発行されたばかりの「Unicode IVS/IVD入門(日経BP社)」に突っ込むNAOIさん。誤植どころか「これ校正校閲してないんじゃないの?」と疑われるような間違いが続々と…

    IVS本に容赦なく突っ込みまくるNAOIさん
  • まとめよう、あつまろう - Togetter

    コミュニケーションが生まれるツイートまとめツール

    まとめよう、あつまろう - Togetter
  • 日本の文字とUnicode 第6回 | 大修館書店 WEB国語教室

    現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日語に特化して作られたわけではないので、日の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、第4回・第5回に引き続き、第6回も、漢字とUnicodeの関係です。 まずは「晴」(U+6674)のIVSを見てみましょう。 何だか妙な感じですね。同じ「晴」が<U+6674 U+E0100>と<U+6674 U+E0103>に、同じ「晴」が<U+6674 U+E0101>と<U+6674 U+E0102>に、それぞれダブって収録されているように見えます。実際そうなのです

  • IVSツイート退避

    大曲 都市 @Tosche_J @mashcosan モンゴル語はFVS(Free Variation Selector)1~3、MVS(Mongolian Vowel Separator)、ZWJ(Zero Width Joiner)、ZWNJ(Non-Joiner)を使ってます。 2011-10-05 19:47:52

    IVSツイート退避
  • 異体字…IVS、フォント、GSUB - Webと文字

    世の中には姓名にちょっとでも違う字を使うとうるさく言う奴がいて、そんなこんなでUnicodeに字形切り替えの仕組みが備わった。これをIVSという。特に「ナベ」さんはうるさかったらしく、字形も沢山登録された。 上の図はUnicodeに登録されている異体字リスト(IVD:http://unicode.org/ivd/data/2007-12-14/IVD_Charts.pdf*1)から引っ張ってきた。実は上に挙げたのは一部である。日人しか使わない、日人のための表である。ああ素晴らしい( ´∀`)。 こういう規格が何で出てきたのかとか、以下のサイトが詳しかった。 IVSとフォントの関係 - ちくちく日記 IVSとGSUBはどう違うのか - Mac OS Xの文字コード問題に関するメモ ともかく、私も日曜フォントプログラマーとして、フォント内部のIVS構造がどうなっているのかを話したい。 仕様

    異体字…IVS、フォント、GSUB - Webと文字
  • IVS飲み会、そしてIVS Checker - ちくちく日記

    先日、IVS飲み会という、大変に濃い飲み会に参加してきました。 そもそもの発端は、ここのブログで「(IVSについてもうちょっと教えて欲しいから)もう一回飲みません?」と、NAOIさんに呼びかけた事から。 その呼びかけに、NAOIさんがTwitterで「やりますか」と、応答。 「やりましょう、やりましょう」ってことで「IVS(を素人に教える)飲み会」の開催が決定。 この時点では、せいぜい3、4人程度の気軽な「IVS(を素人に教える)飲み会」のつもりだったのだけど、 「やるなら参加するぜ!」 と、参加者が増え、 最終的な参加者。 @monokano、@ogwata 、@akatsuki_pocket 、@assause、@bunzo78 、@KAN0U、@kawabata 、@koikekaisho、@moji_memo、@ragged_right、@hatchgogo、@akane_neko

    IVS飲み会、そしてIVS Checker - ちくちく日記
  • InDesignにおけるIVSの実装と運用上の問題点 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    前回述べたように、IVSはGSUBよりも新しい分、すっきりと論理的にできている。だから、「漢字の異体字指定に関してはGSUBからIVSに乗り換える」というような思い切った転換を行い、なおかつInDesignなどにおけるIVSの扱いが信頼できるものであるなら、みんなハッピーになれそうだ。 しかし、たぶん現実には、「GSUBはそのまま残って、IVSも使える」ということになるだろう。というか、すでにそうなっている。要するに、もともと複雑な状況が、さらに複雑化したわけだ。加えて、もちろん今後改善されていくとは思うが、InDesignにおけるIVSの扱いには、まだまだ問題が多い。以下、InDesign CS4における実装あるいは運用上の問題。 IVSとGSUBの競合・重複の問題。たとえばInDesign上で、ある文字にGSUBとVSを両方適用したらどうなるのか。詳しくは「InDesign CS4にお

    InDesignにおけるIVSの実装と運用上の問題点 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 突発的IVS実用講座

    IVSについての @mashcosan の質問から突然始まったIVS使いこなし講座。Windows 7 または OS X 10.6以降をご利用で異体字にお困りの皆さん、IVS対応フォントを試してみてはいかがでしょう? さらにはInDesignの仕様に関する提言も…。(話題別に並べ直してあります)

    突発的IVS実用講座
  • セミナー「UnicodeとIVSの基礎について」

    2011/9/22に開催された、IVS技術促進協議会主催のセミナー「UnicodeとIVSの基礎について」の @ogwata さんによる中継をまとました。

    セミナー「UnicodeとIVSの基礎について」
  • UnicodeのIVSがもたらすメリットとデメリット

    UnicodeのIVS(Ideographic Variation Sequence)は、漢字を表すUnicodeの直後に Variation Selectorと呼ばれるコードを付加し、漢字の「異体字」を表現する方法だ。IVSによって、従来よりも多くの字体が利用可能になる反面、データの「名寄せ」が困難になる恐れもある。文字コードに詳しい京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、IVSの利点と懸念すべきポイントを解説する。(日経コンピュータ) 筆者がITproに「漢字1文字が最大8バイト、Unicodeの「IVS」とは?」を寄稿してから約1年が経って、IVSに新たな動きがあった。常用漢字表の改正(2010年11月30日)に前後して、4195字のIVSが追加されると同時に、IVS技術促進協議会が発足したのだ。IVSの拡大によって、これまでフォント切り換えでしか

    UnicodeのIVSがもたらすメリットとデメリット
  • IVSと正規化について

    小形克宏 @ogwata Java 6はIVSを無視(ignore)しない。「Java 6 でIVSを比較すると何が起こるか」yanok.net http://yanok.net/2011/01/java-6-ivs.html 2011-01-13 13:21:45

    IVSと正規化について
  • 出版物のUnicode化推進セミナー 日本電子出版協会(JEPA)

    2010年は、iPadの発売、Kindle3への日フォントの導入、年末のシャープのガラパゴス、ソニーのリーダーの発売など、まさに電子書籍元年にふさわしい話題が満載の年となりました。しかし、ハードウェアの話題ばかりが先行し、実際に読まれるコンテンツに関しては、コンテンツの充実という意味でも、流通経路の整備という意味でも、2011年が格的普及に向けての正念場になることも明らかです。 こうした中で、出版社や印刷会社、編集プロダクションなど、コンテンツの制作を担う現場にとっては、各読書端末における縦組みやルビなどの日語組版機能の実装状況とともに、外字や異体字など、日語の文字表記の状況を正確に把握しておくことは、コンテンツ資産の電子書籍化、迅速かつ効率的な電子書籍の制作には不可欠です。 セミナーは、電子書籍の制作と普及に欠かせない基礎技術である文字コードについて、最新の国際標準化状況

  • 50年に1度!? IVSをめぐる熱いw討論

    JEPAによる「出版物のUnicode化推進セミナー」をきっかけに、IVSについて熱く語り合った記録。思いがけず沢山の人が呼応してくれたので、まとめておきます。 IVSについては「UTS #37 UNICODE IDEOGRAPHIC VARIATION DATABASE」(http://unicode.org/reports/tr37/)、安岡孝一「漢字1文字が最大8バイト、Unicodeの「IVS」とは?」(http://itpro.nikkeibp.co.jp/article/COLUMN/20100126/343783/)、拙稿「包摂された字体を区別できる異体字シーケンス」(http://internet.watch.impress.co.jp/cda/jouyou/2008/09/09/20793.html)あたりをご参照ください。

    50年に1度!? IVSをめぐる熱いw討論
  • 人名などの異体字もデータ交換可能に、MSなどが「IVS技術促進協議会」発足 

    kanemu1117nc
    kanemu1117nc 2010/12/06
    まとまるといいけど…
  • 未来情報産業ブログ

    異体字セレクターの現状 異体字セレクターの現状の仕様、IVD/IVC/IVSは、面倒ごとから逃げた、とても残念な仕様です。 常識的に考えて同じ字が、IVCが違うというだけで異なる異体字セレクターを付けられてしまう。とても残念なことです。 Adobe-Japan-1だけの頃は、それでもまだ何とかなった。 しかしここに、汎用電子が混ざり込み、いよいよ実用にならなくなってしまったわけです。 今後さらにIVCが増えれば、益々カオスになり、実用から程遠いことになるでしょう。 同じ字に違うVSがあってはいけない理由 これは、レビュー時に弊社がまとめてクレームを付けたことですが、同じ字に、同じ機構の中で別の番号が付くようだと、一つの文字を表わすのに、複数の方法にばらけてしまう。 例としては適切ではないかもしれませんが、朝鮮語の文字コードKS X 1001は同じ漢字文字に複数の符号位置があるわけですが、当

    未来情報産業ブログ
    kanemu1117nc
    kanemu1117nc 2010/11/24
    どうかなぁ。今の割り当てられてしまった異体字セレクタを1文字に2つ持つようにして、片方はその文字へのエイリアス、って考えでいいような気がする。
  • 汎用電子の「邉」とAdobe-Japan1の「邉」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    汎用電子情報交換環境整備プログラムの異体字データベース(IVD)登録にともなう公開レビューがはじまっている。 登録候補のリストを見ると、バリアントがいちばん多いのが「邉(U+9089)」で、15文字。先行してIVDに登録されているAdobe-Japan1における「邉」のバリアントの数と、まったく同じ。となると、汎用電子の15の「邉」とAdobe-Japan1の15の「邉」がどの程度一致するのか、気になるところである。で、確かめてみた。下図青枠がAdobe-Japan1、赤枠が汎用電子のグリフで、寄り添って並んでいるのが一致するもの。 各15文字中、7文字が一致。この数を、多いと見るか少ないと見るか。ちなみに、Adobe-Japan1では、考えうるパーツ(下図、グレー枠)の組み合わせは(数え方によって変わってくるだろうけれど)96種類。汎用電子では、これに加えて赤枠のパーツも区別される可能性

    汎用電子の「邉」とAdobe-Japan1の「邉」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • PRI 167のIVD登録完了 | yasuokaの日記 | スラド

    PRI 167のIVD登録が完了したという連絡をいただいた 。ざっとチェックしてみたところ、Adobe-Japan1と住民基台帳ネットワーク統一文字とで全く別々のIVSを付与する、という、かなりシビレル結果となっている。たとえば以前書いた「邊」に関しては、こんな感じ。 住基908A(U+908A U+E0108) CID+6929(U+908A U+E0100) 住基BD45(U+908A U+E0109) CID+14236(U+908A U+E0102) 住基BD5E(U+908A U+E010E) 住基BD5F(U+908A U+E010D) 住基BD60(U+908A U+E010C) 住基BD61(U+908A U+E010B) CID+20234(U+908A U+E0107) 住基BD62(U+908A U+E010A) 住基BD6A(U+908A U+E0110) CID

  • IVD更新 - yanok.net

    最近、Unicodeのいわゆる異体字セレクタの新しいグリフコレクションが登録されました。今までは、Adobe-Japan1というコレクションが登録されていたのですが、今回それに加えて汎用電子と呼ばれる日の政府関係から提案されていたコレクションが追加されました。追加されたコレクションは、異体字データベース (Ideographic Variation Database; IVD) に累積的に追加されています。 IVDの文字表をちょっと見ると分かることですが、Adobe-Japan1と汎用電子とで、どう見ても同じようなグリフに対して別々のIVS (Ideographic Variation Sequence; IVS) が割り当てられています。例えば、「与」(U+4E0E)を見ると、Adobe-Japan1は長い横線の突き出ているグリフと突き出ていないグリフとにそれぞれ別のIVSを割り当てて

  • 1