異体字データベースは、各種文献に記載されている異体字・関連字情報を収集・整理したものです。本データの一部は、情報処理学会 試行標準 IPSJ-TS 0008:2007 「大規模漢字集合の異体字構造」に記載されている異体字情報を整理、バグフィックスしたものです。 全ての異体字関係は、「トリプル」形式で表現されます。これは、「漢字A」、「関係」、「漢字B」の3項目をカンマで区切って表現するものです。関係に対してコメント情報がある場合は、さらに4項目目に記述しています。また、「関係1」,"<rev>",「関係2」のトリプルにより、逆関係も定義します。 ファイル名 注記 UCS 互換漢字 compat-variants.txt