タグ

RDFとcomputerに関するtsupoのブックマーク (17)

  • ちょっとしたメモ - GRDDLがW3C勧告に

    XHTMLなどからRDFグラフを抽出するGRDDLがW3C勧告となった。最初の草案が昨年10月下旬に出てから1年未満、GRDDL作業部会が設置された昨年6月から数えても15ヶ月と、最近のW3C規格の中では異例のスピードだ。現在のXHTMLとして完全に妥当な文書にRDF互換データを埋め込むことができ、使い方も分かりやすい。普及することを願うばかりだ。 HTML文書内にRDFメタデータを埋め込むという考えは、最初のRDFが1997年に勧告されたときから話題になっており、さまざまなアイデアが出されてきた。当初はXHTMLの中にRDF/XMLをそのまま記述するにはどうするか、いや、やはり妥当性検証ができないから外部RDF/XML文書にリンクすべきだ、といった議論が続いていたが、「どっちみち人間が読むための文書は作るんだから、そこからマシン用のデータを抽出するのがいいよね」という現実的な考えが出てく

    tsupo
    tsupo 2007/09/13
    GRDDLの考え方は、class属性やrel属性を一貫して用いて、その意味をXSLTなどでRDFに変換しようというもの / XHTMLのprofile属性を指定するだけでOK
  • RDFとメタデータの相互運用

    (メタ)データ相互運用の課題 データモデルと名前の相互運用 どんなモデル(データ構造、スキーマ)を採用するか プロパティ(関係記述語彙)はどの程度詳細に設計すべきか、独自語彙か汎用語彙か 人物などの典拠、主題などの語彙(ノードの名前)をどうやって共有するか 記述対象をどのように識別するか(リソースの同一性) (※稿では、最初の2つ、モデルとプロパティについて検討します) 相互運用のスコープ データの共有:統合レポジトリの構築や横断検索の実現 データの交換:AのデータをBが取り込みたいとき データ相互運用とRDF/OWL なぜRDF/OWLか 柔軟性:シンプルで柔軟なグラフ構造でさまざまなモデルを表現できる 意味論:グラフの意味論が定義されており、予備知識のないデータも共通の解釈ができる 語彙の連携:語彙間の関係を記述することができ、その関係を利用した基的な推論ができる 識別と統合:UR

    tsupo
    tsupo 2007/03/09
    神崎氏による「第32回ディジタル図書館ワークショップの講演資料」 // クラスの併合とプロパティの分割
  • AjaxとObject/RDFマッピングライブラリ

    Hercules - A simple JavaScript library for O/Rdf mapping RDFとJavaScriptのObjectをマップするライブラリを作り始めました。雰囲気としてはRailsのActiveRecordに似ています。JavaScriptのコードを書けば、自動的にSPARQLクエリ生成からリモートサーバへの問い合わせ、返事のパースにキャッシュまでを行ってくれます。 現在は当に作りはじめのベータバージョンで、エラーハンドリングなどは全然していません。機能も最も単純なURIを基準としたデータの取得のみです。 <?xml version="1.0" encoding="utf-8" ?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://p

    tsupo
    tsupo 2007/02/08
    SPARQLのクエリを生で書くとものすごい記述量になる → そうなんだよねぇ。なので、これは期待。
  • ちょっとしたメモ - GRDDLサポートツール2つ

    2月に入ってGRDDLをサポートするツールが2つ立て続けに登場した。一つはRaptor RDF Parser Toolkit(Dave Beckettのアナウンス)、もう一つはJena GRDDL Reader(Jeremy Carrollのアナウンス)。いずれも、XHTMLプロファイルを通したスタイルシートの間接指定ができるようになっているところが大きい。 Raptorは、C#、JavaPerlPHPRubyなどの言語から利用できるRDFパーサの高速ライブラリで、RDF/XML仕様のエディタ自らが作っている定評あるもの。GRDDLは昨年からサポートしていたが、今回スタイルシートの間接指定も処理できるようになった。手元で試してみたら、XML/RDF出力だとxml:baseがうまく出てこないものの、GRDDLの処理はきちんとできている。 JenaはJavaでRDFを処理するための定番ラ

    tsupo
    tsupo 2007/02/03
    Jena GRDDL Reader: 前処理にNekoHTMLを使って整形式でない(X)HTMLを整形式にバランスさせるオプションがあるので、世の中に氾濫しているXHTMLくずれでもGRDDLが利用できるというのもポイント
  • 評判のオントロジーとFOAF

    パネルテーマ:オントロジーの作り方、使い方 語彙を作り、語彙を使ってインスタンスを記述 ウェブにおいては、軽量オントロジーを用いて分散記述するのが主流 分散しているデータをどう結びつけるかというモデル(語彙設計)が重要 ユーザの評価とmicroformats microformats:コミュニティの合意による半構造化 ウェブログなどに記述する内容を、XHTMLのclass属性を使って半構造化する 名前空間を用いず、コミュニティ内の合意によって語彙を区別 Wikiを用いた合議スタイルによる仕様構築 利用が比較的簡単で、ウェブログ用のプラグインなどツールも多数 ユーザの評価を半構造化するhReview hReview - microformats (2005年5月ごろ0.1登場、2007年1月時点でバージョン0.3) TechnoratiのReview Searchなどで利用 XHTMLのcl

    tsupo
    tsupo 2007/01/26
    このプレゼンが行なわれたイベントの参加レポートを書きました。 http://watcher.moe-nifty.com/memo/2007/01/web2007_5cd5.html
  • 日本ソフトウェア科学会 チュートリアル 「セマンティックWebの基礎知識」 参加募集のご案内

    ■お詫びと再登録のお願い 登録システムの不備により、2007年1月9日以前に申し込まれた方で、 一部のブラウザを利用された方の登録が失敗している可能性が あります。登録が正常に行われた方には確認メールをお送り致しましたが、 1月9日以前に申し込まれて確認メールが届いていない方は、 御手数ですが再度ご登録いただけますよう御願い申し上げます。 ■チュートリアルの趣旨と概要 Webが日常生活にまで浸透するようになって久しく, また一方でWebのしくみは情報システムとしても広く応用されてきています. 簡潔なマークアップ言語 (HTML) とサーバ・クライアントプロトコル (HTTP) を基礎とすることがこのような普及につながっているのですが, 情報の利用の観点からみると,検索して目で見ることの繰返しという, コンピュータが介在しているわりには原始的なことしかできていません. Webに蓄積され流通す

    tsupo
    tsupo 2007/01/13
    1月15日かぁ。まだ、申込み可能みたいだけど、どうしようかなぁ。
  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
    tsupo
    tsupo 2006/12/25
    SPARQLのXML結果フォーマットと、XSLスタイルシートと組み合わせて使うことによって、ブログ・アイテムのHTMLビューをカスタム化したり、さらには、別のRSSフィードを作ったりすることもできます
  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
    tsupo
    tsupo 2006/12/25
    2004年6月23日に書かれた記事なので、さすがに今はそのまま使えない(RDQL → SPARQL などの変化がある)けど、それでも考え方とかは参考になる。
  • RDFAuthor

    About RDFAuthor is a tool designed to ease the pain of creating rdf instance data. Authoring is largely a matter of dragging in data and binding it together using a graphical interface. See the tutorial which demonstrates the authoring process. Warning: Contains large images (and nut traces). RDFAuthor is free software, released under the GNU General Public Licence. It uses the Apache AXIS libra

    tsupo
    tsupo 2006/12/08
    Java Swing ベースの RDF エディタ
  • トップページ

    SQL データベース操作言語SQLについて、またRDBMSの持つ機能について詳しく解説します。 DB概要、SQL、テーブル操作、データ操作 ... 特集:replication PostgreSQLのレプリケーションシステムを紹介し、それらの機能を比較していきます。 特集:pgbench PostgreSQLのベンチマークテストに用いられるプログラムである pgbench について解説します。 SQL演習問題 各章に用意された演習問題を集めました。

    tsupo
    tsupo 2006/12/05
    Jena は MySQL, Oracle, PostgreSQL の3つの関係データベースに対応
  • ちょっとしたメモ - RDF Validator多国語対応が改善

    W3CのRDF Validatorによる多国語の図形描画が、ようやくうまく行くようになった模様。Olivier Thereauxのメールによれば、We have managed to make the graphing tool use a font covering a very hight number of scripts. ということで、実際、要素内容だけでなく要素型名に日語を用いたRDFもうまく図形表示できている。2年以上かかってしまったわけだが、これでまともにValidatorが使えるようになった。 依然として、パースと検証はできるものの描画エラーになるケースもある。いくつかチェックしていて、リテラルに二重引用符(")が含まれるとうまく行かないことが判明した。 マッチする二重引用符の中身はグラフには描画されない マッチしない二重引用符があると描画エラーになる 二重引用符内に記

    tsupo
    tsupo 2006/11/26
    要素内容だけでなく要素型名に日本語を用いたRDFもうまく図形表示できている。2年以上かかってしまったわけだが、これでまともにValidatorが使えるようになった → 試しに使ってみよう
  • ちょっとしたメモ - IE7、Firefox2でもRSS1.0にXSLTを適用させる

    IE7やFirefox2は、「フィード」をMIMEタイプで判別できないときは、コンテンツの先頭部分のテキストマッチで判断して「フィードプレビュー」を起動しているらしい。判定用の文字列パターンをRSSファイルで直接用いないようにしたら、確かにどちらのブラウザもプレビューではなくてXSLTを適用するようになった。ただし、一般のフィードリーダーの中にも同じような文字列マッチを使っているものがある模様で、方法によってはこれらのフィードリーダーでも修正版RSSを読めなくなってしまうので注意が必要だ。 Microsoft Team RSS BlogのWindows RSS Publisher's Guideによれば、MIMEタイプがapplication/xmlもしくはtext/xmlであるときは、IE7はコンテンツ冒頭の512バイトを読んで、その中に次の3つの文字列があればRSS1.0と判定するのだ

    tsupo
    tsupo 2006/11/09
    rdf:RDFを使ってRSS1.0を判定方法を用いているらしきものが結構あることが分かった
  • [ThinkIT] 第4回:統合技術として導入が進むセマンティックWeb (3/3)

    売り上げ分析に必要なデータをBIに受け渡すまでに複数のステップを踏んでいた 各ステップに、BIに受け渡すまでに必要なデータ変換や集計のための定義やプログラムロジックが分散していた 売り上げを算出する場合、複雑な製品同士の関係や顧客や地域ごとのローカルルールなども反映する必要があった 大手通信機器ベンダーでは、新商品を投入して8週間も売り上げ分析ができない状況は、製造計画・在庫管理上大問題であると判断し、この状況を改善すべくエンタープライズ・セマンティックWebの適用に踏み切る。 具体的には、ETLやJavaプログラム、ストアドプロシージャ、Excelシートにそれぞれ定義ならびにコーディングされていたデータ変換/データ集計の情報を排除するために、それらの情報をすべてRDFとOWLに置き換え、リポジトリにて一元管理した。そして、一元管理されたRDFとOWLを推論エンジンが読み込み、データ変換/

    tsupo
    tsupo 2006/09/11
    過去の取り組みの中から統合技術として応用できることがわかってきている / 最初の用途は限定的なものとなりそうだが、応用範囲は広い → オントロジーの構築が大変なんだよなぁ。作っちゃえば楽になるとはいえ
  • ちょっとしたメモ - RDFとは何か

    What Is RDFという、xml.comに8年前から掲載されている記事がある。Tim Brayによるオリジナル版のあとで2001年にDan Brickleyによる改訂版が出て、またまた今回Joshua Taubererによる再改訂版が登場した。RDFの現在の位置づけやセマンティック・ウェブとの関連を踏まえて新たに書き下ろしたものだが、新改訂版を以前からあるURLで公開し、旧版を別のURLに移動しているのが面白い。 旧版ではRDFを「メタデータを記述してウェブでの検索を高度にするもの」という形で捉えていたが、最新版ではどういう紹介になっているのか、かいつまんで見ていくことにしよう。まず導入部分。 セマンティック・ウェブ(以下SW)では、コンピュータが私達のためにブラウジング(それに探索や照会など…)を行ってくれる。SWは、コンピュータがウェブ上に分散している知識を探し出し、それをかみ合わ

    tsupo
    tsupo 2006/07/28
    セマンティック・ウェブといっても“全てをコンピュータが自動的にやってくれる”というSF的な話ではなく、人間が利用するもの/メタデータだけを扱うのではなくて、知識や世の中に存在するものごととその関係を記述
  • ちょっとしたメモ - セマンティック・ウェブ再訪

    Scientific American誌の2001年5月号に The Semantic Web が登場してからちょうど5年目のタイミングで、IEEE Intelligent Systems誌に The Semantic Web Revisited が掲載され、話題になっている。こちらもバーナーズ=リーが執筆陣に加わっており、現時点でのセマンティック・ウェブの総括といえる内容だ。 記事抄録を訳して紹介しておこう。 サイエンティフィック・アメリカンに最初のセマンティック・ウェブの記事が登場したのは2001年のこと。そこでは、主として人間が読むための文書で構成されれているウェブから、コンピュータが処理できるデータや情報を含むウェブへの発展が語られていた。セマンティック・ウェブとは、作動可能な(actionable)情報、すなわちシンボルを解釈するための意味理論を通じてデータから取り出された情報の

    tsupo
    tsupo 2006/07/19
    巨大で分散化され規模も異なる情報源をどうやって効率的に検索するか;さまざまなオントロジーをどうやって調整しマッピングするか;巨大なRDFグラフを視覚化しナビゲーションするセマンティック・ウェブ用ブラウザを
  • ちょっとしたメモ - Dublin Coreの新仕様案に対するパブリック・コメント

    先日のExpressing Dublin Core metadata using RDF草案に対するパブリック・コメントが6月末で締め切られ、そのまとめがDCRDFTaskforce/PublicCommentJune2006として公開されている。決定的な異論は無かったが、いくつか調整や修正が必要ということだ。問題の定義域、値域に関しては、抽象モデルに沿って進めるが"needs some improvement"というのが大方の意見か。 コメント公開ページの内容は、概ね次のようなところ。 DCプロパティに定義域と値域を与えることについて この点については、いくつかの懸念が表明された(当然だ)。dc:creatorなどは、以前のDCMIの説明でもリテラル扱いだったし、Swoogleの統計を見てもDCMESの15要素の大多数はリテラル目的語として使われているから、これらが不適合になるというのは

    tsupo
    tsupo 2006/07/10
    「DCAMに従って基本的にはプロパティ値をエンティティとするが、値域に関してはもっとよく議論しようと」いう線。
  • ちょっとしたメモ - Dublin CoreのRDFモデル新仕様案

    ダブリン・コアをRDFで使う時のモデルを定めるExpressing Dublin Core metadata using RDFの草案が公開されている。注目すべきは、いくつかのケースを除いて、プロパティ値(目的語)としてリテラルが認められなくなっているところ。具体的に言えば、<dc:creator>神崎正英</dc:creator> という記述は不可で、目的語は<foaf:Person>などのエンティティにしなければならなくなる。RSSをはじめとする現在のRDFデータにかなり大きな影響が出るのは必至だ。 例外としてリテラルを目的語にできるのは、大まかにまとめると (1)値となるのが一つの文字列だけ;(2)そのEncoding Scheme(クラスに相当)がデータ型もしくはrdfs:Literal;(3)RDFのリテラルとして矛盾無く記述できる(たとえばデータ型と言語タグの両方を持っていたり

    tsupo
    tsupo 2006/06/04
    これって、XMLにおける「ボヘミアンvs貴族」問題が、Dubrin Core にも波及したって感じ? ちょっと違うか。でも、これは「貴族」寄りの仕様だなぁ。
  • 1