イベント / EVENT

2023年度 市民講座 Q&A

第1回
ネットワーク越しのアナタは誰?
-サイバー空間における認証-
坂根 栄作

※回答が可能な質問のみ掲載しています。


学認のライバルはいますか?学術認証サービスの国際的な競争があるのでしょうか?欧州のお話がありましたが、アジアではどのようなサービスがライバルですか?

学認は、我が国の高等教育機関のためのフェデレーションでありますが、このようなフェデレーションは我が国だけではなく諸外国にも存在します。学術界を対象とする認証フェデレーションは海外連携も重要であり、学認は各国のフェデレーション関係者とトラスト、認証・認可における問題や課題について情報共有や意見交換を行っているところです。ライバルとはちょっと違うかもしれませんが、切磋琢磨する間柄としての海外のフェデレーションは地域に依らず多いです。

学術認証サービスについて、学術界向けに認証機能を提供するサービス、ということにしますと、認証の方法や用途に応じて国際的な競争もあります。たとえば電子証明書を利用するものなら、電子証明書を発行するベンダはワールドワイドなベンダもいくつかあり、市場での競争があります。

認証プロキシサービス Orthorsの犬?は、情報犬のビットくんですか?

いいえ、ビットくんではありません。今のところ、ビットくんと何か関係があるのかどうかも不明です(笑)。

国立情報学研究所の前身は学術情報センターなので仕方はないと思いますが、大学の論文だけでなく日本の社会全体で、個人がネットショップ購入や契約をする際の個人認証をどうするのかについてもデジタル庁などに広く提案をしていただけるようにお願いいたします。
その点については少々安全保障に傾いてはおりますが、2023年10月25日から27日まで慶応三田で開かれる13th International Cybersecurity Symposiumなどのほうが広く議論されている気がいたします。

ご意見いただきましてありがとうございます。学術界における問題や課題解決が中心となりますが、広く社会全体に資することができるよう事業展開や研究開発を進めて参ります。

IDとは誰がどの様に作るのですか?数字のついたIDを見たことがあるのですが。

IDは誰がどのように作っても構いません。とはいえ、自分独りで利用するものではなく、いろんな方が持ち、かつ、いろんな方がそれを利用しますので、信頼性があり効率的に扱えるものであることが望ましいですね。

現在、さまざまなIDが流通していますが、作り方もさまざまであり、IDの用途に応じて適切な形式が選択されています。数字が含まれるIDも一般的な形式であり、ある文字列と組み合わせや桁数(文字数)などは、実際の用途に照らして設計されているでしょう。目に見えるIDをあらためて眺めて、これはどういう意図で設計されているのかな、と考えてみると面白いかもしれませんね。


第2回
経験から学ぶロボットの動かし方
-ロボット自身が試行錯誤する時代へ-
小林 泰介

※回答が可能な質問のみ掲載しています。


横浜でガンダムファクトリーヨコハマ(GFY)が開催されました。インピーダンスモデルによってロボットパイロットが実現する可能性は有りますでしょうか?

ロボットの遠隔操作技術では、ロボットと人の操作インターフェースとの間を仮想的なインピーダンスモデルで繋ぐことで、人がロボットを操作するだけでなく、ロボットの状態を人へとフィードバックすることができています。

ガンダムが作られるかは不明ですが、より広義でのロボットパイロットは既に実用段階に近づいていると言えます。


第3回
論文が誕生してから我々に届くまで
-知識発見!誰でも使える CiNii Research-
西岡 千文

※回答が可能な質問のみ掲載しています。


研究者(大学教員など)の人物検索にウイングを広げるとの話がありましたが、researchmapとバッティングしないでしょうか。さらにORCIDとの関係性はどうなるのでしょうか。
前者は同じNIIが開発を手掛けている研究者総覧ですので、JSTが行うサービスとNIIが行うサービスで齟齬がないか、そのあたりの説明がほしかったです。

researchmap、CiNii Researchともにキーワード入力による検索機能を設けております。しかし、CiNii Researchは、さらにリンク伝いに人物と関連する研究プロジェクト、その研究プロジェクトに参加している研究者、その研究者の論文といったように様々な研究情報を芋蔓式に辿れるようにすることを目指しています。

また、researchmapは研究者があらゆる研究成果を自身の裁量で入力できる点が特徴であり、CiNii Researchでは出版者等によってオーソライズされた情報を統一性をもって扱っています。

ですので、どちらのサービスにもそれぞれのよさがあり、必要なものであると考えています。なお、人物検索では『KAKEN』を中心に『researchmap』などに含まれる情報の一部を利用して、研究者・研究成果の情報を機械的に統合して作成しています。
ORCIDの情報の利用については、現在検討中です。


第5回
日本文化をAIとビッグデータで読み解く
-過去の日本文化を「見える化」するデジタル技術-
北本 朝展

※回答が可能な質問のみ掲載しています。


講義で紹介された「AIくずし字認識アプリ「みを」は、江戸時代以前の古文書でも対応できますか。
木版印刷本と手書きの写本ではくずし字の認識度にどの程度差があるのでしょうか。時代ごとに認識度の差はみられるでしょうか?

最初に、古典籍と古文書の違いについて説明します。古典籍とは印刷された(あるいは書写された)本、古文書とは一点ものの文書を指します。古典籍は不特定多数の読者でも読めるようにきれいに文字が書かれていますが、古文書は字の上手な人も下手な人も書いているため、バリエーションが非常に大きいのが特徴です。

「みを」アプリは江戸時代の古典籍(特に印刷された版本)を中心に学習したため、そうした本には強いのですが、たとえ江戸時代であっても文字の書き方にクセがある古文書になると文字認識の精度は下がります。一方、江戸時代以前であっても、文字がきれいな古典籍であればそれなりに読むことができます。このように、確かに時代の違いによる影響はありますが、それよりも文字の違いの方が影響が大きいと言えます。

また木版印刷本と手書きの写本では、木版印刷本の方が精度は高いです。これは、学習データにより近いこと、そして木版印刷本の方が文字が安定していることが要因です。ただ、手書きの写本の学習データを増やせば、精度も上がっていくと考えています。

くずし字の正答率が95%とのことでしたが、残りの5%は人間が解読して入力されているのでしょうか?

AIくずし字認識の結果に対して人間が修正するかどうかは目的によります。テキストを何かの研究に使う場合は、文字の誤りが限りなくゼロに近いことが望ましいので、人間が残りを修正することが必須となります。一方、OCRをかけて検索に使うなどの目的だと、大量のテキストを人間が修正するのはコストの面でも時間の面でも現実的ではないため、テキストを修正せずにそのまま使います。

そもそも人文情報学とは文系又は理系どちらの学問になるのでしょうか。どちらの知識も必要と思いますが区分けとしては如何でしょうか。

人文情報学の研究分野を文系、理系に分けることはあまり意味がないと思います。どの学問分野を学んできたかという意味では、いわゆる文系の学問を中心に、あるいは理系の学問を中心に学んできた人がいます。ただ個人として見た場合、その両方のセンスを持っている、言い替えれば複数の視点で物事を見ることができる能力が必要で、それがないといい研究ができないという難しさがあります。個人が複数の分野を学び、個人の中に複数の視点が同居しているというのが、人文情報学の分野と言えるのではないでしょうか。

古典籍を機械可読化してLLMのモデルとして取り込むことで、古典AIというものが構築できそうで興味深く拝聴しました。一方、古典は言文不一致なので、古典籍をLLMとして学習しても口語の会話文の対話(chat)にはならないのではないかと思われますが、そのような認識で正しいでしょうか。

LLMの学習においては、様々な種類のテキストを学習しますので、その中には複数の言語の対応を学習する手がかりも含まれています。その結果としてLLMが日本語と英語の翻訳ができるようになるのと同じように、現代日本語と古文の翻訳もある程度はできるようになります。このような場合、LLMの内部で何が起こっているかについては、まだ完全に解明できていません。しかし一般的には、たとえ言文不一致であっても、その意味内容は似たものとしてLLM内に表現されていると考えられています。つまり、意味内容がどちらの文体で表現されていても、LLMにとっては似ているため対応可能となります。

古典籍に対するLLMを含む生成AIの活用については、「つくし」プロジェクトで研究を進めていくなかで、今後も様々な知見が得られると期待しています。

shimin 2023-qa page6539

注目コンテンツ / SPECIAL