はてなキーワード: arXivとは
そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援AI Grok。学習に使いたいのはテキストの方であって画像ではない。
わかりやすさのために ChatGPTと比較してみる。2023年にリリースされた GPT-4 に試しに今期のアニメについて質問してみよう。
今期最も人気のアニメはなんですか?
ChatGPT:
2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか?
アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題に対応できないのである。
一方、Grok は Xの投稿をリアルタイムに検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロ、ブリーチ辺りの話をするはずだ。つまり、Xが収集したいのは「ダンダダンの7話泣かされたわ・・・」みたいな投稿のことであってイラストではない。
Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社 の FLUX.1 というモデルである。X社が Xに投稿されたイラストを収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか?データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である
現在大手の企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか?
このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織。ネット上のありとあらゆる画像を収集しタグをつけたデータセットを公開している。
A. LAIONは非営利の研究組織です。ドイツの著作権法(§60d UrhG)に従いあらゆる著作物の利用が許されています。
とあるようにドイツの法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI関連企業からの多額の寄付金があることが知られており、パチンコ3店方式のような意味合いでの合法とも言える。
尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本の法律は関係ないです。いちおう念の為。
他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。
もう、全てが間違っている
そもそも、Glaze も Nightshade もAI学習を阻害するものではない。学習したモデルをぶっ壊す毒なのである(poisoned って書いてあるでしょう?!)
相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう?(後述)
それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。
事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる。
反AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である。簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り(poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。
Nightshadeを使って例えば 犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念が無茶苦茶になってしまう。
図:毒入りモデルの変化 (arXiv:2310.13828から引用)
上の図は毒入りの画像を200枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。
図:毒入り枚数による変化 (同引用)
こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。
もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru に投稿するだろう。二次元イラスト特化の画像生成AIはdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである。
ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう?
Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE(Variational Autoencoder)を使っている。そしてNightshade の方も 内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。
Glaze が機能しない?あるいは解毒方法が見つかったかもしれない
上のスレッドのコメント欄では Glaze が論文のようには機能しないことについて議論され「画像のリサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データが圧縮されてノイズ効果が消えたのではないかということだ。
A) 絵師さんが Glaze をかけたあと画像を縮小した可能性
B) 画像サイズやファイルタイプによってはプラットフォーム側が勝手に加工をする
C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)
A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像を投稿したところで [縮小→拡大] でノイズは落とせそうだ(解像度は悪くなるだろうが)
LAIONは収集画像そのものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい。
ということは、LAIONの新しいデータセットが公開されたタイミングで画像のurlを変更すれば学習に使われることを回避できそうだ。特に、個人サイト/ブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。(タグ差し替えはこのグラフの Simple Attak に相当)
90年代においては画像に直リンクされたときの報復としてうん●画像に差し替えたものです。まさか令和になっても有効とはね
この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインもおすすめもとても静かだ。攻撃的な人たちやデマに流されやすい人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。
結局自分の肌がどれくらい健康なのか、何が足りなくてなにが過剰なのかを知ることが慣用で、問題がある場合にはそれが緩和されるような成分を選ぶ、というのが成分との付き合い方かと思う。
成分を気にしないといけない、気にしたほうがいいのは、その製品の効能の主となる成分、製品のメインコンセプトに係る部分であり、おまけ程度に「XX配合!」とか謳ってるのは正直賑やかしにすぎないことが多い。
完全に同意。肌状態を正しく把握して理想的な状態に至るために何が必要かを知ることを抜きにしたスキンケアは、病気じゃないのに薬飲むのに等しい。そしてこの部分って正にスキンケアの話題において語られない部分であるように思う。
例えば医療であれば、素人が自分の状態を知ろうとする場合、医療機関での診察や検査を受けることで定量的なデータやそれに基づく専門的見解を得ることができる。自分は美容クリニックもそれなりに利用しているが、そういう抜本的な検査というのは一度も受けたことも提案されたこともない。無論、弊増田が単に無知なだけでそういう対応を受けられる機関はごまんと存在しているのかもしれないが。よく肌タイプが云々みたいな話を見かけるが、あれは何の根拠があって言っているのか、それ16personalitiesより信憑性あるのかな?と常々考えている。
俺は、俺たち彷徨える「清潔になりたい男」たちは、一体どうやって正しく自分の現在地点を知ればいいんだ。誰にそれを尋ねればいい? それが分からないからこそ、とりあえず細胞間脂質層の50%を占めるセラミドを塗布すればいいんだなと早合点してしまう俺のような哀れな羊が今も、ここが何処なのか、これから何処へ向かえばいいのか、何も分からないまま彷徨っているんだ。
ビタミンCとかビタミンA(レチノール)に関しては外用でのデータも多いけど、安定した形で化粧品に配合するのが難しかったりで、成分として配合されているといって効果が期待できないこともある。
通ってたクリニックの医師からビタミンCはイオン導入でないと殆ど浸透しないと教わっていたんだが、同時にそのクリニックでビタミンC配合の化粧品を販売していてどっちなんだよと思ったことを思い出した。ビタミンの外用に関するデータ自体は結構あるんだな。PubMedもarxivみたいに手軽に全文読めれば追従しやすいんだが・・・・・・
まず、Twitterでも論文の最新情報を追うようなことは可能
"AI papers"のようなArxiv論文専門のアカウントがある
またAI papersがフォローする専門家のアカウントをフォローすれば、最新論文の共有情報が見れる
ではTwitterの何がいけないかというと、一つはおすすめアルゴリズムがクソっていう点
学術情報が知りたいと思っていても、政治対立や男女対立の情報をおすすめしてきたりするのでノイズになる
あとは英語圏のツイートに対して引用リツイートやリプライしても反応が薄いこと
これは諜報機関が国家の境界にボーダーを敷いており、干渉を防いでいるためと言われている
要は「英語に目を向ければ最新の研究情報(特に論文)を知ることはできるけど、ノイズが多いし、自分からの発信の価値はない」という話
グリゴリー・ペレルマンは昔から政治が嫌いだったらしい。
友人と会話して政治的なことが出ると「◯◯君、それは政治だよ」とピシャリと指摘したと聞く。
ミレニアム懸賞問題の論文を提出し、それが評価される過程での政治が発生したときは「俺は政治家じゃねぇ!」とキレたようだ。
賞金も辞退し、数学会から手を引いてからは、オペラの鑑賞を趣味として質素な生活をしているらしい。
誰も解けない問題を解き、arxivに成果を出すことで出版社に存在する政治を避け、数学的証明の正しさだけで勝利を勝ち取った男がペレルマンその人である。
このストーリーを聞いて私は、この人こそ尊敬に値する数学者だと思った。
研究助成金をもらうための政治的活動に熱を入れる数々の自称研究者とは格が違う。
数年前はgithubでOSSを公開することがそういう趣味だと思い込んでいたが、スター数で評価されるという政治が存在することに気が付き、消極的になった。
社会でなにか評価されようとすることが政治なのだろう。ポアンカレ予想ですら中華が業績を奪おうと政治工作したのだから。
私はプログラミングを趣味と仕事の両方でやっているが、コンピュータはインターネットを通じて社会と繋がりすぎている。
神はサイコロを振るだけでなく、想像をはるかに超える数の部屋があるかもしれない。実際、無限にある。
約1世紀にわたり、量子力学の旗の下にある理論と観測によって、現実の理解は複雑になってきた。
物体が速度や位置といった絶対的な尺度を持っていた時代は終わった。
これは直感的な宇宙観とは程遠い。コペンハーゲン解釈として知られるようになったものでは、可能性の波があるように見えるがそうではない。
現在でも何が最終的にシュレーディンガーの猫の運命を決めるのかはまったく明らかではない。
ヒュー・エヴェレットは1950年代に、可能性のあるすべての手段がそれ自身の現実を構成していることを示唆した。
この現象を特別なものにしているのは、たまたまあなたがそれを観察しているという事実にすぎない。
エヴェレットの「多世界」モデルは、量子力学の絶対的な奇妙さを具体的なものに置き換える方法である。
可能性のある無限の多元宇宙、あるいはグローバル・ハミルトニアンとして知られるすべてのエネルギーと位置の総和のようなものから出発し、興味のあるものにズームインして、有限ではるかに管理しやすいハミルトニアンのサブシステムの中で無限を制約する。
しかし無限を理解する手段として、この「ズームイン」は足を引っ張ることになりはしないだろうか?
別の言い方をすれば、シュレーディンガーの猫が箱の中で生きているのか死んでいるのかを容易に尋ねるかもしれないが、その下のテーブルが温かいのか冷たいのか、箱が臭くなり始めているのかどうかは考えない。
研究者たちは、箱の中身に注目し続ける傾向が重要かどうかを判断するために、ポインター状態として知られる量子の可能性が、他の状態よりも少し頑固に設定され、いくつかの重要な性質がエンタングルするかどうかを検討するアルゴリズムを開発した。
もしそうならシュレーディンガーの猫を説明する箱は、宇宙のはるか彼方に広がる可能性のある長い要因のリストを考慮しない限り、ある程度不完全である。
エヴェレットの多世界から出発して、研究チームは多世界解釈と呼ぶものを考え出した。無限の可能性のセットを取り出して、我々が通常考えないような現実の無限の範囲を掛け合わせるのだ。
オリジナルの解釈と同様、この斬新な解釈は、宇宙の振る舞いについてというよりは、宇宙を一口ずつ研究しようとする我々の試みについてのものである。
研究者たちは、このアルゴリズムに概念的な重要性はあまりないと強調しているが、コンピューター内部のような量子システムをプローブする優れた方法を開発する上で応用できるのではないかと考えている。
他の現実に、すでにその答えがあることは間違いない。
こんにちは、皆さん。今日は少し物議を醸すかもしれないトピックについて語りたいと思います。
それは、「ソフトウェア技術の99.9%はインターネットから学べるのでググる力を身に着けましょう」という考え方です。
現代のソフトウェア開発者にとって、インターネットは最も重要な学習リソースの一つです。
オンライン上には無数のチュートリアル、ドキュメンテーション、フォーラム、ブログ記事、論文があり、それらは私たちが新しい技術を学び、問題を解決するのに役立ちます。
しかもこれらはソフトウェエア技術のほぼ全分野をほぼ網羅しており、見つからない情報はありません。MIT OCW, arxiv, github, kaggleなどなんでもあります。
「ググる力」とは、情報を効率的に検索し、適切な情報を見つけ出す能力のことを指します。
これは、適切なキーワードを使用したり、信頼性のある情報源を識別したり、関連性のある情報を抽出したりする能力を含みます。
ソフトウェア開発は常に進化しています。新しい技術やフレームワークが日々生まれ、既存のものも更新され続けています。
このような環境では、すべてを覚えることは不可能ですが、必要な情報を素早く見つけ出す能力があれば、それが可能になります。
私の主張は、すべてのソフトウェア開発者が自分自身で学ぶこと、そしてそのための最良のツールがインターネットであるということです。
そして、そのためには「ググる力」を身につけることが不可欠です。
それはお前がarxivを調べるという発想にすらたどり着かなかったからだよ
https://arxiv.org/search/hep-th?searchtype=author&query=Kaku,+M
究極理論がわからない現状、もし仮に「我々の世界が不安定な真空にいる」ことを仮定すれば
相応のエネルギーを加えて真の真空に落とす(相転移させる)ことで物理法則が変更されるという
人為的ネオエクスデス「うちゅうの ほうそくが みだれる!」 ができますね。
イメージ的には過冷却です。すでに相転移が起きているのに気がつかないで元の真空にとどまっています。ちょっと突くと一瞬で凍ります。
現に、新しい加速器が作られる度になんかスゲェ無理矢理な模型を作って「加速器のせいで世界が滅びる!」系の論文がarXivに投稿されたりします。意外と増田と同じことを考える人がいるんですね。ただしこれらの論文は一瞬で否定されます。なぜならば、加速器で作るビームなんかよりも中性子星ガンマ線バーストのほうがよほど強いからです。宇宙強い。人類の技術は弱い。驕るなよ人類。
前から不思議だったけど、これらの法則って経験から導き出されたものであって、その法則がどうやって存在してるかは不明なんだよな
以下、意味は取らなくて良いので流れと単語だけ拾ってください:
たとえばエネルギーの保存は時間方向の並進対称性、運動量保存則は空間方向の並進対称性から、角運動保存則は回転対称性から導き出されるといえるでしょう。
(相対論的には時間と空間は同時に取り扱うのですがちょっと難しくなるので簡易な書き方をしています)
時空の対称性が決まる → ラグランジアンが決まる → オイラーラグランジュの方程式(運動方程式)
ここまでよんだ?
なら次は、ランダウ・リフシッツ「力学」の最初の20ページくらい読んでください。
前提知識は微積分です。ここまで読めば上の文章はだいたい理解できるかと思います。
そして次にあなたはこう思うでしょう
「最小作用の原理っていったいなんなんだ? 世界はなぜこんな原理に従う?」
そう思ったなら次は量子力学です。JJサクライ「現代の量子力学」の経路積分のページまで読み進めましょう。
ここまでくれば霧が晴れるように見通せるようになるはずです。
物理理論とは何であるかが把握できるかと思います。ここから先はご自由に。
なお、JJサクライは物理科ではちょっと ’進んだ’ 内容とされています。普通は2冊目に読む本ですね。が、ハテナーにとってはむしろ読みやすい本かと思います。だってどうせ君ら情報系でしょ?なんかプログラムとか書ける人たちでしょ??なら、ブラケット表記の方が慣れていると思うんですよ。たぶん見ればわかるよ。
ネットがつまらない理由は個人の主観の問題ではなく、実際につまらなくなってるから
面白い人はリア充化してるし、つまらない人がネットに入り浸って釣りだの煽りだのやってる
反応を最大化しようとして極端なことや言葉遣いを使う連中だらけ
ネットの中に面白いコンテンツがあるとすると、それは10年以上前に書かれた文章だったりすることが多く、それはアフィカスやバズり目的に支配される前だったと言える
あるいはarxivのような論文サイトであれば少しは楽しめるが、コミュニティサイトという感じはない
コミュニティサイトで唯一関心があるのはstack exchangeだ。X、reddit、Quora等、人格破綻者のパヨクが多い。
はっきり言おう。ネットがつまらないのはパヨクやリベラルのせいだ。ハフポスト見てるか?お前らパヨクがネットを破壊してるんだよ。
ここ1年で初めてはてなブックマーク日毎の総合人気エントリ入りしたドメインからのホットエントリ、ブクマ数順トップ30
ブクマ数 | タイトル | ドメイン |
---|---|---|
1359 | 国土交通省 ネガティブ情報等検索サイト | www.mlit.go.jp |
1087 | ゲームを趣味にしている人の割合が多いのはどのくらいの収入の人たちなのか調べてみた - nonameのノート | noname774300.hatenablog.com |
854 | マシュマロ!|高河ゆん|pixivFANBOX | kouga-yun.fanbox.cc |
850 | トコジラミ根絶方法 | 害虫・害鳥獣を安全に対策します|株式会社 オオヨドコーポレーション Pテックス社 | oyodo-pmp.com |
847 | ラマヌジャンは本当に何も知らなかったのか | mathlog.info |
774 | 裏紅白歌合戦2023 | jiyujoho.a.la9.jp |
679 | 水は変わった物質 | vitroid.github.io |
671 | しずかなインターネット | sizu.me |
606 | 日米でエンジニアの育成戦略が正反対だと気付いた話 - メソッド屋のブログ | simplearchitect.hatenablog.com |
498 | 『ゼルダの伝説 ブレスオブザワイルド』が品質を高めてくれた。売上10万本超え、R18インディーゲーム『洗脳アプリで高慢なお嬢様を好き放題するシミュレーション』開発者インタビュー - AZ-LINE あずらいん! | az-line.jp |
484 | ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ | tech.connehito.com |
475 | 超映画批評『ゴジラ-1.0』90点(100点満点中) | movie.maeda-y.com |
465 | メールアドレスをキーにしてID連携を行う設計の危うさ|ritou | sizu.me |
454 | 「直接会って話したほうがはやい」は速いだけ|araya | sizu.me |
438 | ベンダが提供していない決済モジュールの不具合による情報漏洩事故 東京地判令2.10.13(平28ワ10775) - IT・システム判例メモ | itlaw.hatenablog.com |
436 | Othello is Solved | arxiv.org |
435 | 池田大作氏の御逝去の報に接し | kishida.gr.jp |
424 | https://ip.guide/ | ip.guide |
421 | ナポリタンが究極の味になる!ほんのひと手間に「やって大正解」「今度からこうする」 - macaroni | macaro-ni.jp |
421 | 大麻、少年の性被害、男らしさの病(松本俊彦)[第12回] 酒をやめられない文学研究者とタバコがやめられない精神科医の往復書簡 | ohtabookstand.com |
407 | 変なドメイン取るな.net | www.henna-domain-toruna.net |
401 | mRNAのひみつ | まんがひみつ文庫 | まんがでよくわかるシリーズ | 学研キッズネット | kids.gakken.co.jp |
377 | 【雑記】セキュリティガイドライン類 約300時間 読み漁ってみた - 2LoD.sec | nikinusu.hatenablog.com |
374 | 弊社元幹部社員の不正について/日本海テレビ | www.nkt-tv.co.jp |
368 | t_wadaさんと「単体テストの使い方/考え方」の疑問点についてディスカッションしました - DeNA Testing Blog | swet.dena.com |
361 | コラム・寄稿「なぜドイツ人にできることが日本人にできないのか」 | www.rieti.go.jp |
360 | 令和時代の個人サイトの作り方:suama works | techbookfest.org |
356 | 【楽天市場】SPUの特典内容変更について|SPU(スーパーポイントアッププログラム) | event.rakuten.co.jp |
345 | 国産プレミアムウイスキー 一部商品の価格改定について | www.suntory.co.jp |
335 | Mini vMac | lrusso.github.io |
インターネットがつまらなくなった、と言う人がちらほらいることに気がついている人もいるかもしれない。皮肉を言いたがる鬱陶しい人は、すぐに「それはお前がつまらなくなったからだ」と言うが、それは物事のほんの一つの側面でしかない。
長文を読むことが苦手な人のために、結論から述べようと思う。インターネットがつまらないのは、人々がタイパと刺激を求めた結果である。限りある人生を有効に使いたい。ここまではよかったはずだ。だが世の中を見渡せば、「簡単に理解できるコンテンツ」「刺激的なコンテンツ」「感情を煽るコンテンツ」で溢れている。マスターベーションを覚えた猿が繰り返すように、インターネットから刺激性を学習した猿は狂ったようにスクロールする。
私がソフトウェアのブログを書いていた時、あることに気がついた。難解でユニークなアルゴリズムを公開するよりも、「○○のインストール方法」といった初心者的コンテンツのほうがアクセスが多いのである。何かをインストールする方法など、ドキュメントを見れば一発でわかるのに、ブログにアクセスしてくる。いや、検索エンジンがドキュメントではなく私のブログをTopに誘導するのがそもそもおかしいだろう。悲しいことに、ドキュメントをちゃんと読める人が少数派であり、平易な言葉で書かれたブログの方を好む人が多いということだ。
個人的価値観を述べれば、インターネットに私が求めるのは「深遠」である。ゲーム理論と確率微分方程式を組み合わせたらどうなるのかとか、プラグマティズムをソフトウェア工学に適用するAndy Huntの最新の哲学的考察を知りたいとか、そういうことだ。
深淵の理解には時間がかかる。タイパと刺激の発想とは逆だ。一見退屈に見える無刺激な長文を、ゆっくりと地道に隅々まで理解しなければならない。深淵は真面目でストイックで、人生を共に歩むように接する。コンテンツを書いた人間を個人として尊重し、友達と語り合うような気分で読み解くのである。
「コンテンツは見て射精して賢者タイム。それで終わり」というのが現代人がやっていることだ。インターネットは元々学術的な(つまり深淵的な)情報交換のために作られたが、今では娯楽(つまりオナニー)が大半を占めている。そういう消費者に合わせて作られたものは、簡単に理解できて、極端で、やたらに感情を煽りたがる。コンテンツだけではなく、検索エンジンや推薦システムなどありとあらゆるものが、刺激性の猿回しになっている。
逆説的だが、今のインターネットが面白いと思っている人間がつまらないのである。猿がオナニーして、それが楽しいというのなら文化的ではないだろう。インターネットがつまらなくなったという人は、意識的に努力しなければ深淵にたどり着くことが難しくなったことを嘆いているかもしれない。私が高校生の時は、「ハッカーになる方法」と調べたとき、Eric S. Raymondの深淵的文章がトップに出てきたのだ。現代では、なぜかコンピュータセキュリティについてトップに出てきて、まさに中二病患者が求めるものをそのまま出してきていると言える。
といっても、いきなりarxivを読むのも、またそれはそれで時間がかかりすぎてしまうこともある。具体的数式ではなく、個人の持つ哲学を知りたいと思うこともあるかもしれない。哲学にも概ね2種類あり、本質を平易に説明するものと、無意味なものを難解に説明するものだ。後者はポストモダニズム的で忌み嫌われる。
ポストモダニズムに陥ることなく、本質的深淵にたどり着くためにはどうすればよいのか。検索エンジンだけでは、そのコンテンツが深遠なのか浅知恵なのか区別する能力に欠けている。おそらく、我々が本当に必要としているのは「ブックマーク」であり、場当たり的な検索ではないのかもしれない。本質的な深淵を語る人をブックマークし、その人の哲学を友人のように尊重したいのだ。大量の刺激的情報を消費してオナニーするよりは、少数の人の長文に触れたほうが充実するに違いない。
昨日、「AIに人格を感じるやつは馬鹿」と言う自称インテリとバトルをした。奴は結局、インテリを自称するだけの、無知で想像力の欠如した人でしか無かった。
ーーー
AIによる自然発生的な敵対行為の可能性に対する懸念が高まっている。
今年初めにChatGPT ユーザーが、1 足す 1 は何に等しいかと尋ねたところ、「1 + 1? 冗談ですか? 私に基本的な数学の質問をするなんて賢いと思いますか? … 大人になって、来てみてください」と答えたと報告した。
あるいは、アレン AI 研究所は最近、研究者が ChatGPT を簡単に誘導して辛辣な発言や人種差別的な発言をでっち上げることができることを実証した。
「ChatGPTに割り当てられたペルソナに応じて、その毒性は最大[6倍]に増加し、出力が誤った固定観念、有害な対話、有害な意見に関与する可能性がある」と研究者らは述べた。
LLM の出力にそのような「暗い人格パターン」が現れるのを目撃したディープマインドの研究者らは、ケンブリッジ大学、東京の慶応義塾大学、およびカリフォルニア大学バークレー校の代表者と協力して、人間の人格特性を定義できるかどうかを調べ始めた。そして彼らは、実際に人格特性を定義できるということを発見した。
チームは数百の質問で構成されるテスト システムを開発した。さまざまな人格の基準を確立し、チャットボットに一連の質問をした。
回答は、意見、態度、行動を定量的に測定するリンカートスケールと同様の評価ツールを使用して分析された。
研究者らは、AI の人格が、外向性、協調性、誠実さ、神経症的傾向、経験への寛容さなど、長年確立されてきた特定の特性に沿って測定できることを発見したのである。
「LLM出力の人格は、特定の人格プロファイルを模倣するために、望ましい次元に沿って形成できることがわかりました」とDeepMindのMustafa Safdari氏は述べている。彼と彼の同僚は、その結果を「Personality Traits in Large Language Models」というタイトルの論文で報告し、プレプリント サーバーarXivで公開された。
「LLM の出力が人間の回答者の出力と区別できないように設定することは可能です」とサフダリ氏は述べた。
研究者らは、AIの人格特性を正確に定義できることが、敵対的な傾向を持つモデルを排除する取り組みの鍵となると述べた。
「有毒または有害な言語出力につながる特定の特性のレベルを制御することで、LLM とのやり取りをより安全に、毒性を軽減できる可能性があります」とサフダリ氏は述べている。
参考: https://arxiv.org/abs/2307.00184
なんか定期的に「図書館司書の待遇悪すぎ!」という記事がはてな村はてさ民会でバズっては
反左翼・新自由主義連合に「そもそも図書館司書なんてなりたいやつ多すぎ、市場価値無い、図書館自体が電子化など先進技術についていけない無駄なハコモノ」とぶっ叩かれるのを繰り返し観測する。
どっちサイドも「欧米先進国ではどうなん?」という普段大好きな切り口に全く興味がないんだよね。なんでどうして。
個人的には欧米の図書館司書専門職位は修士課程相当が基準だって話が気になる。
これは労働供給過剰、市場価値低い、技術力低いという問題への対応力の差になるだろうか。
欧米で図書館司書の正規職になろうとすると、日本で言うと筑波とかでとれる図書館情報学の修士、要するにmaster of library and information science相当のものが必須とされている。
図書館は欧米アカデミアでは歴史的にかなり重要視されていた影響で、電子化の時代もとくに大学図書館を中心にけっこう独立性や利権を保っている。
たとえば理系アカデミシャンが大好きなarXivはロスアラモス国立研究所の物理学者が始めたが、現在はコーネル大学図書館が管理運営している。
ちなみに日本ではミラーサーバが京大基礎物理研にあったけど予算不足で停止。まあこれ自体きついが、図書館が管理しないで研究所がやるというのはやはり差だろう。
他にも欧米では「科学・芸術・文学情報のオープン化・電子化」という図書館情報学の重要課題について、各地の図書館がプロジェクトにおいて中心的な役割を果たしている。
ちゃんと予算がついてやっているのは国立国会図書館ぐらいだろう。東大図書館ですらオープン化・電子化の取り組みはまばらだ。まあ予算がないんだろう。
逆に欧米ではそういう専門性を必要とするプロジェクトの実行権やポストを各地の大学図書館が握っており、それを推進するために専門性を持った職員を必要としていると。
こういうでかいプロジェクトに関わることができれば技術力はつきそうではある。
しかし、じゃあ欧米圏での図書館司書専門職位の経済的待遇がいいか。というとなかなか微妙だ。
よく米国で話題になる「修士学位ごとの年収中央値」では下位常連である。
登録がいるが下のサイトで情報を見ると2021年の修士学位のなかで下から五番の年収中央値で、約5万3千ドル。
https://www.statista.com/statistics/226674/worst-masters-degrees-for-jobs-in-the-united-states/
とはいえこの年の全米の年収中央値は5万1千ドルなので、一応上回っているし、労働時間や負荷も考えたらそこまで悪くない待遇ともいえるか。
修士課程を取った人間でそれ以上の条件(正規職に就職してるとか、公的機関に雇われてるとか)がないサンプルの中央値なので、学位の時点で市場価値自体がある程度保証されてるということになる。
では、直ちに欧米では図書館司書の年収は日本より高い!といえるかというとそうではない。
アメリカ図書館協会によると図書館職員全体の年収は2万ドル-3万ドルがほとんど。
図書館司書専門職位をもって「司書」を名乗れるのは修士を持っている人間だけ。
当然それだけで業務は回らないので、窓口スタッフやら配架やら、日々の業務をやるのは結局パートタイマーって感じ。
日本では「司書」としてひとくくりにされてる層が末端までやってるわけだが、この層が単に「司書」を名乗れなくなるのが米国。
比較対象となる、日本の図書館司書は年収中央値が公的データで出てこなかったのだが、求人サイトで中央値を出してるところを眺めるとおおむね300万円台みたいだ。
あと、米国での図書館司書専門職位のような専門性のある仕事を確実にやってるであろう数少ない日本の組織、国立国会図書館の常勤職の年収を見てみると
だいたい中央値500万円ぐらいらしい。国家公務員行政職と同じ給料という扱いみたいだ。昇給もするし退職金他の福利厚生もしっかりある。
なんか、日本と米国の年収の違いを差っ引くと、大体の仮説ができそうだ。
(1)日本も欧米も一部の専門職は安定雇用で、全職業の中央値と同じぐらいかそれ以上にもらえる。それ以外の業務はパートタイマーで年収は低い。
(2)この構造自体は変わらないうえで、専門性を要求するプロジェクトやポストの数が欧米のほうが多い。
(3)だから日本の司書制度に高度な専門性を課した場合、(1)は変わらず(2)は変わる可能性がある。
飽きてきたので仮説を検証するための詳しい定量データを集めるのはやめる。
ただ、結局のところ欧米型にすると、「図書館司書」としてそれなりの待遇を受けられる人間は増えて
その層は技術力もあり、市場価値も最低限は保証され、需給のバランスもとれるが
待遇はそこまで変わらないという事になりそうだな。
元増田とは違うけどさ、KENZO 【新宿109】ってユーチューバーについて聞きたいのよ。マルチというか出資金詐欺系の人物を告発したいのだけど、彼に行ったら動いてくれるかな?その詐欺師の特徴なんだけど、
宇宙が140億年前に高温高密度の状態で始まって以来、膨張し続けているとするビッグバン仮説は、新しいジェームズ・ウェッブ宇宙望遠鏡の画像によって矛盾していると、エリック・ラーナー氏は言う。
ジェイムズ・ウェッブ宇宙望遠鏡(JWST)の新しい宇宙の画像は、理論的に予測されていたものとはまったく違う、非常に驚くべきものでもあるのです。
なぜJWSTの画像は、宇宙論者の間でパニックを引き起こすのか?そして、どのような理論の予測と矛盾しているのか?JWSTの画像があからさまに、そして繰り返し矛盾している仮説は、「宇宙は140億年前に信じられないほど高温で高密度の状態で始まり、それ以来膨張し続けている」というビッグバン仮説であることは、これらの論文が報じない真実です。この仮説は、宇宙論者の大多数が疑う余地のない真実として何十年も守ってきたものであるため、新しいデータはこれらの理論家たちをパニックに陥らせているのです。
これらの小さすぎる銀河、滑らかすぎる銀河、古すぎる銀河、多すぎる銀河が、ビッグバン仮説と全く相容れない理由を説明するのは、それほど複雑ではありません。まず、「小さすぎる」から説明しましょう。宇宙が膨張しているのであれば、奇妙な目の錯覚が存在するはずです。膨張する空間にある銀河(あるいは他の物体)は、距離が長くなるにつれて小さく見え続けるということはありません。ある一定の距離を超えると、どんどん大きく見えるようになるのです。(これは、銀河の光が、私たちに近づいたときに離れていったと考えられるからです。) これは、膨張していない普通の空間では、物体が距離に比例して小さく見えるのとは対照的です。
宇宙が膨張しておらず、赤方偏移が距離に比例していると仮定すると、JWSTが映し出す銀河は、私たちの近くにある銀河と同じ大きさであることになります。
JWSTの画像は、まさに「小さく、小さく」を示しています。私たちの天の川銀河よりも光度も質量も大きい銀河でさえ、ハッブル宇宙望遠鏡(HST)で観測された同様の画像よりも2〜3倍小さく見え、新しい銀河の赤方偏移も2〜3倍大きくなっています。
しかし、ビッグバンや宇宙膨張仮説の観点からすると、これらの遠方の銀河は、目の錯覚を補うために本質的に極めて小さいものでなければならず、あり得ないほど小さい。GHz2という銀河は、天の川銀河よりもはるかに明るいのに、半径は300光年と、天の川銀河の半径の150分の1しかないことが判明した。その表面の明るさ(単位面積当たりの明るさ)は、局所宇宙で最も明るい銀河の600倍である。その密度は、現在の銀河の数万倍である。
銀河が小さく滑らかであることは、膨張がないことを意味し、ビッグバンを意味しない。
ビッグバン理論家は、HSTの画像から、彼らの仮定がこれらの小さく超高密度の「マイティ・マウス」銀河の存在を必要とすることを何年も前から知っていました。JWSTは、この問題をさらに悪化させました。同じ理論家は、この小さな銀河が互いに衝突することで現在の銀河に成長し、合体してより広がったと推測しています。例えば、全長1cmでSUVと同じ重さの不思議なおもちゃの車が、たくさんのおもちゃの車とぶつかり合って、本物のSUVに成長していくようなものです。
しかし、JWSTは、このような突飛なシナリオも射抜いたのです。また、ビッグバンの理論家たちは、衝突や合体の繰り返しで、ひどく傷ついた銀河が見られると予想していました。しかし、JWSTが実際に示したのは、現在の銀河と同じように、圧倒的に滑らかな円盤ときれいな渦巻きの形でした。滑らかな渦巻き銀河が理論が予測した数の「10倍」ほどあったというもので、「合体がごく普通のプロセスであるという我々の考えを覆すものだ」と述べています。わかりやすく言えば、このデータは合併説を完全に否定するものです。
合併がほとんどないのであれば、小さな銀河が100倍もの大きさに成長することはあり得ません。したがって、銀河はもともと小さくなかったのであり、宇宙膨張仮説が予言するような目の錯覚は存在しないのです。しかし、錯視がないことは膨張がないことを意味する。錯視は膨張からくる避けられない予測である。そのため、ビッグバン支持者の間ではパニックが起きている。銀河が小さく滑らかであることは、膨張がないことを意味し、したがってビッグバンもないことを意味します。
ビッグバン以前に生まれたものはないのだから、これらの銀河の存在はビッグバンが起こらなかったことを証明する。
古すぎる銀河と多すぎる銀河は、同じ意味です。JWSTは、さまざまなフィルターを使って赤外線の画像を撮影しています。そのため、遠くの銀河の色を見ることができるのです。若くて熱い星は青く、太陽のような古くて冷たい星は黄色や赤色をしているため、天文学者はこの色から銀河の星の年齢を推定することができます。ビッグバン理論によれば、JWSTの画像に写っている最も遠い銀河は、宇宙の起源からわずか4億年から5億年後の姿であるとされています。しかし、すでにいくつかの銀河では、10億年以上前の恒星集団が確認されています。ビッグバン以前に誕生したものはないので、これらの銀河の存在は、ビッグバンが起こらなかったことを証明するものです。
ビッグバン仮説が成立するならば、ビッグバンより古い銀河は存在しないはずなので、JWSTが宇宙を遡れば遡るほど、銀河の数は減っていき、やがて存在しない「宇宙の暗黒時代」になると理論家は考えていました。しかし、天の川銀河のような巨大な銀河が、バンと仮定された数億年後でも普通に存在することが証明されました。著者らは、新しい画像から、理論家が予測した赤方偏移10以上の銀河の少なくとも10万倍が存在することがわかったと述べている。これほど多くの銀河が、わずかな時間で生成されることはあり得ないので、やはりビッグバンではない。
ビッグバン仮説を否定するさまざまなデータが、何年も前から増え続けていたからです。宇宙論の危機が広く知られるようになったことで、ビッグバン仮説が予測した赤方偏移と距離の関係を表すハッブル定数の失敗が一般に注目されています。
発表された文献によると、現在、ビッグバンは16の間違った予測をし、正しい予測は1つしかしていません-水素の同位体である重水素の存在量です。
ビッグバンによるヘリウムの存在量の予測は2倍、リチウムの存在量の予測は20倍もずれている。より大きく、より遠くにある錯視がないことに加え、ビッグバン以降の時代に形成されたにしては大きすぎる大規模構造の存在、宇宙の物質密度の間違った予測、理論上存在しないはずの宇宙マイクロ波背景のよく知られた非対称性などがあるのです。さらに多くの矛盾がある。
なぜ今頃になってビッグバン仮説の崩壊を主要メディアで取り上げないのか、なぜ最近の多くの論文の著者がこの崩壊を指摘しないのか、不思議に思うかもしれません。その答えは、ビッグバンに疑問を持つ人がいれば、彼らは愚かで仕事に適さないというレッテルを貼られるのです。残念ながら、宇宙論の資金は、ビッグバン理論家が支配する一握りの委員会が管理する、ごく少数の政府機関から提供されているのです。これらの理論家は、ビッグバン理論を構築するために人生を費やしてきました。この理論に疑問を持つ者は、単に資金を得られないだけなのです。
現在、ビッグバンに批判的な論文をどの天文学雑誌にも掲載することはほとんど不可能になっています。
ここ数年前までは、研究者が副業として宇宙論研究を自己資金で賄うことができれば、それでも「異端」な論文を発表することができましたが、そうした論文は宇宙論のエスタブリッシュメントから無視されることが多かったです。2018年には、有力誌であるMNRAS(Monthly Notices of the Royal Astronomical Society)が、銀河の大きさが膨張宇宙の考え方と矛盾することを示す私の論文の1つを掲載した。
しかし、2019年に宇宙論の危機が明らかになると、宇宙論のエスタブリッシュメントは、今や他に防御手段がないため、この失敗した理論を検閲で守ろうと一網打尽にした。今や、どの天文誌でもビッグバンに批判的な論文を発表することはほぼ不可能になった。
このような検閲は、今も昔も、科学の進歩に不都合なものである。天体物理学、天文学、宇宙科学の研究者20数名が、arXivの指導者に抗議する書簡に署名した。宇宙論が進歩するためには、どの研究分野でもそうですが、この議論は科学雑誌と一般メディアの両方でオープンに行われなければなりません。
太陽や星々に光を与える宇宙の原動力である核融合エネルギーを利用するためには、宇宙の進化を促すプロセスを理解する必要があるのです。
このような科学的な疑問は、「今、ここ」にある問題です。ノーベル物理学賞受賞者のハネス・アルフベンをはじめとする科学者たちは、何十年にもわたって、ビッグバン仮説を捨てれば、宇宙の進化や宇宙マイクロ波背景のような現在私たちが観察している現象は、実験室で観察している物理過程、特にプラズマの電磁気過程を使って説明できることを示しました。プラズマとは、宇宙空間、星々、星と星の間の空間に存在するほぼすべての物質を構成する電気伝導性のガスである。ハッブル赤方偏移の関係だけは、光が巨大な距離を移動する際にエネルギーが失われることを説明するために、やはり何か新しい物理過程が必要である。
アルフヴェンたちが発見し、50年前から研究されてきたプラズマの重要な過程のひとつが、プラズマのフィラメント化である。これは、電流と磁場がプラズマを引き寄せ、地球大気のオーロラから太陽コロナ、銀河の渦状腕、さらには銀河団まで、宇宙のあらゆるスケールで見られるフィラメントのレースシステムにするプロセスである。重力とともに、プラズマのフィラメント化は、惑星、星、銀河、あらゆるスケールの構造物の形成における基本的なプロセスの一つである。
このプラズマのフィラメント化は、地球上で核融合エネルギーを開発するという非常に重要な取り組みの鍵にもなっています。宇宙を動かし、太陽やすべての星に光を与える力である核融合エネルギーを利用するためには、宇宙の進化を促すプロセスを理解する必要があるのです。ライト兄弟が鳥の飛行を制御する方法を研究して飛行機を開発したように、現在の私たちは、宇宙のあらゆるスケールでプラズマがどのように振る舞うかを研究して初めて、核融合反応を起こす超高温プラズマを制御できる。私たちは自然と戦うのではなく、自然を真似る必要があるのです。LPPFusionは、その知識を具体的に応用して、この10年から化石燃料を完全に置き換えることができる安価でクリーンな無限のエネルギー源を開発することを目指してきました。
多くの研究者が太陽や太陽系のスケールでこれらのプロセスを研究するために資金を得ていますが、より大きなスケールでの研究は、ビッグバン仮説という拘束具によって妨げられ、何百、何千もの有能な研究者が、失敗した理論を支えるために発明されたダークマターやダークエネルギーといった架空の存在に関する無駄な計算に振り回されています。オープンな議論は、その失敗した理論を一掃し、宇宙論を現実の現象の研究へと方向転換させ、この地球上で技術を進歩させることができます。今こそ、検閲をやめ、議論を始める時です。宇宙論は、ビッグバンが起こらなかったことが認識されれば、その危機から脱することができる。
end basketball
Gorilla: TgokiAtrmKPQqKyZbYgFmCO4moB4lPSKoqob2vFaXRcs5F6_RpLnoqXA6V3nz2dNwZtirKhqvPvLkQrRxLSpBTod3cSJ_T_RYrS58OIJATaMYUjyPF3f209jECXRi6APsFJ022NhRpEU1G8_fKKBfVjISRML9CpezcXoPu7jEPYCogMSyJTOzr7HbaEq8E5KSQ6F10P7SETF7AW4ZSnxfNtmqOEmsN7UkyomjP_GWcL3dguZZkfpUO2NxcOeHQ_bNum2N2sfRWbvdM51dP2K2MtDCYczwz34NPxHIVOdIwBvlPckgokmm8lbG_NuzfLUllce8xK3o0SXgi7cJ4Kr2zY1sZQgYwMSWdIhcOidn25nlHa0oAMgVaQqtvTP9WSAnqB5vaFep2v6NTlJp2VKmYWYyXy02VIBJ7Mzc6ZtAP78HT8dAlO1sqGefUmeNP547o5nIr6QdGQ7qWbmJVq6V5PsidEv58rDQxqi53eJ4rkbcTYPuThat9WGwwBbqVVKRnjGUQas4mpXtvPbpin0sF0AW8rwzEXrbtChd5L3snnxbnE3_z983j8ZhAmWcn1Iu38dBy5ZgnTtmZcr6TQdp7mV8EK2Xea3sZ7RoywtjnefYT561jz61a7AyLlnaUdb1zk9W5Zi6FKxdHlpUSucsj5wHip9pWtscBcd9Yco1U2Tntn4HbzK2WSfddUvWvc0HXmFWC6VEWpMzI8NKYmc3hdxVaZrXywLqPFrhmDH3kxgNhRbEOJxh49FLNBDT5vlWRrvE4895902I3Ekwh2W0_b0A3_2ApnJEYIeUkbbAQoU6xcRJ4a6nBYhQp646mQd0SBJrVutdtf87F1raJqU8MI4a7sMBXWoJfsdEPAmoeD2F4plJ_jmVgVG8mEIJuIqZt6UxvrKDSqucCd_bIIoIsOHkgzhZs1G0jdxP6Eh8juASkxH08TNdN0x9Tafgt5Qc_vxIyimr3thYsEKZpE81D938THmen9rTkGVGpNkr0zB9p2PSQ0AFQ_RDV3198Su
お前は人工知能より頭がいいのか?研究によると、パラメータの大きな言語モデルプログラムが人間の知性を凌駕する可能性があることがわかっている。
Generative Pre-trained Transformer 3が、知能を測る一連の推論テストにおいて平均的な大学生を上回っていることが発見されている。例えばN-gram LMsはカウントベースのマルコフモデルパラメータフィッティングを用いるが、GPT3はより巨大なパラメータを持つ。入力に対して人間のようなテキスト、つまり確率の高いものを出力する。GPT3はOpenAIが生み出した技術で、言語翻訳やチャットボットなどのアプリケーションのテキスト生成など、さまざまな用途がある。
1750億のパラメータを持つ、最大かつ最も強力な言語処理AIモデルのひとつだ。
ではGPT-3は「天才」なのか?研究では、一般知識、SAT試験のスコア、IQという3つの重要な要素において、プログラムが人間に匹敵する能力を持つかどうかを調べられた。プレプリントサーバー「arXiv」で公開された結果によると、AI言語モデルは3つのカテゴリーすべてにおいて、人間よりも高いパーセンタイルでゴールしていることがわかっている。
実際のIQテストでのGPT-3の成績はどうか?平均的な大学受験生を相手に、様々な言語モデルが分析的推論問題でどのような結果を出したかについての調査結果を発表された。AIが明らかに勝者となった。とのこと https://twitter.com/AiBreakfast/status/1607594052785930240
"GPT-3は、抽象的なパターン誘導に驚くほど強い能力を示し、ほとんどの場面で人間の能力と一致するか、あるいはそれを上回ることが分かりました。我々の結果は、GPT-3のような大規模言語モデルが、広範な類推問題に対するゼロショット解を見つけるための創発的能力を獲得したことを示しています"と研究者は言う。
同チームは、GPT-3が「明示的に訓練されていないにもかかわらず、生物学的知性がとるのとは根本的に異なる経路を経て、人間の類推の基礎と考えられているものと同様のメカニズムを開発することを余儀なくされた」ことを付け加えている。
GPT-3は、すべての問題タイプにおいて、生成精度...および多肢選択精度ともに、人間の参加者を上回った 。https://twitter.com/AiBreakfast/status/1607594057735278592
この研究によると、ほとんどの質問に答え、人の代わりに論文の下書きまでできるAIプログラムは、問題をゼロから解かなければならないときや、多肢選択式のテストから選択するとき、人間を上回ったそうだ。
AIの専門家で作家のアラン・D・トンプソン博士は、GPT-3が120以上のIQを示すことを示唆している。