タグ

AIに関するrodoriのブックマーク (166)

  • 最近、AIが長年の悩みを次々と解決してしまう

    最近、AIが長年の悩みを次々と解決してしまう 2025.01.12 Updated by Ryo Shimizu on January 12, 2025, 09:12 am JST 今日は特に強いメッセージとかはない。 ただ、正月休みの次に来た連休で、特に休んですることもない。まあすることがあるとすれば仕事くらいだ。 今日はこの後シラスの特別講義の仕事があるが、まあそれも半分は趣味みたいなもので、もっと真剣に取り組むべき仕事もいくつか抱えている。これは休みという概念がないのでまあ置いておく。 ただ、最近、OpenAI o1の正式版が出て、さらにo1 pro modeとかが出てきてしまったことで、僕の長年の悩みがどんどんなくなっていく現状について語っておきたい。 長年の悩みというと大袈裟だが、「こういうプログラムがあれば便利なのに」と思っていたようなことが、o1 pro modeに頼むと、次

    最近、AIが長年の悩みを次々と解決してしまう
  • 2024年にAI分野で何が起きていたのか振り返り、2023年に市場を席捲したGPT-4を上回るAIモデルが多数登場しコンテキストウィンドウの拡張やマルチモーダルモデルが一般化して価格も急落

    元Eventbriteのエンジニアリングディレクターであり、オープンソースツール・Datasetteの開発者でもあるサイモン・ウィリソン氏が、2024年に人工知能(AI)分野で起きた出来事をまとめています。 Things we learned about LLMs in 2024 https://simonwillison.net/2024/Dec/31/llms-in-2024/ ◆GPT-4の壁が完全に破られる 2023年3月に公開されたOpenAIの大規模言語モデル(LLM)「GPT-4」は、同年の12月時点では最も優れたパフォーマンスを示すAIモデルでした。しかし、2024年の終わりにはオリジナルのGPT-4よりも優れたパフォーマンスを発揮するAIモデルが多数登場しています。 LLMのパフォーマンスを比較するためのオープンソースAIベンチマークであるChatbot Arenaによる

    2024年にAI分野で何が起きていたのか振り返り、2023年に市場を席捲したGPT-4を上回るAIモデルが多数登場しコンテキストウィンドウの拡張やマルチモーダルモデルが一般化して価格も急落
  • コンピュータ操作が自動化されると真っ先に困る人たちについて|shi3z

    昨年、OpenAIが最後までComputerUse、つまりコンピュータの自動操作する、いわゆる「物のエージェンティックAI」を出さなかったことが腑に落ちなかったのだが、よくよく考えると、作るのは簡単でも、それを世に放つのは難しい問題というのがある。 特に今年から正式にOpenAIは非営利団体ではなく営利団体になった。 営利団体というものが目指すものは、当然ながら営業利益である。 さて、ではComputerUseがChatGPTのように「誰でも」使えるようになると困るのは誰だろうか。 まず最初に困るのは、おそらくGoogleだ。だが、すでにサム・アルトマンはGoogleは敵に回してもいいという判断をしている。だからChatGPT Searchを作って、デフォルトの検索エンジンとして使うように勧めている。ただ、まだデフォルトの検索エンジンにするにはChat GPT Searchは不便なことが

    コンピュータ操作が自動化されると真っ先に困る人たちについて|shi3z
    rodori
    rodori 2025/01/05
  • これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z

    今日もいつものようにシラスでデイリーAIニュースを配信していると、とんでもないものにでくわした。 もうタイトルに書いてあるけど、AIが勝手にブラウザを操作して色々やってくれてしまう、その名もBrowserUseだ。 インストールは超簡単。 macなら以下の二行だけだ。 $ pip install browser-use $ playwright install使うのも超簡単だが、コマンドラインに落ちるのが怖い人々には簡単に見えないかもしれない。環境変数のOPENAI_API_KEYとかにAPIキーを入れておくこと。 $ python >>> from langchain_openai import ChatOpenAI >>> from browser_use import Agent INFO [browser_use] BrowserUse logging setup complete

    これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z
    rodori
    rodori 2024/12/24
  • 米OpenAI、新たなAIモデル「o3」発表 「AGI」に最も近い性能に

    o3は、高度な推論が可能な「o」シリーズの最新AIモデルで、o1の次世代モデルに当たる。o3の他にも、小型モデルに当たる「o3-mini」も開発。o3-miniは、o3よりも思考時間が短く、コスト効率も優れているという。同社はまず、2025年1月末ごろにo3-miniから一般提供を始める予定だ。 関連記事 ChatGPTに“月額3万円”の新有料プラン登場 最高性能の「o1 pro mode」などAIモデル&ツール使い放題 米OpenAIは、新たな有料サービス「ChatGPT Pro」を発表した。現時点での同社の最高性能のAIモデル「OpenAI o1」を含む全AIモデルやツールを無制限で利用できる。 動画生成AI「Sora」ついに登場──OpenAIが提供 最大20秒の動画作成可能 ディープフェイク対策にも慎重 米OpenAIは12月9日(現地時間)、動画生成AI「Sora」を同日から提供

    米OpenAI、新たなAIモデル「o3」発表 「AGI」に最も近い性能に
    rodori
    rodori 2024/12/21
  • AIモデルに「不要な知識」を忘れさせる新技術。より効率的なAIが作れるかも

    AIモデルに「不要な知識」を忘れさせる新技術。より効率的なAIが作れるかも
    rodori
    rodori 2024/12/11
  • “3万円のChatGPT”に課金して、「技術が格差を広げる」と戦慄した

    使ってみたくてたまらなかったが、「3万あればAirPods買えるぞ」「家族キャンプでいいコテージに泊まれる」などとためらう。3日間迷い抜いた末に「使ってみない限り、憧れが止められない」と、課金することにした。 200ドルの課金は「あっさり」 3万円、3万円……と思いながら課金画面にアクセスしたが、実際の費用は「200ドル」。200という数字が軽すぎて、3万円のモノをAmazonで買うときより、あっさり課金ボタンをポチってしまった。ただ、1カ月で課金が切れるようにキャンセルしておくことは忘れなかった。 「o1 pro mode」の使い勝手は、ITmedia AI+の吉川記者の記事に詳しい。(月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた、OpenAIのフルパワー「o1 pro mode」に、書き仕事はどこまで任せられるか 若手記者の所感)。 筆者も、記事タ

    “3万円のChatGPT”に課金して、「技術が格差を広げる」と戦慄した
    rodori
    rodori 2024/12/11
  • 日本語LLMまとめ

    語LLMまとめ ​[ English | Français | 日語 ] 日語LLM・海外LLMのパラメータ数の推移。日語モデルの情報は記事、海外モデルの情報は LifeArchitect.ai の Models table を参照しています(ただし、図のスペース上一部のモデルは省略。また、海外モデルのパラメータ数は推測値を含む)。修正・追加等ありましたらお知らせ下さい。この記事は、一般公開されている日語LLM(日語を中心に学習されたLLM)および日語LLM評価ベンチマークに関する情報をまとめたものです。情報は、有志により収集されており、その一部は論文や公開されているリソースなどから引用しています。 以下の点について、あらかじめご理解とご了承をお願いいたします 記事の内容は、完全性や正確性を保証するものではありません。これらの情報は予告なく変更されることがあり、また最新

    日本語LLMまとめ
    rodori
    rodori 2024/12/03
  • 学校内で大流行しすぎて公開が停止になった、無料のAI英語学習アプリ「マグナとふしぎの少女」が楽しすぎる | 40代からのオンライン英会話

    無料のAI英語学習アプリ「マグナとふしぎの少女」 『マグナとふしぎの少女』というAIを活用した英語学習アプリが、学校で『公開停止』されるほど話題になっています。単なる英語教材とは一線を画すこのアプリ。ゲームの楽しさと実用的な学習内容が絶妙に組み合わさっており、気がつけば夢中になって英語力が上がっていると評判です。 素晴らしいクオリティなのが、一目でわかりますね。 なぜ『公開停止』になったの? それは単純に楽しすぎるからです。GIGAスクール端末向けに無料で公開されて『友達と一緒に遊べて勉強できる英語学習アプリ』として数多くの方に認知され、英語の発音や単語練習をしながら友達とバトルゲームをしたり、オリジナルアニメを見たり、AI英会話キャラ『レイちゃん』とお喋りしたり等々、飽きさせないコンテンツとなってます。 AIレイちゃんとのチャットシーン しかし、上記の面白いコンテンツにハマりすぎて授業時

  • 「エージェント世界」とはなにか マイクロソフトが狙うCopilotの変革【西田宗千佳のイマトミライ】

    「エージェント世界」とはなにか マイクロソフトが狙うCopilotの変革【西田宗千佳のイマトミライ】
    rodori
    rodori 2024/11/25
  • 3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 (1/4)

    動画生成AIの発展により、非常に面白い方向性が生まれてきています。最新の動画生成技術と3D技術を組み合わせることで、たった1枚の絵から、3Dデータを作れるようになる可能性が出てきているんですね。これは将来のゲーム開発や映像制作のあり方を激変させる可能性があります。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 動画生成AI「Runway」新機能がきっかけ まず、この動画を見てください。Stable Diffusionを使って作成した1枚の画像を、いくつかの手順を実施することで、3Dモデルとして扱えることに成功している様子です。 こうしたことが実現できるようになったのは、動画生成AIサービス「Runway」に11月2日に追加された新機能「カメラコントロール機能(Advanced Camera Control)」のためです

    3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 (1/4)
    rodori
    rodori 2024/11/25
  • 誰でもVTuber時代へ フェイシャルAI技術、続々登場 (1/3)

    フェイシャルを変換して動かしている表情の例。左がRunway Act-Oneで、右がLivePortrait(筆者作成) 画像や動画の顔の表情の動き(フェイシャル)をコントロールしようという、非常に品質の高いAI技術が、この夏以降、次々にリリースされてきています。10月27日にリリースされた動画AI「Runway」の新機能「Act-One」を使うと、画像に対し、動画を使ってフェイシャルを付けられます。また、ローカルPCの環境で動かせるポートレート動画生成AI「LivePortrait」もその品質の高さから評価を集めています。実際、どの程度の描写が実現できるのかを試してみました。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 一人二役で演技ができる「Act-One」 Act-Oneの発表で特にインパクトがあったのは、1分

    誰でもVTuber時代へ フェイシャルAI技術、続々登場 (1/3)
    rodori
    rodori 2024/11/19
  • 生成AIにアプリを作らせるコツ|erukiti

    Claudeの3.5-sonnet最新版(20241022)は間違いなく現時点では最高性能のLLMの一つである。Claude Professional PlanならそれをウェブUI・アプリ上から無制限と言ってもいいほど使える。 もともと、ある要件を実現するためにどうするのがいいか?選択肢を知りたくて、Claude sonnetChatGPT Plus(gpt-4o, o1-preview)などに聞いてみたら、Claude sonnetが一番好みのアイデアを返してくれたので、さらに深掘りしてアプリを作らせたみた。 OpenAI o1-previewは思いもよらないスマートな解決方法を提示してくれることがある。アイデアを知りたいときに一考の余地はある OpenAI gpt-4oは割とベタというか、微妙? SearchGPTは現時点ではコンテキストを無視しがち(単体の検索はいいけど、それ以上を

    生成AIにアプリを作らせるコツ|erukiti
    rodori
    rodori 2024/11/14
  • 結局最後、全部、落合陽一が持っていった|shi3z

    前回までのあらすじ 佐渡市長たっての願いで、来はカルテット構成くらいで行う予定だったサテライト公演が25人のオーケストラ編成に。東京から楽器と奏者を25人連れてくるというキチ○イ沙汰に。さらにクラウドファンディングに参加した我々取材班(違う)はコンサートのプログラムを見た時、驚愕した。 「東京公演と全然違う」 だが実際にコンサートが始まると、取材班に衝撃が走った。 「新作、全部新作カットじゃん!!どうなってんの?いつ作ったの?っつーか一番奥に座ってるの落合陽一じゃん」 これまで東京公演ではあくまでもプロデューサー、映像演出という名目で裏方に徹していた落合陽一先生が、ステージの一番奥でVJブースみたいなのを拵えてVJプレイをしているのである。 しかも画面はこれまでで一番でかい超ウルトラ大画面。 オーケストラに負けないド迫力の大画面である。 超巨大スクリーン ゲネプロ時の写真(写真提供:日

    結局最後、全部、落合陽一が持っていった|shi3z
  • AIシティポップが現代社会に問う〈創作とは何か?〉 著作権問題など生成AI音楽の議論が抱える3つのポイント | Mikiki by TOWER RECORDS

    生成AIによる画像や音楽の〈創造〉。2024年現在、社会は生成AIが孕む様々な問題と向き合わざるを得ない状況だが、それらは徐々に受け入れられ、当然の光景になりつつもある。そんな今、SNSを中心に話題になっているのが〈AIシティポップ〉だ。AIが生み出すシティポップの楽曲が何故これほど議論になるのか? 著書「シティポップとは何か」「ポップミュージックはリバイバルをくりかえす」で知られる評論家の柴崎祐二が迫る。 *Mikiki編集部 生成AIが浸透した今、なぜAIシティポップが議論に? 事の発端は、先日、DJのデラさんが投稿した次のようなポストでした。 ちょっと、怖いの見つけてしまった。ユーチューブにて、AIで生成された80年代シティポップばかりアップしているアカウント。このクオリティが、どの曲も高すぎる。トラックのみならず歌詞もボーカルも素晴らしく、昨日まで存在しなかったはずなのに、どの音源

    AIシティポップが現代社会に問う〈創作とは何か?〉 著作権問題など生成AI音楽の議論が抱える3つのポイント | Mikiki by TOWER RECORDS
  • ノーベル賞が見逃したAI研究者、甘利俊一氏「ヒントンはよく粘った」

    2024年のノーベル物理学賞は人工知能AI)研究者であるカナダ・トロント大学のジェフリー・ヒントン氏と米プリンストン大学のジョン・ホップフィールド氏に与えられた。しかしその陰で、「この人が受賞しないのはおかしい」と騒がれている人物がいる。東京大学名誉教授の甘利俊一氏だ。 甘利氏はヒントン氏やホップフィールド氏より10年以上早い1960~70年代からほぼ同内容の論文を書いていたが、当時はAIの「冬の時代」。注目されぬまま時がたち、後にヒントン氏らが甘利氏の研究をいわば「再発見」する形でAIを盛り上げ、現在の隆盛につなげた。ノーベル賞の授賞理由でも甘利氏は部分的に言及されているものの、来取り上げるべき重要な業績は見過ごされている。甘利氏に、ノーベル賞についての受け止めやAIの未来について聞いた。

    ノーベル賞が見逃したAI研究者、甘利俊一氏「ヒントンはよく粘った」
    rodori
    rodori 2024/10/23
  • グラビアカメラマンがAI生成したグラビア写真をAIで動画化してみた。架空ゲームショウの謎コスプレもあるよ(西川和久&松尾公也) | テクノエッジ TechnoEdge

    今回は、過去作った記事などのヘッダー画像+αから松尾氏に動画を作っていただくという、コラボ企画。元画像はSD 1.5、SDXL、SD3 Medium、そしてFLUX.1 [dev] が入り乱れての動画となる。

    グラビアカメラマンがAI生成したグラビア写真をAIで動画化してみた。架空ゲームショウの謎コスプレもあるよ(西川和久&松尾公也) | テクノエッジ TechnoEdge
    rodori
    rodori 2024/09/29
  • OpenAIのサム・アルトマンCEO、「人類はAIがけん引する新時代に入りつつある」

    OpenAIのサム・アルトマンCEOは9月23日(現地時間)、「The Intelligence Age」と題するブログを公開した。ブログには署名がないが、アルトマン氏がXでこのブログについて投稿した。 アルトマン氏は人間の知能を超える「スーパーインテリジェンス」(超知能)は数千日以内に誕生する可能性があり、「われわれはそこに到達できると確信している」と語った。 OpenAIは以前から超知能が10年以内に実現すると信じているとしている。今回の個人ブログの目的は、“超知能の時代”のビジョンを披露することのようだ。 同氏はこの長いブログで、人類はAIがけん引する新時代に入りつつあると主張している。ディープラーニングがこの進歩の鍵になるが、AIの能力を最大限に引き出すにはコンピューティング能力の大幅な拡大が必要と語る。 AIは雇用市場などに影響を与える欠点があることは認めつつ、「その害を最小限

    OpenAIのサム・アルトマンCEO、「人類はAIがけん引する新時代に入りつつある」
    rodori
    rodori 2024/09/24
  • 生成AIがもたらすクリエイターとの確執 #専門家のまとめ(栗原潔) - エキスパート - Yahoo!ニュース

    生成AI技術進化は目覚ましく、人間が創造した作品とほぼ見分けが付かないコンテンツがほぼ自動的に作成可能になりつつあります。生成AIは大量の既存著作物から学習することで新たな作品を生み出していることから、他者の著作権を侵害している可能性があり、規制派による訴訟や意見表明の事例が見られます。 ココがポイント▼Midjourneyなどの画像生成AIが著作権を侵害しているとして米イラストレーターが訴訟提起しています ・画像生成AI企業を訴えたアーティスト集団の主張、米連邦地裁で一部認められる (アスキー) ▼検索に連動してAIによるサマリーを提供するタイプのサービスが著作権侵害にあたると主張しています ・新聞協会、AIは「著作権侵害」 検索連動型、記事の利用承諾要請 (共同通信) ▼有名楽曲と類似する楽曲が生成されたことを証拠の一つにSunoなどの音楽生成AIサービスを著作権侵害で提訴しています

    生成AIがもたらすクリエイターとの確執 #専門家のまとめ(栗原潔) - エキスパート - Yahoo!ニュース
  • AIと著作権について | 文化庁

    AIと著作権の関係については、令和6年3月に文化審議会 著作権分科会 法制度小委員会において、「AIと著作権に関する考え方について」を取りまとめました。 ページでは、AIと著作権について、上記の考え方と、その関連文書を紹介します。 著作権法第30条の4等の基的な考え方について IoT・ビッグデータ・人工知能AI)等の技術を活用したイノベーションに関わる著作物の利用に係るニーズのうち、著作物の市場に大きな影響を与えないものについては、平成30年の著作権法改正により、相当程度柔軟性を確保する形で、著作物の利用の円滑化を図るべく、「柔軟な権利制限規定」が整備されました。 以下の資料では、この柔軟な権利制限規定の趣旨・内容・解釈やサービス・行為の取扱い等について、文化庁としての基的な考え方をお示ししています。 ・デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基的な考