タグ

2024年12月30日のブックマーク (7件)

  • Devin観察日記 0日目|Daiki Teramoto

    買うことにしました、Devin。月額500ドル。 https://devin.ai/ 今まで気になってはいたものの、高いし、買うつもりはありませんでした。 しかし今日、@nishioさんのご好意で試してみる機会を頂き、十分感動したので、やっぱり買ってみることにしました。 というわけで、今日からブログを始めます。名付けて「Devin観察日記」。 アフィリエイトも無いので、ゆるくやっていきます。 「このリポジトリを開発対象に加えたい」最初に驚いたのは、Devinへの仕事の頼み方です。GUIでポチポチするのかと思いきや、「このリポジトリを開発対象に加えたい」とメンションするだけ。 「このリポジトリを開発対象に加えたい」とDevinに指示する西尾さんたったこれだけの指示で、git cloneしてREADMEを読んで、npm installなんかまでやってくれます。リモートで向こうに人がいるような感

    Devin観察日記 0日目|Daiki Teramoto
  • 震えた。ChatGPT o1で「英霊召喚」してみた話

    震えた。ChatGPT o1で「英霊召喚」してみた話2024.12.30 21:2653,750 かみやまたくみ ChatGPT、やっぱとんでもないですよ…。 2024年に生成AIChatGPT」にきた大きなアップデートとして新モデル「o1」の実装があります。OpenAIによると、さまざまな知的能力が人間の専門家と同等か超えるレベルにまで到達したらしい。 要は、また賢くなった、と。 いろいろ試していたのですが…これがなかなか困ったものでした。知識も論理的な能力も明らかに自分より上なので「すごそう」以上のことがわからない。 どうすんの、これ…。 途方に暮れた末に、高度なロールプレイをさせてみることにしました。思えば今までのモデルだとロールプレイはほぼほぼ破綻していました。できないことができるようになっていれば、すごいと思えるかもしれない。 結果は…すごいってもんじゃなかった。演じる人物(キ

    震えた。ChatGPT o1で「英霊召喚」してみた話
    flatbird
    flatbird 2024/12/30
  • LLMガードレールソリューションの比較

    こんにちは、株式会社松尾研究所の岡田です。 記事は、松尾研究所 Advent Calendar 2024 の記事です。 🚀 LLMアプリケーションとリスク管理 近年、LLM(大規模言語モデル)を活用したアプリケーション開発が盛んです。しかし、LLMの利用には以下のような様々なリスクが伴います: 不正確な情報の生成(ハルシネーション) 有害な発言や偏りのある出力 機密情報の漏洩 悪意のある利用 そのリスクを軽減する方法の一つが「ガードレール」です。ガードレールとは、LLMの出力や動作を制御し、安全で信頼性の高い形で利用できるようにする仕組みを指します。 ガードレールには多くのソリューションが存在しますが、それぞれ仕組みや使用方法が異なるため、適切に活用するにはその特徴を理解することが重要です。 記事では、以下の3つのガードレールソリューションを比較します。 Llama Guard(Me

    LLMガードレールソリューションの比較
  • RAGシステムコンポーネントの評価の究極ガイド:知っておくべきこと: What You Need to Know

  • Llama Guard 2をDatabricks上であれこれ試す - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 導入 Llama3が公開されましたが、同時にLlama Guard 2も公開されました。 Moderationにおいて非常に役立つんじゃないかと気になっていたので、試してみます。 Llama Guard 2とは 前段邦訳。 Meta Llama Guard 2 は、8B パラメーターの Llama 3 ベースのLLM セーフガード モデルです。Llama Guard と同様に、LLM 入力 (プロンプト分類) と LLM 応答 (応答分類) の両方でコンテンツを分類するために使用できます。これはLLMとして機能し、特定のプロンプトまたは

    Llama Guard 2をDatabricks上であれこれ試す - Qiita
  • 超知能がぬるっと誕生する可能性に実感が湧かない|bioshok

    正直なところo1までは超知能の実現をまだあまり実感していなかった。しかし、oシリーズの進歩の速さとその性能飛躍の大きさに現実感が逆に今なくなっている。これは現実に起こっていることなのだろうか、と。 下手をしたら来年か再来年には人間のトップAI研究者に比肩するAIシステムが開発される可能性もあるのではないか・・・?と。 もうすぐ人間のできる殆どの認知タスクを凌駕するAIシステムが誕生するというのは文化的には何十年も前から語られていたことだし、今年の2024年6月に公開されたLeopold Aschennbrener氏のエッセイを読めば2027年末までにはAGIが開発される可能性があることは理解できた。 しかし、2024年の12月半ばに入って、o3が発表された時、少し目を疑った。o3がo1と比較していっきにおよそ人口換算100倍の能力をcodeforcesで会得したのだ。 Codeforces

    超知能がぬるっと誕生する可能性に実感が湧かない|bioshok
  • コーディングAI課金するならCodyが断トツ良い話

    概要 開発者向けの AI ツールは数多くありますが、その中で「Cody」は 無名ながらも知る人ぞ知る優れたプロダクトです。私が普段いるAI技術者コミュニティでは密かに絶大な支持を集めていますが、SNSなどでの一般的な知名度はほとんどないため、ここで紹介します。 Cody は無料プランが圧倒的に強い他、課金プランも、GitHub Copilot、Cursor、ChatGPT と比較して機能性で大きく抜きん出ています。私はすでに半年課金愛用していて、おそらく来年も愛用するでしょう。 Cody とはなんぞや Cody くんは、VSCode や、JetBrains IDEs、Neovim、Eclipseなどのコードエディタの拡張機能として使えるコーディング補助 AI ツールです。 他の生成 AI コードツールと同様に、AI コード補完とAIチャットがあります。 なぜ Cody がおススメなのか C

    コーディングAI課金するならCodyが断トツ良い話