タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

AWSとMLOpsに関するmichael-unltdのブックマーク (1)

  • ペアーズにおける評価ドリブンなリリースサイクル:Langfuseをフル活用したLLMOps基盤

    LLMOps基盤のシステムアーキテクチャ目次− 目次 − 対象読者 − TL;DR − 背景:LLMアプリケーション運用の課題 − LLMOps基盤のシステムアーキテクチャ −− 主なコンポーネントと役割 −− Langfuseを採用した理由 − 評価ドリブンなリリースライフサイクルの全体像 − オンライン評価プロセス −− 1. ログ・トレースデータの保存 −− 2. 評価とアノテーション − オフライン評価プロセス −− プロンプト実験 −− LLMアプリケーション統合実験 − 今後の展望 − 終わりに − 参考文献 こんにちは!Eureka AI Teamで、Pairs(ペアーズ)のMLOps Engineerをしているnariです。 こちらは、Eureka(Pairs) Advent Calendar 2024 の10日目の記事です。 日は、私たちが構築した「LLMOps基盤」と

    ペアーズにおける評価ドリブンなリリースサイクル:Langfuseをフル活用したLLMOps基盤
    michael-unltd
    michael-unltd 2024/12/11
    “LangfuseはSelf-hostするパターンでも、ログ・トレース管理、プロンプトマネジメント、評価データセット、実験管理、カスタムスコアによる評価など、LLMOpsに必要な機能を網羅的に提供しています。”
  • 1