[B! openai] kitokitokiのブックマーク

OpenAI o1, o1-miniモデルの内容まとめ

概要 2024/09/12(現地時間)にOpenAIが新たなモデルo1とo1-miniを発表しました。いろいろ気になって調べたので個人的にまとめておきます。ちなみにStrawberryとかQ*とか言われてたモデルらしいですねモデルの特徴 o1 新たなモデルo1は回答により時間をかけて答えるモデルになっており、複雑なタスクの推論して科学、コーディング、数学の分野において従来のモデルより優れた性能を発揮する。それぞれの分野でのテスト結果科学分野物理学、生物学、化学の問題のベンチマーク（GPQA）において博士より良い成績コーティングプログラミング問題（Codeforces）では89th percentile 数学米国数学オリンピック（AIME）の予選では上位500人入りテスト性能モデルは大規模な強化学習アルゴリズムを使用してChain of Thoughtによりどのように推論す

kitokitoki 2024/11/20

リンク

日本語LLMの"1トークン"は何文字相当なのか?

TR:TL 最近、日本語のLLMが続々公開されているが、各LLMが何文字まで生成可能なのかを知りたい。 Rakudaのデータで各LLMのトークナイザーの「1トークンあたりの文字数」を調べた。標準的な日本語特化のLLMでは2.0~2.6文字/トークン程度、一方で、GPT-4/3.50.96文字/トークン程度。背景最近、日本語でも使えるLLMが続々と公開されています。特に、GPT-3.5-turboやGPT-4は、8192トークンという大きい最大トークン長を誇っています。一方で、LINEのjapanese-large-lmなどの2023年時点で公開されている公開されている日本語LLMの多くは、2048トークンが最大トークン数になっている場合が多いです。額面上、LINEのLLMは、OpenAI GPT-3.5の1/4の長さのテキスしか生成できないように見えますが、それぞれのトークナイザーは

kitokitoki 2024/11/20

“日本語LLMの"1トークン"は何文字相当なのか?”

リンク

【OpenAI API】Structured OutputsでLLMアプリ開発を高精度化&爆速化🚀【構造化出力】

はじめに：AIアプリケーション開発の新たなパラダイム🚀 もう、APIレスポンスのJSONパースに悩まされる時代は終わりです！ OpenAIが最新モデル「GPT-4o-2024-08-06」を発表し、AIの境界をさらに押し広げました。この革新的なモデルは、「Structured Outputs」という画期的な機能を導入し、AI生成コンテンツの信頼性と精度に大きな飛躍をもたらしています。 OpenAI APIに導入された Structured Outputs は、大規模言語モデル（LLM）を活用したアプリケーション開発に革命をもたらす新機能です。これにより、開発者はAIモデルとより効率的に対話し、構造化データを簡単に取得できるようになりました。従来のLLMアプリ開発では、APIからテキスト形式で返されたデータを、必要な情報だけ抽出するために、複雑なJSONパース処理を行う必要がありました。

kitokitoki 2024/08/16

Structured Output .　LangChain にもある。

openai

リンク

OpenAI の Structured Outputs に Pydantic モデルを入力する - Qiita

8月6日、OpenAI 社は新機能 Structured Outputs を公開しました。これにより Function calling 等でも確実に出力を構造化できるようになり、プログラムとの連携をより確実に行えます。今回、Pydantic モデルも直接入出力できるようになり可読性、型安全性の向上やバリデーションの自動化等のメリットが得られます。さらに生成テキストのフォーマットを指定するためのプロンプトを減らせるという効果もあります。 Azure OpenAI Service の gpt-4o(2024-08-06)/gpt-4o-mini(2024-07-18) も対応 11/21 Structured Outputs は GA しました。API サポートは、API バージョン 2024-08-01-preview で初めて追加されました。最新のプレビュー API と最新の GA API

kitokitoki 2024/08/16

openai

リンク

OpenAIのBatch APIを使ってお得にプロンプトを一括処理してみる - Taste of Tech Topics

はじめにこんにちは。データサイエンスチームYAMALEXのSsk1029Takashiです。最近はOpenAIに日本支社が出来て、日本語対応が加速するというニュースにわくわくしています。今回はそんなOpenAIから発表されたBatch APIという機能が便利、かつお得な機能だったのでどのように使えるのか試してみます。 Introducing the Batch API: save costs and get higher rate limits on async tasks (such as summarization, translation, and image classification). Just upload a file of bulk requests, receive results within 24 hours, and get 50% off API pri

kitokitoki 2024/06/10

openai
neta

リンク

OpenAI の Embeddings API はイケてるのか、定量的に調べてみる [AWS の Embeddings を追加] - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? TL;DR OpenAI の Embeddings を JSTS で評価したところ、 BERT を JSTS でファインチューニングした場合には劣るものの、分散表現を得る手法としては十分な性能を持っていることが分かった。 Amazon Titan Embeddings が 2023 年 9 月 29 日に GA (一般提供) になったので追加調査したが、 JSTS スコアは OpenAI がまさった。 Cohere Embed Multilingual が Amazon Bedrock にて 2023 年 11 月 13 日に利用可能に

kitokitoki 2024/04/22

“Embeddings API ”

リンク

OpenAIのChat APIの返答をストリーミングする（Node.js）

ChatGPTでは、全ての回答の生成を待たずに、回答が順次画面に表示されていきます。実は、OpenAIのChat APIを使う場合も、同じ挙動を実現できます。アプリの例方法1. ブラウザで直接OpenAI APIを叩く以下の記事で紹介されているように、ブラウザのFetch APIを使って直接OpenAIの APIを叩く方法が一番シンプルにできそうです。注意点として、APIキーがユーザーに知られるため、ユースケースが限られそうです。方法2. Node.jsのサーバーを介してOpenAI APIを叩く今回は、以下のように中間にNode.jsのサーバーを挟む例を示します。 Step1. Node.jsサーバーの実装 ※注意点として、サーバーは text/event-stream 形式のレスポンスを返す必要があり、 Next.js API Routes + VercelやAWS Am

kitokitoki 2024/03/14

ストリーミング

リンク

GitHub - tsmatsuz/llm-grounding: Azure OpenAI Service による RAG (Retrieval Augmented Generation) ハンズオン

kitokitoki 2024/02/09

リンク

OpenAI の利用規約改定！！2023年3月1日更新 / API 経由は学習・訓練には使用されない。｜けいすけ

OpenAI の利用規約改定！！2023年3月1日更新 / API 経由は学習・訓練には使用されない。 2023/5/28追記早速、利用規約が変更されてました！まとめを書いておくと。 - ChatGPT は学習に使ってる - API 経由は学習には使わない - 13歳以上18歳位未満は保護者の許可を得てねという感じですかね🤔 https://openai.com/policies/terms-of-use Terms of use前回は、最終更新日2022年12月13日だったのですが、更新日が2023年3月1日付になってますね！！前回の note から一週間も経たずに更新されるとは！笑変更された内容を確認していきます！ OpenAI についてOpenAI を利用するときの年齢制限1. Registration and Access You must be at least