概要 2024/09/12(現地時間)にOpenAIが新たなモデルo1とo1-miniを発表しました。いろいろ気になって調べたので個人的にまとめておきます。ちなみにStrawberryとかQ*とか言われてたモデルらしいですね モデルの特徴 o1 新たなモデルo1は回答により時間をかけて答えるモデルになっており、複雑なタスクの推論して科学、コーディング、数学の分野において従来のモデルより優れた性能を発揮する。 それぞれの分野でのテスト結果 科学分野 物理学、生物学、化学の問題のベンチマーク(GPQA)において博士より良い成績 コーティング プログラミング問題(Codeforces)では89th percentile 数学 米国数学オリンピック(AIME)の予選では上位500人入り テスト性能 モデルは大規模な強化学習アルゴリズムを使用してChain of Thoughtによりどのように推論す