アップルの研究者が、音声コマンドを理解して応答する人工知能システム「ReALM(Reference Resolution as Language Modeling)」を開発したと学術誌に報告しています。 ↑ChatGPTを超える? アップルといえば次期OS「iOS 18」において、生成AIにより音声アシスタント「Siri」などを強化すると噂されていますが、その生成AIはアップルが独自で開発するものではなく、グーグルの「Gemini」やOpenAIの「ChatGPT」、百度(バイドゥ)の「Ernie」が採用されるという見方もあります。 今回のReALMは、画面上の視覚的な要素への曖昧な参照や、会話や背景のコンテキストを理解できる模様。これにより、ユーザーとデバイスの間でより直接的で自然な対話が可能になるとしています。また、画面上の要素とその位置を解析することで、テキストを生成することも可能。