OpenAI社のChatGPTやAnthropic社のClaudeなど、生成AIの発展がめざましい現代で、Google社も2023年に「Gemini(ジェミニ)」という生成AIを発表しています。

もともとは「Bard」という名称でリリースされていましたが、2024年2月中旬から「Gemini」と名称が変更となり、2024年5月には最新モデルの「Gemini 1.5 Pro/Flash」が発表されて話題になりました。

Geminiには何ができるのか、ChatGPTやClaudeと何が違うのかなど気になっている方も多いのではないでしょうか。

本記事では、以下をわかりやすく解説します。

  • Geminiの基本情報
  • Geminiの具体的な活用方法
  • Geminiの料金プラン

※2024年7月2日編集時点の情報です。アップデートが早い分野のため、サービス内容が変更されている可能性があります。

Geminiとは

Gemini(ジェミニ)は、Googleが開発・提供する高機能なAIチャットサービスです。「ジェミニ」と読むことが一般的ですが、「ジェミナイ」と発音されることもあります。

以下のYouTube動画(Google公式)をみると、Google社内のメンバーでも「ジェミナイ」と発音している人が少なくないことがわかります。

Googleminiの名前の由来

Googleが、「双子」を意味する「Gemini」というラテン語を選んだのは、2つのAIプロジェクトが同時に社内で開発されていたことに由来します。

また、宇宙につながる意味があることも、選ばれた理由の1つ。Geminiは、空にある星座(そして占星術で使われる12星座の1つである)の「ふたご座」を指す言葉です。

さらに、アメリカ航空宇宙局(NASA)が1960年代に進めていたプロジェクトの名前でもあります。

つまり、GoogleはGeminiという名前に宇宙開発への大志を込め、テキスト/画像/動画というさまざまなメディアを扱える、このAIのマルチモーダルな側面を反映させたわけです。

Geminiは、自然言語処理や画像認識などの人工知能技術を駆使し、ユーザーとの対話を通じてさまざまなタスクをサポートします。たとえば、質問への回答や文章の要約・翻訳、コーディングなどが可能です。

GoogleのAI「Gemini」って、何ができるの?知っておきたい基礎知識まとめました | ライフハッカー・ジャパン

GoogleのAI「Gemini」って、何ができるの?知っておきたい基礎知識まとめました | ライフハッカー・ジャパン

特徴

Geminiの大きな特徴は、高度な自然言語処理能力をもつマルチモーダルAIモデルという点です。マルチモーダルAIとは、画像や動画、音声といったさまざまなデータを組み合わせて理解・生成できるAIを指します。

さらに、YouTubeやGmailなどGoogleサービスとの連携も特徴の1つです。

加えて、Geminiはプロンプト(ユーザーからの入力)に対する高い理解力を持ち、ユーザーの意図を的確に捉えたうえで詳細な回答が可能です。複雑なタスクにも対応できる、高機能なチャット型アシスタントAIといえます。

なお、Geminiの最新モデル「Gemini 1.5 Pro」では、100万トークンの入力が可能となりました。1トークンは英単語1つあたりを指す単位で、日本語にすると約1〜4文字ほどに相当します。

これにより、11時間程度の音声データや数万字の日本語テキストという膨大なデータを処理できるようになりました。

ほかAIとの違い

Geminiは、ChatGPTやClaudeといったほかのAIと比較して、いくつかの違いがあります。

特徴

Gemini

ChatGPT

Claude

モデルの規模

超大規模言語モデル

大規模言語モデル

大規模言語モデル

有料プランの月額料金

2,900円

約3,200円(20ドル)

約3,200円(20ドル)

動画認識

×

画像認識

GeminiはChatGPTやClaudeと同様に大規模な言語モデルを採用していますが、その規模はさらに大きく、より高度な文脈理解と推論が可能です。

また、テキストだけでなく、画像や動画などのマルチモーダルデータにも対応しているのがGeminiの特長です。特に、動画の要約においてGeminiは優れており、数十分の動画でも数十秒で的確な要約を作成します。

一方、ChatGPTは動画認識に対応しておらず、動画要約などを行ないたい場合は、別途ブラウザの拡張機能やプラグイン(有料版のみ)を使用する必要があります。

このように、Geminiは超大規模モデル、マルチモーダル対応などの点で、ChatGPTやClaudeと異なる特長を持ちます。

Geminiのモデル

Geminiは、Googleが開発した高機能な生成AI言語モデルです。このモデルは、膨大な量のテキストデータを学習することで、人間のような自然な会話や文章の生成ができます。

Geminiの各モデルの特徴を表形式でまとめました。

モデル名

特長

Gemini Nano

スマートフォンでの動作を想定して設計された軽量なモデル。

Gemini Pro

幅広いタスクに対応する基本モデル。ウェブブラウザから無料で利用できるのは「Gemini 1.0 Pro」で、有料プランで最新の「Gemini 1.5 Pro」を利用できる。

Gemini Ultra

Geminiの最上位モデル。Proよりさらに複雑なタスクを処理できる。

Gemini Flash

Geminiの最軽量モデル。

ビジネスやプライベートなどの活用シーン、目的に応じて適切なモデルを選ぶことが重要です。

Geminiでできること

Geminiは、対話形式で質問や依頼が可能です。代表的なものを見てみましょう。

  • 文章の作成・要約・翻訳・校正・編集
  • 質問に対する回答
  • コーディング
  • 画像認識
  • 動画認識
  • 音声入力
  • Googleサービスとの連携

ChatGPTやClaudeのように、文章作成や質問回答のようなテキスト生成が得意です。

また、Geminiはマルチモーダルに対応しているため、テキストだけでなく画像や動画なども理解できます。たとえば、YouTubeの動画を解析して、その内容の要約も可能です。

さらに、GmailやGoogle MapなどほかのGoogleサービスとの連携も強みの1つ。具体的な活用方法は次の章で紹介します。

Geminiの活用方法3選

Geminiの具体的な活用方法は下記のとおりです。

  • YouTube
  • Gmail
  • Google Map

GeminiはGoogleサービスと連携するのが特長的な使い方です。順番に紹介します。

YouTube

Geminiを活用することで、YouTubeの動画を効率的に理解できます。たとえば、下記のようなことが可能です。

  • 動画の要約
  • 関連動画の提案

Geminiに動画のURLを入力すると、動画の内容を要約してくれます。長い動画の要点を短時間で把握できるため、時間を有効活用できます。

また、指定した動画に関連する動画の提案も可能です。興味のある分野の理解を深めたり、新たな発見につなげたりできます。

GeminiをYouTubeに使うことで、より便利、かつ効果的に動画の視聴に役立てられます。

GeminiがYouTube動画を一瞬で要約してくれるようになった(しかも無料) | ライフハッカー・ジャパン

GeminiがYouTube動画を一瞬で要約してくれるようになった(しかも無料) | ライフハッカー・ジャパン

Gmail

Geminiは、Googleのメールサービス「Gmail」と連携し、メールの検索や要約が可能です。特定のキーワードや差出人でメールを検索し、そのまま内容を要約します。もとのメールへのリンクも表示されるため、直接確認したい場合でも問題ありません。

また、2024年6月現在では日本語に対応していませんが、メールの返信文を提案する機能も試験運用中です。日本語での正式運用が始まれば、メール業務の効率化が期待できます。

Google Map

Geminiは、Google Mapとも連携しており、ユーザーにとって大きなメリットがあります。たとえば、下記のようなシーンでGeminiを活用できます。

  • 現在地の確認
  • ルート検索
  • 場所の検索

「近くのおすすめイタリアンレストランを教えて」とGeminiに聞くと、Google Map上の情報から評価の高い店舗を検索し、口コミや営業時間などの詳細情報も合わせて提示してくれます。新しいお店を見つけたいときや、行きたい場所の情報を調べたいときに役立ちます。

このように、GeminiとGoogle Mapが連携することで、ユーザーは自然な会話を通じてGoogle Mapの機能を最大限に活用可能です。場所に関するさまざまな疑問や要望に対して的確で詳細な回答が得られるため、ユーザーの利便性が向上します。

Geminiの使い方

Geminiを利用するには、Googleアカウントでログインする必要があります。下記の手順にしたがって、Geminiを使用しましょう。

  1. Geminiにアクセスします。
  2. 初めての場合は利用規約に同意します。
  3. Geminiのダッシュボードが表示されたら、画面下部の入力欄にプロンプトを入力します。

Geminiの利用開始はシンプルです。Googleアカウントさえあれば、数クリックでGeminiを使いはじめられます。初めてGeminiにアクセスした際は、利用規約をよく読み、同意しましょう。

Geminiのチャット画面では、プロンプトを工夫して入力することが重要です。適切なプロンプトを与えることで、Geminiはより的確で有益な情報を生成してくれます。

たとえば「東京都港区にあるおすすめの和食料理屋を教えて。Google評価が4以上の店に絞ってください。」と入力したところ、下記の結果が返ってきました。

東京都港区にあるおすすめの和食料理屋
Screenshot: ライフハッカー編集部

慣れないうちは、Geminiが提案する情報をもとに、プロンプトを修正・改善していくのがコツです。徐々にGeminiとの対話に慣れていきましょう。

Geminiの料金・無料プランと有料プランの違い

Geminiには無料プランと有料プラン「Gemini Advanced」の2種類のプランがあります。無料プランでは基本的な機能を使用できますが、Gemini Advancedではより高度な機能を利用できます。

無料プラン:Gemini

有料プラン:Gemini Advanced

0円/月

2,900円/月(初回2カ月無料

  • Gemini 1.5 Flash
  • 幅広いタスクに対応
  • 文章やリストの作成、計画の立案、新しい知識の習得などをサポート
  • Googleサービスとの連携

など

  • Gemini 1.5 Pro
  • GoogleドキュメントやPDFをアップロードして、データの整理や分析が可能
  • スプレッドシートをアップロードして、データクリーニングやグラフ作成が可能

など


Gemini Advancedでは、無料プランでは使用できない高度な機能を利用できます。たとえば、最新モデルのGemini 1.5 Proを活用できるため、より正確で効率的なタスク処理の依頼が可能です。

無料プランでも活用できるシーンは多いため、実際に試してみてプランを判断するのがおすすめです。

まとめ

Geminiは、Googleが提供する高機能生成AIモデルで、多様なタスクに活用できるチャット型アシスタントです。GeminiはGoogleのサービスと連携しており、YouTube動画の要約やGmailの検索・要約、Google Mapで場所の検索などに役立ちます。

ビジネスシーンでは、業務の効率化やコミュニケーションの改善が期待でき、プライベートでは時間短縮が図れます。

まずは無料プランで使い方を体験し、必要に応じて有料プランへの移行を検討するのがおすすめです。Geminiを上手に活用し、生産性向上につなげましょう。

ビジネスに生きるAI記事をもっと読む

Source: Gemini(1, 2, 3, 4, 5), YouTube, ChatGPT, Claude