Gemini が「Gems」を発表: あらゆる分野のAI専門家を作成

Googleは最近 「Gems」を発表した。これはGeminiチャットボットを強化するために設計された革新的な機能で、ユーザーはGeminiチャットボットを自分の好きなトピックに関するAIの専門家にカスタマイズすることができる。2024年8月28日のブログ投稿で発表されたこの機能は、数日以内にGemini Advancedの契約者に提供される予定だ。Gemini Experiencesの製品管理担当シニアディレクターであるDave Citron氏は、Gemsによってユーザーは、プロジェクトの管理、イベントのアイデアのブレーンストーミング、あるいはジムの仲間としての役割など、特定のニーズに合わせてチャットボットの能力を調整することができると説明した。ユーザーは、最初の指示と名前を提供することで、これらのジェムを設定することができ、システムは今後の対話のためにこれらの詳細を記憶し、時間が経つにつれてチャットボットをより直感的でユーザーフレンドリーにする。Google はまた、学習コーチ、ブレーンストーマー、キャリアガイド、ライティングエディター、コーディングパートナーのような専門的な役割を含む、一連の事前作成されたジェムの展開も準備しており、このAIツールの実用性をさらに広げている。

ジェム」の導入と並行して、Google は最新の画像生成モデル「Imagen 3」をGemini の全ユーザーにリリースする予定だ。この新しいモデルは、フォトリアリスティックな画像生成の強化を約束し、太陽光の効果や動物のひげのような詳細なビジュアルを生成することができる。Imagen 3はまた、野の花や鳥のような特定の長いプロンプトを処理するように設計されており、写実的な風景、質感のある油絵、気まぐれなクレイメーションのシーンなど、さまざまなスタイルの画像を作成することができます。Imagen 3の主な特徴は、倫理的なフレームワークで、個人を特定できる写実的な画像や不適切なコンテンツを生成しないことを保証します。さらに、AIが生成した画像に透かしを入れ、その出所を認証するSynthIDツールも組み込まれている。

GemsとImagen 3の導入は、前年11月にカスタマイズ可能なチャットボットGPTsを発表したOpenAIに直接対抗し、AI分野でより積極的に競争しようというグーグルの野心を示している。OpenAIのGPTsは、ボードゲームのルール学習やデジタルステッカーのデザインなど、さまざまな目的でチャットボットを作成できるもので、パーソナライズされたAIアプリケーションのトレンドの高まりを強調している。しかし、このような進歩にもかかわらず、グーグルが提供する製品の性能については批判もある。CNETのImad Khan氏は、OpenAIのChatGPT Plusと同様に月額20ドルのGemini Advancedはエラーに悩まされており、競合他社にはまだ及ばないとコメントしている。

Googleは技術革新を続けており、システムのメモリと処理能力の強化にも力を入れている。Gemini Advancedの契約者は現在、100万トークンのウィンドウを持ち、これによりシステムは約1,500ページのテキストを処理できる。GoogleのCEOであるSundar Pichai氏は、年内にこの容量を200万トークンに拡大する計画を発表し、機能性の向上とユーザー体験の向上を約束した。Googleのこれらの開発は、急速に進化する人工知能の分野で競合他社に追いつくだけでなく、追い越す可能性を秘めたGoogleの広範な戦略の一環である。