Google、Geminiアップデートの中心にAIエージェントを据える
Alphabet の GOOGL-Q Google は水曜日、人工知能モデル Gemini の第 2 世代をリリースし、眼鏡を使用するなど、チャットボットを超えた AI の新しい使用方法を予告しました。
CEOのサンダー・ピチャイ氏はブログ投稿の中で、この瞬間を「新しいエージェント時代」の始まりと呼び、より高い自律性でタスクを実行できる仮想アシスタントについて言及した。
「彼らは、あなたの監督の下で、あなたの周りの世界についてより深く理解し、何段階も先を考えて、あなたに代わって行動を起こすことができます。」
これらのリリースは、Googleが新興テクノロジーを支配する競争で主導権を取り戻すことを目指している手法を浮き彫りにしている。 Microsoft が支援する OpenAI は、2022 年 11 月にチャットボット ChatGPT をリリースし、世界的な注目を集めました。
Googleは2023年12月にGeminiを発表し、現在は4つのバージョンを提供している。
同社は水曜日に、パフォーマンスが向上し、画像と音声を処理する機能が追加された、2番目に安いモデルであるFlashのアップデートをリリースした。他のモデルも来年登場する予定だ。
OpenAIはここ数日、高度な研究用途向けの月額200ドルのChatGPTサブスクリプションや、テキストからビデオへのモデルSoraの利用可能性など、将来性を多様化するための新しいサービスを次々と発表した。
Google の取り組みには、すでに広く普及しているアプリケーションに AI の進歩を注入することが含まれます。検索、Android、YouTube は、月間 20 億人以上が使用している 7 つの製品のうちの 1 つであると同社は述べています。
このユーザーベースは、90億ドルの評価額を求めている検索スタートアップのPerplexityや、OpenAI、Anthropic、イーロン・マスク氏のxAIなどの新興研究機関のような挑戦的なスタートアップと比較して、大きな利点となる。
Gemini 2.0 Flash モデルは、検索エンジンの AI 概要を含むアプリケーションを強化します。
アルファベットの最大の賭けは検索用AIだ、と社長兼最高投資責任者のルース・ポラット氏は火曜日にニューヨークで開催されたロイターNEXTカンファレンスで述べた。
Googleは記者に対し、スマートフォンのカメラで捉えたあらゆるものについてリアルタイムでユーザーと会話できるプロトタイプのユニバーサルエージェントであるProject Astraの新機能も披露した。
DeepMind グループの製品マネージャー Bibo Xu 氏が記者団に語ったところによると、このツールはさまざまな言語で会話できるほか、マップや画像認識ツールの Lens からの情報を処理できるようになったという。
また、Astra は、Google Glasses の失敗以来、同社が製品分野に初めて戻ってきたプロトタイプの眼鏡でもテストされる予定です。その後、9月にARグラスのプロトタイプを発表したMetaなど、他の企業も市場に参入した。
Googleは記者らに、ライバル研究所Anthropicの「コンピュータ使用」機能を真似てキーストロークとマウスクリックを自動化できるChrome Webブラウザ拡張機能Project Mariner、Julesと呼ばれるソフトウェアコーディングを改善する機能、消費者の意思決定を支援するツールも披露した。何をするか、ビデオゲームでどのアイテムを買うかなど。
(これはシンジケート ニュース フィードから自動生成された未編集の記事です。TechWire24 スタッフがコンテンツ本文を変更または編集していない可能性があります)