Gemini (言語モデル)
開発元 | Google DeepMind |
---|---|
初版 | 2023年12月6日 |
対応言語 | 英語 |
種別 | 大規模言語モデル |
ライセンス | プロプライエタリ |
公式サイト |
deepmind |
Gemini(ジェミニ)は、Google DeepMindによって開発されたマルチモーダル大規模言語モデルのファミリーであり、LaMDAおよびPaLM2の後継として供する。(2023年12月6日に発表された)Gemini Ultra、Gemini Pro、Gemini Nanoからなり、OpenAIのGPT-4のライバルとして位置付けられた。
歴史
[編集]開発
[編集]Googleは、2023年5月10日のGoogle I/O基調講演の期間中(子会社のGoogle DeepMindによって開発された大規模言語モデル(LLM)である)Geminiを発表した。これは、GoogleのCEOサンダー・ピチャイによると「Geminiはまだ初期の開発段階にある」と述べるものの(同イベントでも、お披露目された)PaLM2のより強力な後継として位置付けられていた[1][2]。他のLLMとは異なり、Geminiはテキスト・コーパスのみでトレーニングされておらず、テキスト、画像、音声、映像、そしてコンピュータ・コードを含む、異なる種類のデータを同時に処理できることを意味するマルチモーダルになるように設計されている点でユニークであると言われている[3][4]。これはGoogle DeepMindとして先月統合されたGoogleの2部門であるDeepMindとGoogle Brainのコラボレーションとして開発された[5]。Wired誌とのインタビューで、DeepMindのCEOデミス・ハサビスは、その人気ぶりがGoogleにLaMDAとBardを使ってアグレッシブに挑戦させてきたOpenAIのGPT-4で動くChatGPTを自社のアルゴリズムで打ち負かすことが可能であると彼が信じたGeminiの高度な能力を押し売りした。ハザビスいわくGeminiはAlphaGoとその他のGoogle=DeepMind製LLMの力を組み合わせるだろうとし、(2016年に囲碁チャンピョンのイ・セドルを負かしたとき世界中の注目を得た)DeepMindのAlphaGoプログラムの強さを強調した[6]。
2023年8月、The InformationはGeminiについてGoogleのロードマップを要約したレポートを発表し、同社が2023年後半のローンチを目標にしていることを明らかにした。レポートによると、Googleは現在大抵のLLMに備わっている会話型テキスト能力を人工知能を駆使した画像生成と組み合わせて、コンテキストに応じた画像作成を可能にし、より広範囲のユースケースに適応されることで、OpenAIやその他競合他社を凌駕したいと望んでいた[7]。Bardと同様に[8]、Googleの共同創設者であるセルゲイ・ブリンも、Google BrainとDeepMindのその他何百人ものエンジニアとともに、Geminiの開発を支援するためにセミリタイア生活から召喚された[7][9]。GeminiはYouTubeの動画のトランスクリプト(文字起こし)でも訓練を受けていたため、如何なる潜在的に著作権保護されている素材を排除するために弁護士も連れてこられた[7]。
Geminiのローンチが差し迫っているというニュースを受けて、OpenAIはGPT4をGeminiと同様のマルチモーダル機能と統合する作業を急かした[10]。The Information が9月に報じたところによると、数社がGoogle CloudのVertex AIサービス経由でクライアントに利用可能にさせることをGoogleが企図していたLLMの「初期バージョン」への早期アクセスを承諾されていた。この報告は、GoogleがGPT4とマイクロソフトのGitHub Copilot両方諸共打ち負かすためにGeminiを武装させていることも同様に言及されていた[11][12]。12月2日、同誌はGoogleは英語以外のプロンプトに問題があるため、Geminiのローンチを翌週から2024年1月に延期し、付け加えて3つのローンチ・イベントがニューヨーク市、ワシントンD.C.、そしてカリフォルニアで計画されていたと報告した[13][14]。
ローンチ
[編集]2023年12月6日、ピチャイとハサビスはバーチャル記者会見で「Gemini 1.0」を発表した[15][16]。「非常に複雑なタスク」向けに設計されたGemini Ultraと「幅広いタスク」向けに設計されたGemini Pro、そして「オン=デバイス・タスク」用に設計された、Gemini Nanoの3つのモデルが発表された。ローンチ時に、Gemini Proと(Gemini )NanoはBardとPixel 8 Proスマートフォンにそれぞれ統合されたが、一方Gemini Ultraは「Bard Advanced」を強化し、2024年初めにソフトウェア開発者が利用可能になる。GoogleがGeminiを組み込むことを企図していたその他製品には、検索、広告、Chrome、Google Workspace上のDuet AI、そしてAlphaCode2が含まれていた[17][16]。それ(ら)は英語(版)のみ利用可能となった[16][18]。Googleに「最大かつ最も有能なAIモデル」として押し売りされ、人間の行動をエミュレートするように設計された[19][16][20](それについて)同社は、Geminiには「広範囲にわたる安全性のテスト」の必要性により、翌年まで幅広く利用できるようにはならないだろうと述べた[15]。GeminiはGoogleのテンソル・プロセッシング・ユニット(TPU)でトレーニングされ、そして駆動させており[15][18]、その名前はDeepMindとGoogle Brainの合併およびNASAのジェミニ計画にちなんで付けられている[21](※ジェミニの意味は、ふたご座)。
Gemini Ultraは、さまざまな業界ベンチマークでGPT4、AnthropicのClaude2、Inflection AIのInflection2、MetaのLLaMA2、xAIのGrok1よりもアウトパフォームしたと言われる[22][15]一方、Gemini ProはGPT-3.5よりアウトパフォームしたと言われていた[4]。Gemini Ultraも同じく、57科目の大規模マルチタスク言語理解(MMLU)テストで人間の専門家を上回り、90%のスコアを獲得した最初の言語モデルでもあった[4][21]。Gemini Proは12月13日にAI StudioとVertex AIでGoogle Cloudの顧客に利用できるようになり、一方でGemini NanoはAndroid開発者にも利用できるようになる[23][24][25]。ハサビスはさらに、DeepMindがGeminiを「ロボット工学と組み合わせて世界と物理的に対話する」方法を模索していることを明らかにした[26]。10月にジョー・バイデン大統領が署名した大統領令14110に従って、GoogleはGemini Ultraのテスト結果をアメリカ合衆国連邦政府と共有すると述べた。同様に、同社は11月にブレッチリー・パークで開催されたAI安全サミットで定められた原則を遵守するためにイギリス政府との協議に取り組んでいる[4]。
レセプション
[編集]GeminiのローンチはMITテクノロジーレビュー が「AIの誇大広告」と揶揄した、数か月にわたる激しい憶測と期待によって予期されていた[27][22]。2023年8月、調査会社セミアナリシス(SemiAnalysis)のディラン・パテル(Dylan Patel)氏とダニエル・ニッシュボール(Daniel Nishball)氏が、Geminiのリリースが「世界を食い尽くし」そしてGPT4を追い落とす(outclass)と宣言するブログ投稿を書き、OpenAIのCEOサム・アルトマンがX(旧Twitter)でこの二人を即座に嘲笑することになった[28][29]。イーロン・マスク(OpenAIの共同創設者)も加勢し、「数字は間違っているのか?("Are the numbers wrong?")」と尋ねたうえ[30]、Business Insider のヒュー・ラングレー(Hugh Langley)はGeminiがGoogleにとって運命を左右する瞬間になるだろうと述べ、次のように書いた:「もしGeminiが眩惑するなら(※原文: dazzles、星座に引っ掛けたダジャレ)、それはGoogleがMicrosoftとOpenAIによって盲点を突かれたという物語を変えるのに役立つだろう。逆にそれが期待外れだったら、Googleは遅れをとっているという批判家たちを勢い付かせることになるだろう。」[31]
2023年12月のお披露目に際して、ワシントン大学のオーレン・エツィオーニ名誉教授は、GoogleとOpenAI間の「軍拡競争の応酬」を予測した。カリフォルニア大学バークレー校教授のアレクセイ・エフロスはGeminiのマルチモーダルなアプローチの可能性を賞賛し[21]、一方サンタフェ研究所の科学者メラニー・ミッチェルはGeminiを「非常に洗練されている」と評した。ワシントン大学のチラグ・シャー(Chirag Shah)教授は、GeminiのローンチをAppleが毎年発表する新しいiPhoneに喩え、それほど感銘を受けなかった。同様に、スタンフォード大学のパーシー・リアン(Percy Liang)とワシントン大学のエミリー・ベンダーは、使用されたトレーニングデータについての洞察がなければベンチマークスコアを解釈するのは難しいと警告した[27]。
日本での利用
[編集]2024年2月1日、日本語版でもGemini Proが利用できるようになった[32]。
脚注
[編集]- ^ Grant, Nico (May 10, 2023). “Google Builds on Tech's Latest Craze With Its Own A.I. Products”. The New York Times. ISSN 0362-4331. オリジナルのMay 10, 2023時点におけるアーカイブ。 August 21, 2023閲覧。
- ^ Ortiz, Sabrina (May 10, 2023). “Every major AI feature announced at Google I/O 2023”. ZDNet. May 10, 2023時点のオリジナルよりアーカイブ。August 21, 2023閲覧。
- ^ Wankhede, Calvin (June 4, 2023). “What is Google Gemini: The next-gen language model that can do it all”. Android Authority. June 5, 2023時点のオリジナルよりアーカイブ。August 21, 2023閲覧。
- ^ a b c d Milmo, Dan (December 6, 2023). “Google says new AI model Gemini outperforms ChatGPT in most tests”. The Guardian. ISSN 0261-3077. オリジナルのDecember 6, 2023時点におけるアーカイブ。 December 6, 2023閲覧。
- ^ Levy, Steven (September 11, 2023). “Sundar Pichai on Google;s AI, Microsoft's AI, OpenAI, and ... Did We Mention AI?”. Wired. オリジナルのSeptember 11, 2023時点におけるアーカイブ。 September 12, 2023閲覧。.
- ^ Knight, Will (June 26, 2023). “Google DeepMind's CEO Says Its Next Algorithm Will Eclipse ChatGPT”. Wired. オリジナルのJune 26, 2023時点におけるアーカイブ。 August 21, 2023閲覧。.
- ^ a b c Victor, Jon (August 15, 2023). “How Google is Planning to Beat OpenAI”. The Information. August 15, 2023時点のオリジナルよりアーカイブ。August 21, 2023閲覧。
- ^ Grant, Nico (January 20, 2023). “Google Calls In Help From Larry Page and Sergey Brin for A.I. Fight”. The New York Times. ISSN 0362-4331. オリジナルのJanuary 20, 2023時点におけるアーカイブ。 February 6, 2023閲覧。
- ^ Kruppa, Miles; Seetharaman, Deepa (July 21, 2023). “Sergey Brin Is Back in the Trenches at Google”. The Wall Street Journal. ISSN 0099-9660. オリジナルのJuly 21, 2023時点におけるアーカイブ。 September 7, 2023閲覧。
- ^ Victor, Jon (September 18, 2023). “OpenAI Hustles to Beat Google to Launch 'Multimodal' LLM”. The Information. September 18, 2023時点のオリジナルよりアーカイブ。October 15, 2023閲覧。
- ^ “Google nears release of AI software Gemini, The Information reports”. Reuters. (September 14, 2023). オリジナルのSeptember 15, 2023時点におけるアーカイブ。 October 2, 2023閲覧。
- ^ Nolan, Beatrice (September 23, 2023). “Google is quietly handing out early demos of its GPT-4 rival called Gemini. Here's what we know so far about the upcoming AI model.”. Business Insider. September 23, 2023時点のオリジナルよりアーカイブ。October 16, 2023閲覧。
- ^ “Google Preps Public Preview of Gemini AI After Postponing In-Person Launch Events”. The Information (December 2, 2023). December 2, 2023時点のオリジナルよりアーカイブ。December 6, 2023閲覧。
- ^ Tangalakis-Lippert, Katherine (December 2, 2023). “Google has quietly pushed back the launch of next-gen AI model Gemini until next year, report says”. Business Insider. December 3, 2023時点のオリジナルよりアーカイブ。December 6, 2023閲覧。
- ^ a b c d Kruppa, Miles (December 6, 2023). “Google Announces AI System Gemini After Turmoil at Rival OpenAI”. The Wall Street Journal. ISSN 0099-9660. オリジナルのDecember 6, 2023時点におけるアーカイブ。 December 6, 2023閲覧。
- ^ a b c d Liedtike, Michael; O'Brien, Matt (December 6, 2023). “Google launches Gemini, upping the stakes in the global AI race”. Associated Press. オリジナルのDecember 6, 2023時点におけるアーカイブ。 December 6, 2023閲覧。
- ^ Edwards, Benj (December 6, 2023). “Google launches Gemini—a powerful AI model it says can surpass GPT-4”. Ars Technica. December 6, 2023時点のオリジナルよりアーカイブ。December 6, 2023閲覧。
- ^ a b Pierce, David (December 6, 2023). “Google launches Gemini, the AI model it hopes will take down GPT-4”. The Verge. December 6, 2023時点のオリジナルよりアーカイブ。December 6, 2023閲覧。
- ^ “Google launches Gemini, its most-advanced AI model yet, as it races to compete with ChatGPT”. CNN Business (December 6, 2023). December 6, 2023時点のオリジナルよりアーカイブ。December 6, 2023閲覧。
- ^ “Google launches Gemini, upping the stakes in the global AI race”. CBS News (December 6, 2023). December 7, 2023時点のオリジナルよりアーカイブ。December 7, 2023閲覧。
- ^ a b c Knight, Will (December 6, 2023). “Google Just Launched Gemini, Its Long-Awaited Answer to ChatGPT”. Wired. オリジナルのDecember 6, 2023時点におけるアーカイブ。 December 6, 2023閲覧。.
- ^ a b Henshall, Will (December 6, 2023). “Google DeepMind Unveils Its Most Powerful AI Offering Yet”. December 6, 2023時点のオリジナルよりアーカイブ。December 6, 2023閲覧。
- ^ Metz, Cade; Grant, Nico (December 6, 2023). “Google Updates Bard Chatbot With 'Gemini' A.I. as It Chases ChatGPT”. The New York Times. ISSN 0362-4331. オリジナルのDecember 6, 2023時点におけるアーカイブ。 December 6, 2023閲覧。
- ^ Elias, Jennifer (December 6, 2023). “Google launches its largest and 'most capable' AI model, Gemini”. CNBC. December 6, 2023時点のオリジナルよりアーカイブ。December 6, 2023閲覧。
- ^ “Google Opens Access to Gemini, Racing to Catch Up to OpenAI”. Bloomberg News (December 6, 2023). December 6, 2023時点のオリジナルよりアーカイブ。December 7, 2023閲覧。
- ^ Knight, Will (December 6, 2023). “Google DeepMind's Demis Hassabis Says Gemini Is a New Breed of AI”. Wired. オリジナルのDecember 6, 2023時点におけるアーカイブ。 December 7, 2023閲覧。.
- ^ a b Heikkilä, Melissa; Heaven, Will Douglas (December 6, 2023). “Google DeepMind’s new Gemini model looks amazing—but could signal peak AI hype”. MIT Technology Review. オリジナルのDecember 6, 2023時点におけるアーカイブ。 December 6, 2023閲覧。.
- ^ howdhury, Hasan (August 29, 2023). “AI bros are at war over declarations that Google's upcoming Gemini AI model smashes OpenAI's GPT-4”. Business Insider. August 29, 2023時点のオリジナルよりアーカイブ。September 7, 2023閲覧。
- ^ Harrison, Maggie (August 31, 2023). “OpenAI Rages at Report that Google's New AI Crushes GPT-4”. Fortune. オリジナルのAugust 31, 2023時点におけるアーカイブ。 September 7, 2023閲覧。.
- ^ Musk, Elon [@elonmusk] (2023年8月29日). "Are the numbers wrong?". 2023年9月1日時点のオリジナルよりアーカイブ。X(旧Twitter)より2023年10月15日閲覧。
- ^ Langley, Hugh (October 12, 2023). “Google VP teases Gemini's multimodal future: 'I've seen some pretty amazing things.'”. Business Insider. October 12, 2023時点のオリジナルよりアーカイブ。October 15, 2023閲覧。
- ^ “日本語の Bard でも Gemini Pro が利用可能に。 あわせて、回答を確認するダブルチェック機能も公開。”. Google Japan Blog. Google (2024年2月2日). 2024年2月2日時点のオリジナルよりアーカイブ。2024年2月2日閲覧。
参考文献
[編集]- Honan, Matt (December 6, 2023). “Google CEO Sundar Pichai on Gemini and the coming age of AI”. MIT Technology Review. オリジナルのDecember 6, 2023時点におけるアーカイブ。 December 6, 2023閲覧。.
関連項目
[編集]- Gato (DeepMind) – DeepMindによって開発されたマルチモーダル・ニューラル・ネットワーク
- コグニティブ・コンピュータ
外部リンク
[編集]- 公式ウェブサイト
- Gemini - Google DeepMind
- Gemini - Google The Keyword
- Gemini - YouTubeプレイリスト
- White paper - from Google DeepMind