Abfragen mit Gemini-Unterstützung schreiben

Sie können Gemini für Google Cloud verwenden. Geboten werden KI-basierte Hilfeleistungen, um Sie bei Folgendem in BigQuery zu unterstützen:

  • Eine SQL-Abfrage generieren.
  • Eine SQL-Abfrage abschließen.
  • Eine SQL-Abfrage erklären.
  • Python-Code generieren
  • Vollständiger Python-Code

Hier erfahren Sie, wie und wann Gemini für Google Cloud Ihre Daten verwendet.

Nur Prompts auf Englisch werden für Gemini in BigQuery unterstützt.

Dieses Dokument richtet sich an Fachkräfte für Datenanalyse, Datenwissenschaft und Datenentwicklung, die mit SQL-Abfragen und Colab Enterprise-Notebooks in BigQuery arbeiten. Dabei wird davon ausgegangen, dass Sie Kenntnisse zum Abfragen von Daten im BigQuery-SQL-Arbeitsbereich oder zur Arbeit mit Notebooks zum Analysieren von BigQuery-Daten mithilfe von Python haben.

Hinweise

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Prüfen Sie, ob Gemini für Ihr Google Cloud-Projekt eingerichtet ist. Gemini-Schaltflächen sind erst sichtbar, wenn die Einrichtung abgeschlossen ist.
  3. Wenn Sie Gemini mit Python-Code verwenden möchten, aktivieren Sie BigQuery Studio für die Asset-Verwaltung.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Cloud AI Companion User (roles/cloudaicompanion.user) für das Projekt zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Schreiben von Abfragen mit Gemini-Unterstützung benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.

Diese vordefinierte Rolle enthält Berechtigungen, die zum Schreiben von Abfragen mit Gemini-Unterstützung erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um Abfragen mit Gemini-Unterstützung zu schreiben:

  • cloudaicompanion.companions.generateCode
  • cloudaicompanion.entitlements.get

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Eine SQL-Abfrage generieren

Um eine SQL-Abfrage anhand des Schemas Ihrer Daten zu generieren, können Sie Gemini mit einer Aussage oder Frage in natürlicher Sprache (auch bekannt als als Prompt) bereitstellen. Selbst wenn Sie ohne Code, mit einer begrenzten Kenntnis des Datenschemas oder nur mit Grundkenntnissen der Google SQL-Syntax beginnen, kann Gemini eine oder mehrere SQL-Anweisungen generieren, die Ihnen helfen können, Ihre Daten zu untersuchen.

Das Hilfe-Code-Tool verwenden

Mit dem Tool Help me code können Sie eine SQL-Abfrage in natürlicher Sprache generieren, die Sie dann in BigQuery Studio ausführen können.

So verwenden Sie das Tool Hilfe beim Programmieren:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Klicken Sie im BigQuery Studio-Abfrageeditor auf SQL-Abfrage erstellen

  3. Klicken Sie in der Symbolleiste auf pen_sparkGemini und wählen Sie Tool zur Codegenerierung aus, falls es nicht bereits ausgewählt ist.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  4. Klicken Sie neben dem Query Editor auf pen_spark Hilfe beim Programmieren.

    Schaltfläche „Hilfe beim Programmieren“ im BigQuery-Abfrageeditor.

  5. Geben Sie im Tool Help me code einen Prompt ein. Beispiel:

     Using `bigquery-public-data.austin_bikeshare.bikeshare_trips`, show me the
     ten longest trip lengths by subscriber type.
    
  6. Klicken Sie auf Erstellen.

    Gemini generiert eine SQL-Abfrage, die etwa so aussieht:

    SELECT subscriber_type,
      MAX(duration_minutes) AS longest_trip_duration
    FROM `bigquery-public-data.austin_bikeshare.bikeshare_trips`
    GROUP BY subscriber_type
    ORDER BY longest_trip_duration DESC
    LIMIT 10;
    
  7. Prüfen Sie die generierte SQL-Abfrage und führen Sie eine der folgenden Aktionen aus:

    • Um die generierte SQL-Abfrage zu akzeptieren, klicken Sie auf Einfügen. Dadurch fügen Sie die Anweisung in den Abfrageeditor ein. Klicken Sie dann auf Ausführen, um die vorgeschlagene SQL-Abfrage auszuführen.
    • Klicken Sie auf Bearbeiten, um Gemini aufzufordern, eine neue Abfrage zu generieren. Nachdem Sie den Prompt bearbeitet haben, klicken Sie auf Aktualisieren. Sie können dann entscheiden, die neu generierte Anweisung zu akzeptieren oder den Vorschlag abzulehnen.
    • Wenn Sie den Vorschlag ablehnen möchten, schließen Sie das Fenster Hilfe beim Programmieren.
  8. Um Gemini dazu aufzufordern, eine neue Abfrage mit einer bestimmten Tabellenquelle zu generieren, klicken Sie auf Tabellenquellen bearbeiten, wählen Sie die neue Tabellenquelle aus und klicken Sie dann auf Anwenden. Du kannst die neue Aussage akzeptieren oder den Vorschlag ablehnen.

Das Hilfe-Code-Tool deaktivieren

Informationen zum Deaktivieren des Tools Help me code finden Sie unter Gemini-Funktionen deaktivieren

Prompt zum Generieren von SQL-Abfragen

Um SQL zu generieren, geben Sie im BigQuery-Abfrageeditor das Zeichen # gefolgt von einer Anweisung oder Frage in natürlicher Sprache zu den gewünschten Informationen ein. Gemini prüft Ihre letzten Abfragen, um ein Tabellenschema zu finden, das für Ihren Prompt relevant sein könnte. Wenn Sie die zu verwendende Tabelle kennen, können Sie den Tabellennamen in Ihrer Eingabeaufforderung in Graviszeichen (`) angeben.

Im folgenden Beispiel generieren Sie eine Abfrage für eine öffentliche BigQuery-Tabellebigquery-public-data.austin_bikeshare.bikeshare_trips.

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.

    Zu BigQuery Studio

    Die verbleibenden Schritte werden automatisch in der Google Cloud Console angezeigt.

  2. Klicken Sie im SQL-Abfrageeditor auf Neue Abfrage erstellen.

  3. Klicken Sie in der Taskleiste auf pen_spark Gemini und wählen Sie Auto-generation aus, wenn es noch nicht ausgewählt ist.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  4. Geben Sie im Abfrageeditor den folgenden Natural Language Prompt ein:

    # Using `bigquery-public-data.austin_bikeshare.bikeshare_trips`, calculate the
    # average trip length by subscriber type.
    
  5. Drücken Sie die Eingabetaste (Return unter macOS).

    Gemini schlägt eine SQL-Abfrage vor, die in etwa so aussieht:

    SELECT
      subscriber_type,
      AVG(duration_minutes) AS average_trip_length
    FROM
      `bigquery-public-data.austin_bikeshare.bikeshare_trips`
    GROUP BY
      subscriber_type
    
  6. Drücken Sie die Tabulatortaste, um den Vorschlag zu akzeptieren.

Zusätzliche Vorschläge ansehen

Gemini schlägt möglicherweise mehrere SQL-Anweisungen vor, die Ihren Prompt beantworten. Beispiel:

  1. Geben Sie im Abfrageeditor den folgenden Natural Language Prompt ein und drücken Sie die Eingabetaste (Return unter macOS):

    # Write a query that creates a table in the dataset `1234` with a string column called "name"
    

    Gemini schlägt eine SQL-Abfrage vor.

  2. Halten Sie den Mauszeiger über die vorgeschlagene SQL-Abfrage, um zu sehen, ob weitere Vorschläge vorhanden sind.

  3. Klicken Sie auf zusätzliche Vorschläge und führen Sie einen der folgenden Schritte aus:

    • Um einen Vorschlag akzeptieren, drücken Sie die Tabulatortaste.
    • Um bestimmte Wörter zu akzeptieren, drücken Sie Strg + Rechtspfeil (Befehlstaste + Rechtspfeil unter macOS).
    • Drücken Sie zum Ablehnen von Vorschlägen Esc.

Tipps für die SQL-Generierung

Die folgenden Tipps können die Vorschläge verbessern, die Gemini in BigQuery bietet:

  • Um ein Datenschema festzulegen, geben Sie den vollständig qualifizierten Tabellennamen in Graviszeichen (`) an, z. B. `PROJECT.DATASET.TABLE`.
  • Wenn die Spaltennamen oder ihre semantischen Beziehungen unklar oder komplex sind, können Sie im Prompt Kontext bereitstellen, um Gemini zur gewünschten Antwort zu führen. Dieses Verfahren wird als Prompt Engineering bezeichnet. Wenn Sie beispielsweise möchten, dass eine generierte Abfrage auf einen Spaltennamen verweist, beschreiben Sie den Spaltennamen und die Relevanz für die gewünschte Antwort. Um eine Antwort zu erhalten, die sich auf komplexe Begriffe wie Lifetime-Wert oder Handelsspanne bezieht, beschreiben Sie das Konzept und seine Relevanz für Ihre Daten, um die Ergebnisse der SQL-Generierung zu verbessern.
  • Prompts können sich über mehrere Zeilen im Query Editor erstrecken. Jede Zeile muss jedoch mit einem #-Zeichen beginnen.

Gemini- und BigQuery-Daten

Gemini in BigQuery kann auf die Metadaten der Tabellen zugreifen, für die Sie eine Zugriffsberechtigung haben. Dies können Tabellen-, Spaltennamen, Datentypen und Spaltenbeschreibungen sein. Gemini in BigQuery kann nicht auf die Daten in Ihren Tabellen, Ansichten oder Modellen zugreifen. Weitere Informationen dazu, wie Gemini Ihre Daten verwendet, finden Sie unter So nutzt Gemini for Google Cloud Ihre Daten.

SQL-Codegenerierung deaktivieren

Informationen zum Deaktivieren der SQL-Codegenerierung in BigQuery finden Sie unter Gemini-Funktionen deaktivieren.

SQL-Abfrage abschließen

Die SQL-Vervollständigung versucht, kontextrelevante Empfehlungen zu geben, die auf dem Inhalt des Query Editors basieren. Während der Eingabe kann Gemini logische nächste Schritte vorschlagen, die für den Kontext der aktuellen Abfrage relevant sind, oder Ihnen bei der Iteration einer Abfrage helfen.

So testen Sie die SQL-Vervollständigung mit Gemini:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.

    Zu BigQuery Studio

    Die verbleibenden Schritte werden automatisch in der Google Cloud Console angezeigt.

  2. Klicken Sie in der Symbolleiste auf pen_spark Gemini und wählen Sie Automatische Vervollständigung aus, wenn es noch nicht ausgewählt ist.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  3. Kopieren Sie im Abfrageeditor Folgendes:

    SELECT
      subscriber_type
      , EXTRACT(HOUR FROM start_time) AS hour_of_day
      , AVG(duration_minutes) AS avg_trip_length
    FROM
      `bigquery-public-data.austin_bikeshare.bikeshare_trips`
    

    Eine Fehlermeldung besagt, dass subscriber_type weder gruppiert noch aggregiert wird. Es ist nicht ungewöhnlich, dass Sie Hilfe bei der richtigen Abfrage benötigen.

  4. Drücken Sie die Eingabetaste (Return unter macOS) oder die Leertaste.

    Gemini schlägt Suchfilter für die Abfrage vor, die in einem ähnlichen Text wie dem folgenden enden könnten:

    GROUP BY
      subscriber_type, hour_of_day;
    
  5. Um den Vorschlag anzunehmen, drücken Sie die Tabulatortaste oder halten Sie den Mauszeiger über den vorgeschlagenen Text und klicken Sie auf alternative Vorschläge. Drücken Sie ESC oder fahren Sie mit der Eingabe fort, um einen Vorschlag zu verwerfen.

SQL-Abfrage erklären

Sie können Gemini in BigQuery auffordern, eine SQL-Abfrage in natürlicher Sprache zu erklären. Diese Erklärung kann Ihnen helfen, eine Abfrage zu verstehen, deren Syntax, das zugrunde liegende Schema und der geschäftliche Kontext aufgrund der Länge oder Komplexität der Abfrage möglicherweise schwer zu beurteilen sind.

Zusätzliche erforderliche Berechtigungen

Zusätzlich zu den erforderlichen Berechtigungen zum Schreiben von Abfragen mit Gemini benötigen Sie die Berechtigung cloudaicompanion.companions.generateChat,um Erläuterungen zu SQL zu erhalten. Diese Berechtigung ist in der IAM-Rolle Cloud AI Companion User (roles/cloudaicompanion.user) enthalten.

SQL-Abfragen erklären

Gehen Sie folgendermaßen vor, um eine SQL-Abfrage zu erklären:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery Studio.

    Zu BigQuery Studio

    Die verbleibenden Schritte werden automatisch in der Google Cloud Console angezeigt.

  2. Klicken Sie in der Symbolleiste auf pen_spark Gemini und wählen Sie Erläuterung aus, falls nicht bereits ausgewählt.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  3. Öffnen im Query Editor die Abfrage, die Sie erklärt haben möchten, oder fügen Sie sie ein.

  4. Markieren Sie die Abfrage, die Gemini erklären soll. Klicke auf astrophotography_mode Diese Abfrage erklären.

    Das Symbol „Diese Abfrage erklären“ und der Text werden in der linken Spalte des BigQuery-Query Editor hervorgehoben.

Die SQL-Erklärung wird im Gemini-Bereich angezeigt.

Python-Code generieren

Sie können Gemini mit einer Anweisung oder Frage in natürlicher Sprache auffordern, um Python-Code zu generieren. Gemini antwortet mit einem oder mehreren Python-Codevorschlägen.

Zusätzliche erforderliche Berechtigungen

Zusätzlich zu den erforderlichen Berechtigungen zum Schreiben von Abfragen mit Gemini müssen Sie die cloudaicompanion.instances.generateCode Berechtigung zum Generieren von Python-Code haben. Diese Berechtigung ist in der IAM-Rolle Cloud AI Companion User (roles/cloudaicompanion.user) enthalten.

Gemini zum Generieren von Python-Code verwenden

Im folgenden Beispiel generieren Sie Code für ein öffentliches BigQuery-Dataset, bigquery-public-data.ml_datasets.penguins.

  1. Rufen Sie die Seite BigQuery Studio auf.

    BigQuery aufrufen

  2. Klicken Sie in der Symbolleiste auf pen_spark Gemini und im Bereich Gemini in Python-Notebooks wählen Sie Codegenerierung aus, falls es nicht bereits ausgewählt ist.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  3. Klicken Sie in der Tableiste des Editorbereichs auf den Drop-down-Pfeil neben dem +-Zeichen und dann auf Python-Notebook erstellen:

    Notebook-Tab

    Das neue Notebook wird geöffnet und enthält Zellen, die Beispielabfragen für das öffentliche Dataset bigquery-public-data.ml_datasets.penguins zeigen.

  4. Klicken Sie in der Symbolleiste auf + Code, um eine neue Codezelle einzufügen. Eine neue Codezelle mit dem Text Start coding or generate with AI erscheint.

  5. Klicken Sie in der neuen Codezelle auf generate (Generieren).

  6. Geben Sie im Code-Editor den folgenden Natural Language Prompt ein:

    Using bigquery magics query the `bigquery-public-data.ml_datasets.penguins` table
    
  7. Drücken Sie die Eingabetaste (Return unter macOS).

    Gemini schlägt Python-Code vor, der in etwa so aussieht:

    %%bigquery
    SELECT *
    FROM `bigquery-public-data.ml_datasets.penguins`
    LIMIT 10
    

Python-Codevervollständigung

Die Python-Codevervollständigung versucht, kontextgerechte Empfehlungen zu geben, die auf den Inhalten des Abfrageeditors basieren. Während der Eingabe kann Gemini logische, für den Kontext Ihres aktuellen Codes relevante nächste Schritte vorschlagen, oder Ihnen bei der Iteration Ihres Codes helfen.

Zusätzliche erforderliche Berechtigungen

Zusätzlich zu den erforderlichen Berechtigungen zum Schreiben von Abfragen mit Gemini müssen Sie die cloudaicompanion.instances.completeCode Berechtigung zum Generieren von Python-Code haben. Diese Berechtigung ist in der IAM-Rolle Cloud AI Companion User (roles/cloudaicompanion.user) enthalten.

Gemini verwenden, um Python-Code zu vervollständigen

Führen Sie die folgenden Schritte aus, um die Python-Codevervollständigung mit Gemini auszuprobieren:

  1. Rufen Sie die Seite BigQuery Studio auf.

    BigQuery aufrufen

  2. Klicken Sie in der Symbolleiste auf pen_sparkGemini und wählen Sie im Abschnitt Gemini in Python-Notebook die Option Codevervollständigung aus, falls sie nicht bereits ausgewählt ist.

    Gemini-Schaltfläche in der BigQuery-Symbolleiste.

  3. Klicken Sie in der Tableiste des Editorbereichs auf den Drop-down-Pfeil neben dem +-Zeichen und dann auf Python-Notebook erstellen:

    Notebook-Tab

    Das neue Notebook wird geöffnet und enthält Zellen, die Beispielabfragen für das öffentliche Dataset bigquery-public-data.ml_datasets.penguins zeigen.

  4. Beginnen Sie im Code-Editor mit der Eingabe von Python-Code. Gemini schlägt während der Eingabe Code vor. Drücken Sie die Tabulatortaste, um den Vorschlag zu akzeptieren.

Gemini-Funktionen deaktivieren

Um Gemini-Features in BigQuery zu deaktivieren, führen Sie die folgenden Schritte aus:

  1. Klicken Sie in der Symbolleiste des SQL-Abfrageeditors auf pen_spark Gemini.

  2. Löschen Sie die Gemini-Funktionen, die Sie deaktivieren möchten.

Feedback geben

Sie können Feedback zu Gemini-Vorschlägen geben.

  • Klicken Sie in der Taskleiste auf pen_spark Gemini und wählen Sie Feedback senden aus, um Feedback zu senden.

Vorschläge zur Verbesserung der Vorschläge

Sie können zur Verbesserung von Gemini-Vorschlägen beitragen, indem Sie Ihre Prompt-Daten mit Google teilen. So geben Sie Ihre Prompt-Daten frei:

  1. In der Google Cloud Console auf der Seite BigQuery Studio klicken Sie in der Symbolleiste auf pen_spark Gemini

  2. Wählen Sie Daten zur Verbesserung von Gemini weitergeben aus.

  3. Aktualisieren Sie Ihre Einstellungen für die Datennutzung im Dialogfeld mit den Einstellungen für die Datennutzung.

Datenfreigabeeinstellungen gelten für das gesamte Projekt und können nur von einem Projektadministrator mit den IAM-Berechtigungen serviceusage.services.enable und serviceusage.services.list festgelegt werden. Weitere Informationen zur Datennutzung im Trusted Tester-Programm finden Sie unter Gemini im Google Cloud Trusted Tester-Programm.

Nächste Schritte