Introduzione alle connessioni
BigQuery consente di eseguire query sui dati archiviati al di fuori di BigQuery in servizi Google Cloud come Cloud Storage o Spanner oppure in origini di terze parti come AWS o Azure. Queste connessioni esterne utilizzano l'API BigQuery Connection.
Ad esempio, supponi di archiviare i dettagli degli ordini dei clienti in Cloud SQL e i dati delle vendite in BigQuery e di voler unire le due tabelle in un'unica query. Puoi creare una connessione Cloud SQL al database esterno con l'API BigQuery Connection. Con le connessioni, non invii mai le credenziali del database come cleartext.
Una connessione viene criptata e archiviata in modo sicuro nel servizio di connessione BigQuery. Puoi concedere agli utenti l'accesso alle connessioni assegnando loro i ruoli Identity and Access Management (IAM) per la connessione BigQuery.
Tipi di connessione
BigQuery fornisce diversi tipi di connessione per le seguenti origini dati esterne:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Archiviazione blob Azure
- Risorse di Google Cloud come modelli remoti di Vertex AI, funzioni remote e BigLake
- Spanner
- Cloud SQL
- AlloyDB per PostgreSQL (anteprima)
Connessioni Amazon S3
Per creare una connessione Amazon S3 con BigQuery Omni, consulta Connettersi ad Amazon S3.
Una volta stabilita una connessione Amazon S3, puoi procedere come segue:
- Creare tabelle esterne su Amazon S3
- Eseguire query sui dati di Amazon S3
- Esportare i risultati in Amazon S3
- Crea set di dati basati su database AWS Glue.
Connessioni Spark
Le Stored procedure per Spark consentono di eseguire stored procedure scritte in Python utilizzando BigQuery. Una connessione Spark ti consente di connetterti a Dataproc Serverless ed eseguire le stored procedure per Spark.
Per creare questa connessione, vedi Creare connessioni.
Connessioni di Blob Storage
Per creare una connessione Archiviazione BLOB con BigQuery Omni, consulta Connettersi all'archiviazione BLOB.
Dopo aver creato una connessione allo spazio di archiviazione BLOB esistente, puoi:
- Crea tabelle esterne basate sull'archiviazione BLOB
- Eseguire query sui dati di Archiviazione BLOB
- Esportare i risultati in Archiviazione BLOB
Connessioni alle risorse Google Cloud
Una connessione alle risorse Google Cloud è una connessione per autorizzare l'accesso ad altre risorse di Google Cloud come modelli remoti di Vertex AI, funzioni remote e BigLake. Per maggiori dettagli su come configurare una connessione alle risorse Google Cloud, consulta Creare e configurare una connessione alle risorse Cloud.
Una volta stabilita una connessione alle risorse Google Cloud, puoi utilizzare questa connessione per creare i seguenti oggetti BigQuery:
- Modelli remoti. Per ulteriori informazioni, vedi L'istruzione CREATE MODEL per i modelli remoti su LLM, L'istruzione CREATE MODEL per i modelli remoti sui servizi di IA Cloud e L'istruzione CREATE MODEL per i modelli remoti su modelli ospitati da Vertex AI.
- Funzioni remote. Le funzioni remote di BigQuery consentono di implementare funzioni con qualsiasi linguaggio supportato in Cloud Functions o Cloud Run. Una connessione di funzione remota ti consente di connetterti a Cloud Functions o Cloud Run ed eseguire queste funzioni. Per creare una connessione di funzione remota BigQuery, consulta Creare una connessione.
- Tabelle BigLake. Le connessioni BigLake collegano le tabelle BigLake a origini dati esterne, garantendo al contempo il controllo e la sicurezza granulari dell'accesso a BigQuery per i dati strutturati e non strutturati in Cloud Storage.
- Tabelle di oggetti. Per ulteriori informazioni, consulta Introduzione alle tabelle degli oggetti.
Connessioni Spanner
Per creare una connessione Spanner, consulta Connettersi a Spanner.
Quando disponi di una connessione Spanner esistente, puoi creare query federate. Queste query possono stabilire connessioni a Spanner prima di inviare una query.
Connessioni Cloud SQL
Per creare una connessione Cloud SQL, consulta Connettersi a Cloud SQL.
Quando disponi di una connessione Cloud SQL esistente, puoi creare query federate. Queste query possono stabilire connessioni a Cloud SQL prima di inviare una query.
Connessioni AlloyDB
Per creare una connessione AlloyDB, consulta Connettersi ad AlloyDB per PostgreSQL.
Quando disponi di una connessione AlloyDB esistente, puoi creare query federate. Queste query possono stabilire connessioni ad AlloyDB prima che tu invii una query.
Audit log
BigQuery registra le richieste di utilizzo e gestione relative alle connessioni. Per saperne di più, consulta Panoramica degli audit log di BigQuery.
Passaggi successivi
- Scopri come gestire le connessioni.
- Scopri come analizzare le tabelle degli oggetti utilizzando le funzioni remote.
- Scopri come eseguire query sui dati archiviati:
- Eseguire query sui dati archiviati in Amazon S3.
- Eseguire query sui dati archiviati in Archiviazione BLOB.
- Eseguire query sui dati strutturati archiviati in Cloud Storage.
- Eseguire query su dati non strutturati archiviati in Cloud Storage.
- Eseguire query sui dati archiviati in Spanner.
- Eseguire query sui dati archiviati in Cloud SQL.
- Eseguire query sui dati archiviati in AlloyDB.
- Eseguire query sui dati utilizzando funzioni remote.
- Eseguire query su dati non strutturati utilizzando funzioni remote.
- Eseguire query sui dati utilizzando stored procedure per Apache Spark.
- Scopri di più sulle tabelle esterne.