Visualizzazione TABLE_STORAGE

La vista INFORMATION_SCHEMA.TABLE_STORAGE fornisce uno snapshot corrente dell'utilizzo dello spazio di archiviazione per tabelle e viste materializzate. Quando esegui una query sulla vista INFORMATION_SCHEMA.TABLE_STORAGE, i risultati della query contengono una riga per ogni tabella o vista materializzata per il progetto corrente. I dati nella vista INFORMATION_SCHEMA.TABLE_STORAGE non vengono conservati in tempo reale e gli aggiornamenti sono in genere con un ritardo da qualche secondo a qualche minuto. Le modifiche all'archiviazione causate solo dalla scadenza della partizione o della tabella o da modifiche alla finestra di spostamento cronologico del set di dati potrebbero richiedere fino a un giorno per essere applicate nella vista INFORMATION_SCHEMA.TABLE_STORAGE.

Le visualizzazioni dello spazio di archiviazione delle tabelle offrono un modo conveniente per osservare il consumo attuale di spazio di archiviazione e forniscono dettagli sull'utilizzo o meno di byte logici non compressi, byte compressi fisici o byte viaggi nel tempo. Queste informazioni possono aiutarti con attività come la pianificazione della crescita futura e la comprensione dei pattern di aggiornamento delle tabelle.

Dati inclusi nelle colonne *_BYTES

Le colonne *_BYTES nelle visualizzazioni tabella dello spazio di archiviazione includono informazioni sull'utilizzo dei byte di archiviazione. Queste informazioni vengono determinate esaminando l'utilizzo dello spazio di archiviazione per le viste materializzate e i seguenti tipi di tabelle:

  • Tabelle permanenti create tramite uno dei metodi descritti in Creare e utilizzare tabelle.
  • Tabelle temporanee create nelle sessioni. Queste tabelle sono inserite in set di dati con nomi generati come "_c018003e063d09570001ef33ae401fad6ab92a6a".
  • Tabelle temporanee create in query con più istruzioni ("script"). Queste tabelle sono inserite in set di dati con nomi generati come "_script72280c173c88442c3a7200183a50eeeaa4073719".

I dati archiviati nella cache dei risultati delle query non ti vengono addebitati e quindi non sono inclusi nei valori della colonna *_BYTES.

I cloni e gli snapshot mostrano i valori di colonna *_BYTES come se fossero tabelle complete, anziché mostrare il delta dello spazio di archiviazione utilizzato dalla tabella di base, pertanto sono una sovrastima. La tua fattura tiene conto correttamente di questo delta nell'utilizzo dello spazio di archiviazione. Per ulteriori informazioni sui byte delta archiviati e fatturati da cloni e snapshot, consulta la vista TABLE_STORAGE_USAGE_TIMELINE.

Previsione della fatturazione dello spazio di archiviazione

Per prevedere la fatturazione mensile dello spazio di archiviazione per un set di dati, puoi utilizzare le colonne logical o physical *_BYTES in questa visualizzazione, a seconda del modello di fatturazione dello spazio di archiviazione del set di dati utilizzato dal set di dati. Tieni presente che questa è solo una previsione approssimativa e gli importi esatti di fatturazione sono calcolati in base all'utilizzo da parte dell'infrastruttura di fatturazione dello spazio di archiviazione di BigQuery ed sono visibili in Fatturazione Cloud.

Per i set di dati che utilizzano un modello di fatturazione logica, puoi prevedere i costi di archiviazione mensili come segue:

(((valore ACTIVE_LOGICAL_BYTES / POW(1024, 3)) * prezzo per byte logici attivi) + ((valore di LONG_TERM_LOGICAL_BYTES / POW(1024, 3)) * prezzo per byte logici a lungo termine)

Il valore ACTIVE_LOGICAL_BYTES di una tabella riflette i byte attivi attualmente utilizzati dalla tabella.

Per i set di dati che utilizzano un modello di fatturazione fisico, puoi prevedere i costi di archiviazione come segue:

(((valore di ACTIVE_PHYSICAL_BYTES + FAIL_SAFE_PHYSICAL_BYTES / POW(1024, 3))) * prezzo per byte fisici attivi) + ((valore di LONG_TERM_PHYSICAL_BYTES / POW(1024, 3)) * prezzo di byte fisici a lungo termine)

Il valore ACTIVE_PHYSICAL_BYTES di una tabella riflette i byte attivi attualmente utilizzati dalla tabella più i byte utilizzati per il viaggio cronologico della tabella.

Per visualizzare solo i byte attivi della tabella, sottrai il valore TIME_TRAVEL_PHYSICAL_BYTES dal valore ACTIVE_PHYSICAL_BYTES.

Per ulteriori informazioni, vedi Prezzi dello spazio di archiviazione.

Ruoli obbligatori

Per ottenere le autorizzazioni di cui hai bisogno per eseguire query sulla vista INFORMATION_SCHEMA.TABLE_STORAGE, chiedi all'amministratore di concederti il ruolo IAM Visualizzatore metadati BigQuery (roles/bigquery.metadataViewer) per il progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.

Questo ruolo predefinito contiene le autorizzazioni necessarie per eseguire query sulla vista INFORMATION_SCHEMA.TABLE_STORAGE. Per visualizzare esattamente le autorizzazioni necessarie, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per eseguire query sulla vista INFORMATION_SCHEMA.TABLE_STORAGE sono necessarie le seguenti autorizzazioni:

  • bigquery.tables.get
  • bigquery.tables.list

Potresti anche riuscire a ottenere queste autorizzazioni con i ruoli personalizzati o altri ruoli predefiniti.

Schema

La vista INFORMATION_SCHEMA.TABLE_STORAGE ha il seguente schema:

Nome colonna Tipo di dati Valore
PROJECT_ID STRING L'ID del progetto che contiene il set di dati.
PROJECT_NUMBER INT64 Il numero del progetto che contiene il set di dati.
TABLE_CATALOG STRING L'ID del progetto che contiene il set di dati.
TABLE_SCHEMA STRING Il nome del set di dati che contiene la tabella o la vista materializzata, chiamato anche datasetId.
TABLE_NAME STRING Il nome della tabella o della vista materializzata, indicato anche come tableId.
CREATION_TIME TIMESTAMP L'ora di creazione della tabella.
TOTAL_ROWS INT64 Il numero totale di righe nella tabella o nella vista materializzata.
TOTAL_PARTITIONS INT64 Il numero di partizioni presenti nella tabella o nella vista materializzata. Le tabelle non partizionate restituiscono 0.
TOTAL_LOGICAL_BYTES INT64 Numero totale di byte logici (non compressi) nella tabella o nella vista materializzata.
ACTIVE_LOGICAL_BYTES INT64 Numero di byte logici (non compressi) precedenti a 90 giorni.
LONG_TERM_LOGICAL_BYTES INT64 Numero di byte logici (non compressi) precedenti a 90 giorni.
CURRENT_PHYSICAL_BYTES INT64 Numero totale di byte fisici per l'archiviazione attuale della tabella in tutte le partizioni.
TOTAL_PHYSICAL_BYTES INT64 Numero totale di byte fisici (compressi) utilizzati per l'archiviazione, inclusi i byte attivi, a lungo termine e per i viaggi nel tempo (dati eliminati o modificati). I byte a prova di errore (dati eliminati o modificati conservati dopo il periodo di viaggio temporale) non sono inclusi.
ACTIVE_PHYSICAL_BYTES INT64 Numero di byte fisici (compressi) meno di 90 giorni, inclusi i byte relativi ai viaggi nel tempo (dati eliminati o modificati).
LONG_TERM_PHYSICAL_BYTES INT64 Numero di byte fisici (compressi) risalenti a più di 90 giorni fa.
TIME_TRAVEL_PHYSICAL_BYTES INT64 Numero di byte fisici (compressi) utilizzati per l'archiviazione dei viaggi nel tempo (dati eliminati o modificati).
STORAGE_LAST_MODIFIED_TIME TIMESTAMP L'ora più recente in cui i dati sono stati scritti nella tabella.
DELETED BOOLEAN Indica se la tabella è stata eliminata o meno.
TABLE_TYPE STRING Il tipo di tabella. Ad esempio, EXTERNAL o BASE TABLE.
FAIL_SAFE_PHYSICAL_BYTES INT64 Numero di byte fisici (compressi) utilizzati dall'archiviazione a prova di errore (dati eliminati o modificati).

Ambito e sintassi

Le query relative a questa vista devono includere un qualificatore regione. La tabella seguente spiega l'ambito della regione per questa visualizzazione:

Nome vista Ambito risorsa Ambito della regione
[`PROJECT_ID`.]`region-REGION`.INFORMATION_SCHEMA.TABLE_STORAGE[_BY_PROJECT] Livello di progetto REGION
Sostituisci quanto segue:

  • (Facoltativo) PROJECT_ID: l'ID del tuo progetto Google Cloud. Se non specificato, viene utilizzato il progetto predefinito.
  • REGION: qualsiasi nome della regione del set di dati. Ad esempio: region-us.

L'esempio seguente mostra come restituire le informazioni di archiviazione per le tabelle in un progetto specifico:

SELECT * FROM `myProject`.`region-REGION`.INFORMATION_SCHEMA.TABLE_STORAGE;

L'esempio seguente mostra come restituire informazioni di archiviazione per le tabelle in una regione specificata:

SELECT * FROM `region-REGION`.INFORMATION_SCHEMA.TABLE_STORAGE_BY_PROJECT;

Esempi

Esempio 1:

L'esempio seguente mostra il totale dei byte logici fatturati per il progetto attuale.

SELECT
  SUM(total_logical_bytes) AS total_logical_bytes
FROM
  `region-REGION`.INFORMATION_SCHEMA.TABLE_STORAGE;

Il risultato è simile al seguente:

+---------------------+
| total_logical_bytes |
+---------------------+
| 971329178274633     |
+---------------------+
Esempio 2:

L'esempio seguente mostra come prevedere la differenza di prezzo per set di dati tra i modelli di fatturazione logico e fisico per i prossimi 30 giorni. Questo esempio presuppone che l'utilizzo futuro dello spazio di archiviazione sia costante nei successivi 30 giorni dal momento in cui è stata eseguita la query. Tieni presente che la previsione è limitata alle tabelle di base, esclude tutti gli altri tipi di tabelle in un set di dati.

I prezzi utilizzati nelle variabili di prezzo per questa query si riferiscono alla regione us-central1. Se vuoi eseguire questa query per un'altra regione, aggiorna le variabili di prezzo in modo appropriato. Per informazioni sui prezzi, vedi Prezzi dell'archiviazione.

  1. Apri la pagina BigQuery nella console Google Cloud.

    Vai alla pagina di BigQuery

  2. Inserisci la seguente query GoogleSQL nella casella Editor query. INFORMATION_SCHEMA richiede la sintassi di GoogleSQL. GoogleSQL è la sintassi predefinita nella console Google Cloud.

    DECLARE active_logical_gib_price FLOAT64 DEFAULT 0.02;
    DECLARE long_term_logical_gib_price FLOAT64 DEFAULT 0.01;
    DECLARE active_physical_gib_price FLOAT64 DEFAULT 0.04;
    DECLARE long_term_physical_gib_price FLOAT64 DEFAULT 0.02;
    
    WITH
     storage_sizes AS (
       SELECT
         table_schema AS dataset_name,
         -- Logical
         SUM(IF(deleted=false, active_logical_bytes, 0)) / power(1024, 3) AS active_logical_gib,
         SUM(IF(deleted=false, long_term_logical_bytes, 0)) / power(1024, 3) AS long_term_logical_gib,
         -- Physical
         SUM(active_physical_bytes) / power(1024, 3) AS active_physical_gib,
         SUM(active_physical_bytes - time_travel_physical_bytes) / power(1024, 3) AS active_no_tt_physical_gib,
         SUM(long_term_physical_bytes) / power(1024, 3) AS long_term_physical_gib,
         -- Restorable previously deleted physical
         SUM(time_travel_physical_bytes) / power(1024, 3) AS time_travel_physical_gib,
         SUM(fail_safe_physical_bytes) / power(1024, 3) AS fail_safe_physical_gib,
       FROM
         `region-REGION`.INFORMATION_SCHEMA.TABLE_STORAGE_BY_PROJECT
       WHERE total_physical_bytes > 0
         -- Base the forecast on base tables only for highest precision results
         AND table_type  = 'BASE TABLE'
         GROUP BY 1
     )
    SELECT
      dataset_name,
      -- Logical
      ROUND(active_logical_gib, 2) AS active_logical_gib,
      ROUND(long_term_logical_gib, 2) AS long_term_logical_gib,
      -- Physical
      ROUND(active_physical_gib, 2) AS active_physical_gib,
      ROUND(long_term_physical_gib, 2) AS long_term_physical_gib,
      ROUND(time_travel_physical_gib, 2) AS time_travel_physical_gib,
      ROUND(fail_safe_physical_gib, 2) AS fail_safe_physical_gib,
      -- Compression ratio
      ROUND(SAFE_DIVIDE(active_logical_gib, active_no_tt_physical_gib), 2) AS active_compression_ratio,
      ROUND(SAFE_DIVIDE(long_term_logical_gib, long_term_physical_gib), 2) AS long_term_compression_ratio,
      -- Forecast costs logical
      ROUND(active_logical_gib * active_logical_gib_price, 2) AS forecast_active_logical_cost,
      ROUND(long_term_logical_gib * long_term_logical_gib_price, 2) AS forecast_long_term_logical_cost,
      -- Forecast costs physical
      ROUND((active_no_tt_physical_gib + time_travel_physical_gib + fail_safe_physical_gib) * active_physical_gib_price, 2) AS forecast_active_physical_cost,
      ROUND(long_term_physical_gib * long_term_physical_gib_price, 2) AS forecast_long_term_physical_cost,
      -- Forecast costs total
      ROUND(((active_logical_gib * active_logical_gib_price) + (long_term_logical_gib * long_term_logical_gib_price)) -
         (((active_no_tt_physical_gib + time_travel_physical_gib + fail_safe_physical_gib) * active_physical_gib_price) + (long_term_physical_gib * long_term_physical_gib_price)), 2) AS forecast_total_cost_difference
    FROM
      storage_sizes
    ORDER BY
      (forecast_active_logical_cost + forecast_active_physical_cost) DESC;
    
  3. Fai clic su Esegui.

Il risultato è simile al seguente:

+--------------+--------------------+-----------------------+---------------------+------------------------+--------------------------+-----------------------------+------------------------------+----------------------------------+-------------------------------+----------------------------------+--------------------------------+
| dataset_name | active_logical_gib | long_term_logical_gib | active_physical_gib | long_term_physical_gib | active_compression_ratio | long_term_compression_ratio | forecast_active_logical_cost | forecaset_long_term_logical_cost | forecast_active_physical_cost | forecast_long_term_physical_cost | forecast_total_cost_difference |
+--------------+--------------------+-----------------------+---------------------+------------------------+--------------------------+-----------------------------+------------------------------+----------------------------------+-------------------------------+----------------------------------+--------------------------------+
| dataset1     |               10.0 |                  10.0 |                 1.0 |                    1.0 |                     10.0 |                        10.0 |                          0.2 |                              0.1 |                          0.04 |                             0.02 |                           0.24 |