Limitare l'accesso ai dati utilizzando le regole di analisi

Questo documento fornisce informazioni generali sulle regole di analisi in GoogleSQL per BigQuery.

Che cos'è una regola di analisi?

Una regola di analisi applica i criteri per la condivisione dei dati. Un criterio rappresenta una condizione che deve essere soddisfatta prima di poter eseguire una query. Con BigQuery, puoi applicare una regola di analisi su una vista, utilizzando una data clean room o applicando la regola di analisi direttamente alla vista. Quando applichi una regola di analisi, tutti gli utenti che eseguono query sulla vista devono rispettare la regola di analisi sulla vista. Se la regola di analisi è soddisfatta, la query produce un output che soddisfa la regola di analisi. Se la query non soddisfa la regola di analisi, viene generato un errore.

Regole di analisi supportate

Sono supportate le seguenti regole di analisi:

  • Regola di analisi della soglia di aggregazione: applica il numero minimo di entità distinte che devono essere presenti in un set di dati. Puoi applicare questa regola a una vista utilizzando istruzioni DDL o data clean room. Questa regola supporta i criteri di soglia di aggregazione e il criterio di limitazione di join.

  • Regola di analisi della privacy differenziale: applica un budget di privacy, che limita i dati rivelati a un abbonato quando i dati sono protetti con la privacy differenziale. Puoi applicare questa regola a una vista utilizzando istruzioni DDL o data clean room. Questa regola supporta le norme sulla privacy differenziale e i criteri di restrizione dei join.

  • Regola di analisi della sovrapposizione degli elenchi: è possibile eseguire query sulle righe sovrapposte solo dopo un'operazione di join conforme alla regola. Puoi applicare questa regola a una vista utilizzando istruzioni DDL o data clean room. Questa regola supporta il criterio di limitazione di join.

Regola di analisi della soglia di aggregazione

Una regola di analisi della soglia di aggregazione applica il numero minimo di entità distinte che devono contribuire a una riga di output di una query, in modo che la riga di output sia inclusa nel risultato della query.

Quando applicata, la regola di analisi della soglia di aggregazione raggruppa i dati in più dimensioni, garantendo al contempo che la soglia di aggregazione sia soddisfatta. Conta il numero di unità privacy distinte (rappresentate dalla colonna unità privacy) per ogni gruppo e restituisce solo i gruppi in cui il conteggio distinto delle unità privacy soddisfa la soglia di aggregazione.

Una vista che include questa regola di analisi deve includere il criterio della soglia di aggregazione e, facoltativamente, può includere il criterio di limitazione di join.

Definisci una regola di analisi della soglia di aggregazione per una vista

Puoi definire una regola di analisi della soglia di aggregazione per una vista in una data clean room o con l'istruzione CREATE VIEW:

CREATE OR REPLACE VIEW VIEW_NAME
  OPTIONS (
    privacy_policy= '{
      "aggregation_threshold_policy": {
        "threshold" : THRESHOLD,
        "privacy_unit_column": "PRIVACY_UNIT_COLUMN"
      },
      "join_restriction_policy": {
        "join_condition": "JOIN_CONDITION",
        "join_allowed_columns": JOIN_ALLOWED_COLUMNS
      }
    }'
  )
  AS QUERY;

Definizioni:

  • aggregation_threshold_policy: il criterio della soglia di aggregazione per la regola di analisi della soglia di aggregazione.

    • VIEW_NAME: il percorso e il nome della vista.

    • THRESHOLD: il numero minimo di unità privacy distinte che devono contribuire a ogni riga nei risultati della query. Se una potenziale riga non soddisfa questa soglia, viene omessa dai risultati della query.

    • PRIVACY_UNIT_COLUMN: rappresenta la colonna dell'unità privacy. Una colonna unità privacy è un identificatore univoco di un'unità privacy. Un'unità privacy è un valore della colonna unità privacy che rappresenta l'entità in un set di dati protetto.

      Puoi utilizzare una sola colonna unità privacy e il tipo di dati per la colonna unità privacy deve essere raggruppabile.

      I valori nella colonna dell'unità privacy non possono essere proiettati direttamente tramite una query e puoi utilizzare solo funzioni aggregate supportate dalle regole di analisi per aggregare i dati in questa colonna.

  • (Facoltativo) join_restriction_policy: il criterio facoltativo di limitazione di join per la regola di analisi della soglia di aggregazione.

    • JOIN_CONDITION: il tipo di limitazione di join da applicare a una vista. Può trattarsi di uno dei seguenti valori:

      • JOIN_ALL: tutte le colonne in join_allowed_columns devono essere unite all'interno per poter eseguire query su questa vista.

      • JOIN_ANY: è necessario unire almeno una colonna in join_allowed_columns per poter eseguire query su questa vista.

      • JOIN_BLOCKED: questa visualizzazione non può essere unita in nessuna colonna. Non impostare join_allowed_columns in questo caso.

      • JOIN_NOT_REQUIRED: non è necessario un join per eseguire una query su questa vista. Se si utilizza un join, è possibile utilizzare solo le colonne in join_allowed_columns.

    • JOIN_ALLOWED_COLUMNS: le colonne che possono far parte di un'operazione di join.

  • QUERY: la query per la vista.

Esempio:

Nell'esempio seguente, viene creata una regola di analisi della soglia di aggregazione in una vista denominata ExamView. ExamView fa riferimento a una tabella denominata ExamTable:

CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"aggregation_threshold_policy": {"threshold": 3, "privacy_unit_column": "last_name"}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

Per esaminare la sintassi privacy_policy per CREATE VIEW, consulta l'elenco OPTIONS in CREATE VIEW.

Aggiornare una regola di analisi della soglia di aggregazione per una vista

Puoi modificare la regola di analisi della soglia di aggregazione per una vista in una data clean room o con l'istruzione ALTER VIEW:

ALTER VIEW VIEW_NAME
SET OPTIONS (
  privacy_policy= '{
    "aggregation_threshold_policy": {
      "threshold" : THRESHOLD,
      "privacy_unit_column": "PRIVACY_UNIT_COLUMN"
    }
  }'
)

Per ulteriori informazioni sui valori che puoi impostare per i criteri sulla privacy nella sintassi precedente, consulta Definire una regola di analisi della soglia di aggregazione per una vista.

Esempio:

Nell'esempio seguente, una regola di analisi della soglia di aggregazione viene aggiornata in una vista denominata ExamView.

ALTER VIEW mydataset.ExamView
SET OPTIONS (
  privacy_policy= '{"aggregation_threshold_policy": {"threshold": 50, "privacy_unit_column": "last_name"}}'
);

Per esaminare la sintassi privacy_policy per ALTER VIEW, consulta l'elenco OPTIONS in ALTER VIEW SET OPTIONS.

Eseguire query su una vista applicata dalla regola di analisi della soglia di aggregazione

Puoi eseguire query su una vista che ha una regola di analisi della soglia di aggregazione con la clausola AGGREGATION_THRESHOLD. La query deve includere funzioni di aggregazione e puoi utilizzare solo funzioni aggregate supportate dalla soglia di aggregazione in questa query.

Esempio:

Nell'esempio seguente, viene eseguita una query su una regola di analisi della soglia di aggregazione in una vista denominata ExamView:

SELECT WITH AGGREGATION_THRESHOLD
  test_id, COUNT(DISTINCT last_name) AS student_count
FROM mydataset.ExamView
GROUP BY test_id;

/*---------+---------------*
 | test_id | student_count |
 +---------+---------------+
 | P91     | 3             |
 | U25     | 4             |
 *---------+---------------*/

La regola di analisi della soglia di aggregazione può anche includere facoltativamente il criterio di limitazione di join. Per scoprire come utilizzare il criterio di limitazione di join con una regola di analisi, consulta Unire il criterio di limitazione nelle regole di analisi.

Per esaminare altri esempi per la clausola AGGREGATION_THRESHOLD, consulta la clausola AGGREGATION_THRESHOLD.

Regola di analisi della privacy differenziale

La regola di analisi della privacy differenziale applica un budget di privacy, che limita i dati rivelati a un abbonato quando i dati sono protetti con la privacy differenziale. Un budget di privacy impedisce ai sottoscrittori di eseguire query sui dati condivisi se la somma dell'epsilon o del delta di tutte le query raggiunge il valore epsilon o delta totale. Puoi utilizzare questa regola di analisi in una vista.

Una vista che include questa regola di analisi deve includere le norme sulla privacy differenziale e, facoltativamente, può includere le norme relative alle limitazioni di join.

Definire una regola di analisi della privacy differenziale per una vista

Puoi definire una regola di analisi della privacy differenziale per una vista in una data clean room o con l'istruzione CREATE VIEW:

CREATE OR REPLACE VIEW VIEW_NAME
  OPTIONS (
    privacy_policy= '{
      "differential_privacy_policy": {
        "privacy_unit_column": "PRIVACY_UNIT_COLUMN",
        "max_epsilon_per_query": MAX_EPSILON_PER_QUERY,
        "epsilon_budget": EPSILON_BUDGET,
        "delta_per_query": DELTA_PER_QUERY,
        "delta_budget": DELTA_BUDGET,
        "max_groups_contributed": MAX_GROUPS_CONTRIBUTED
      },
      "join_restriction_policy": {
        "join_condition": "JOIN_CONDITION",
        "join_allowed_columns": JOIN_ALLOWED_COLUMNS
      }
    }'
  )
  AS QUERY;

Definizioni:

  • differential_privacy_policy: le norme sulla privacy differenziale per la regola di analisi della privacy differenziale.

    • PRIVACY_UNIT_COLUMN: la colonna che identifica l'entità in un set di dati protetto da una regola di analisi della privacy. Questo valore è una stringa JSON.

    • MAX_EPSILON_PER_QUERY: determina la quantità di rumore aggiunto ai risultati per query e impedisce che il totale epsilon venga raggiunto da una singola query. Questo valore è un numero JSON compreso tra 0.001 e 1e+15.

    • EPSILON_BUDGET: il budget epsilon che rappresenta l'epsilon totale che può essere utilizzato in tutte le query differenzialmente private nella vista. Questo valore deve essere superiore a MAX_EPSILON_PER_QUERY e si tratta di un numero JSON compreso tra 0.001 e 1e+15.

    • DELTA_PER_QUERY: la probabilità che qualsiasi riga nel risultato non sia epsilon-diversamente privata. Questo valore è un numero JSON compreso tra 1e-15 e 1.

    • DELTA_BUDGET: il budget delta, che rappresenta il delta totale che può essere utilizzato in tutte le query diversamente private nella vista. Questo valore deve essere maggiore di DELTA_PER_QUERY ed è un numero JSON compreso tra 1e-15 e 1000.

    • MAX_GROUPS_CONTRIBUTED (facoltativo): limita il numero di gruppi a cui un'entità in una colonna dell'unità privacy può contribuire. Questo valore deve essere un numero intero JSON non negativo.

  • (Facoltativo) join_restriction_policy: il criterio facoltativo relativo alla limitazione di join per la regola di analisi della privacy differenziale.

    • JOIN_CONDITION: il tipo di limitazione di join da applicare a una vista. Può trattarsi di uno dei seguenti valori:

      • JOIN_ALL: tutte le colonne in join_allowed_columns devono essere unite all'interno per poter eseguire query su questa vista.

      • JOIN_ANY: è necessario unire almeno una colonna in join_allowed_columns per poter eseguire query su questa vista.

      • JOIN_BLOCKED: questa visualizzazione non può essere unita in nessuna colonna. Non impostare join_allowed_columns in questo caso.

      • JOIN_NOT_REQUIRED: non è necessario un join per eseguire una query su questa vista. Se si utilizza un join, è possibile utilizzare solo le colonne in join_allowed_columns.

    • JOIN_ALLOWED_COLUMNS: le colonne che possono far parte di un'operazione di join.

  • QUERY: la query per la vista.

Esempio:

Nell'esempio seguente, viene creata una regola di analisi della privacy differenziale in una vista denominata ExamView. ExamView fa riferimento a una tabella denominata ExamTable:

CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"differential_privacy_policy": {"privacy_unit_column": "last_name", "max_epsilon_per_query": 1000.0, "epsilon_budget": 10000.1, "delta_per_query": 0.01, "delta_budget": 0.1, "max_groups_contributed": 2}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- NOTE: Delta and epsilon parameters are set very high due to the small
-- dataset. In practice, these should be much smaller.

Per esaminare la sintassi privacy_policy per CREATE VIEW, consulta l'elenco OPTIONS in CREATE VIEW.

Aggiornare una regola di analisi della privacy differenziale per una vista

Puoi modificare la regola di analisi della privacy differenziale per una vista in una data clean room o con l'istruzione ALTER VIEW:

ALTER VIEW VIEW_NAME
SET OPTIONS (
  privacy_policy= '{
    "differential_privacy_policy": {
      "privacy_unit_column": "PRIVACY_UNIT_COLUMN",
      "max_epsilon_per_query": MAX_EPSILON_PER_QUERY,
      "epsilon_budget": EPSILON_BUDGET,
      "delta_per_query": DELTA_PER_QUERY,
      "delta_budget": DELTA_BUDGET,
      "max_groups_contributed": MAX_GROUPS_CONTRIBUTED
    }
  }'
)

Per ulteriori informazioni sui valori che puoi impostare per i criteri sulla privacy nella sintassi precedente, consulta Definire una regola di analisi della privacy differenziale per una vista.

Esempio:

Nell'esempio seguente, una regola di analisi della privacy differenziale viene aggiornata in una vista denominata ExamView.

ALTER VIEW mydataset.ExamView
SET OPTIONS(
  privacy_policy= '{"differential_privacy_policy": {"privacy_unit_column": "last_name", "max_epsilon_per_query": 0.01, "epsilon_budget": 1000.0, "delta_per_query": 0.05, "delta_budget": 0.1, "max_groups_contributed": 2}}'
);

-- NOTE: Delta and epsilon parameters are set very high due to the small
-- dataset. In practice, these should be much smaller.

Per esaminare la sintassi privacy_policy per ALTER VIEW, consulta l'elenco OPTIONS in ALTER VIEW SET OPTIONS.

Eseguire query su una vista applicata da una regola di analisi della privacy differenziale

Puoi eseguire una query su una vista che ha una regola di analisi della privacy differenziale con la clausola DIFFERENTIAL_PRIVACY. Per esaminare la sintassi e ulteriori esempi per la clausola DIFFERENTIAL_PRIVACY, consulta la clausola DIFFERENTIAL_PRIVACY.

Esempio:

Nell'esempio seguente, viene eseguita una query su una regola di analisi della privacy differenziale in una vista denominata ExamView. I dati differenziati privati devono essere restituiti correttamente da ExamView perché epsilon, delta e max_groups_contributed soddisfano tutti le condizioni della regola dell'analisi differenziale in ExamView.

-- Query an analysis–rule enforced view called ExamView.
SELECT
  WITH DIFFERENTIAL_PRIVACY
    test_id,
    AVG(test_score) AS average_test_score
FROM mydataset.ExamView
GROUP BY test_id;

-- Results will vary.
/*---------+--------------------*
 | test_id | average_test_score |
 +---------+--------------------+
 | P91     | 512.627693163311   |
 | C83     | 506.01565971561649 |
 | U25     | 524.81202728847893 |
 *---------+--------------------*/

Blocca una query con un epsilon fuori intervallo

Epsilon può essere utilizzato per aggiungere o rimuovere il rumore. Più epsilon significa che verrà aggiunto meno rumore. Se vuoi assicurarti che una query con privacy differenziata presenti una quantità di rumore minima, presta attenzione al valore di max_epsilon_per_query nella regola di analisi della privacy differenziale.

Esempio:

Nella query seguente, la query è bloccata con un errore perché epsilon nella clausola DIFFERENTIAL_PRIVACY è superiore a max_epsilon_per_query nella clausola ExamView:

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"differential_privacy_policy": {"privacy_unit_column": "last_name", "max_epsilon_per_query": 10.01, "epsilon_budget": 1000.0, "delta_per_query": 0.01, "delta_budget": 0.1, "max_groups_contributed": 2}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- NOTE: Delta and epsilon parameters are set very high due to the small
-- dataset. In practice, these should be much smaller.

Dopo aver creato la vista, attendi brevemente ed esegui questa query:

-- Error: Epsilon is too high: 1e+20, policy for table mydataset.
-- ExamView allows max 10.01
SELECT
  WITH DIFFERENTIAL_PRIVACY
    OPTIONS(epsilon=1e20)
    test_id,
    AVG(test_score) AS average_test_score
FROM mydataset.ExamView
GROUP BY test_id;

Blocca le query che hanno superato un budget epsilon

Epsilon può essere utilizzato per aggiungere o rimuovere il rumore. Meno epsilon aumenta il rumore, più epsilon riduce il rumore. Anche quando il rumore è elevato, più query sugli stessi dati possono alla fine rivelare la versione senza rumore dei dati. Per evitare che ciò accada, puoi creare un budget epsilon. Se vuoi aggiungere un budget epsilon, rivedi il valore per epsilon_budget nella regola di analisi della privacy differenziale per la tua vista.

Esempio:

Esegui la seguente query tre volte. La terza volta, la query viene bloccata perché l'epsilon totale utilizzato è 30, ma epsilon_budget in ExamView consente solo 25.6:

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"differential_privacy_policy": {"privacy_unit_column": "last_name", "max_epsilon_per_query": 10.01, "epsilon_budget": 25.6, "delta_per_query": 0.01, "delta_budget": 0.1, "max_groups_contributed": 2}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- NOTE: Delta and epsilon parameters are set very high due to the small
-- dataset. In practice, these should be much smaller.

Dopo aver creato la vista, attendi brevemente, poi esegui la seguente query tre volte:

-- Error after three query runs: Privacy budget is not sufficient for
-- table 'mydataset.ExamView' in this query.

SELECT
  WITH DIFFERENTIAL_PRIVACY
    OPTIONS(epsilon=10)
    test_id,
    AVG(test_score) AS average_test_score
FROM mydataset.ExamView
GROUP BY test_id;

Regola di analisi della sovrapposizione degli elenchi

È possibile eseguire query solo su righe sovrapposte dopo un'operazione di join, in conformità alla regola di sovrapposizione degli elenchi. Puoi applicare questa regola a una vista utilizzando istruzioni DDL o data clean room.

Una vista che include questa regola di analisi deve includere solo il criterio di limitazione di join.

Definire una regola di analisi della sovrapposizione degli elenchi per una vista

Puoi definire una regola di analisi della sovrapposizione degli elenchi per una vista in una data clean room o con l'istruzione CREATE VIEW:

CREATE OR REPLACE VIEW VIEW_NAME
  OPTIONS (
    privacy_policy= '{
      "join_restriction_policy": {
        "join_condition": "JOIN_CONDITION",
        "join_allowed_columns": JOIN_ALLOWED_COLUMNS
      }
    }'
  )
  AS QUERY;

Definizioni:

  • join_restriction_policy: il criterio di limitazione di join per la regola di analisi della sovrapposizione degli elenchi.

    • JOIN_CONDITION: il tipo di sovrapposizione dell'elenco da applicare a una vista. Può trattarsi di uno dei seguenti valori:

      • JOIN_ALL: tutte le colonne in join_allowed_columns devono essere unite all'interno per poter eseguire query su questa vista.

      • JOIN_ANY: è necessario unire almeno una colonna in join_allowed_columns per poter eseguire query su questa vista.

    • JOIN_ALLOWED_COLUMNS: le colonne che possono far parte di un'operazione di join.

  • QUERY: la query per la vista.

Esempio:

Nell'esempio seguente, viene creata una regola di analisi della sovrapposizione degli elenchi in una vista denominata ExamView. ExamView fa riferimento a una tabella denominata ExamTable:

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"join_restriction_policy": {"join_condition": "JOIN_ANY", "join_allowed_columns": ["test_id", "test_score"]}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

Aggiornare una regola di analisi della sovrapposizione degli elenchi per una vista

Puoi modificare la regola di analisi della sovrapposizione degli elenchi per una vista con una data clean room o con l'istruzione ALTER VIEW:

ALTER VIEW VIEW_NAME
SET OPTIONS (
  privacy_policy= '{
    "join_restriction_policy": {
      "join_condition": "JOIN_CONDITION",
      "join_allowed_columns": JOIN_ALLOWED_COLUMNS
    }
  }'
)

Per ulteriori informazioni sui valori che puoi impostare per le norme sulla privacy nella sintassi precedente, consulta Definire una regola di analisi della sovrapposizione degli elenchi per una vista.

Esempio:

Nell'esempio seguente, una regola di analisi della sovrapposizione degli elenchi viene aggiornata in una vista denominata ExamView.

ALTER VIEW mydataset.ExamView
SET OPTIONS(
  privacy_policy= '{"join_restriction_policy": {"join_condition": "JOIN_ALL", "join_allowed_columns": ["test_id", "test_score"]}}'
);

Per esaminare la sintassi privacy_policy per ALTER VIEW, consulta l'elenco OPTIONS in ALTER VIEW SET OPTIONS.

Eseguire una query su una vista applicata dalla regola di analisi della sovrapposizione degli elenchi

Puoi eseguire un'operazione di join su una vista che ha una regola di analisi della sovrapposizione degli elenchi. Per esaminare la sintassi dell'operazione JOIN, consulta Operazione di join.

Bloccare un'operazione di join senza sovrapposizione

Puoi bloccare un'operazione di join se non include almeno una sovrapposizione con una colonna obbligatoria.

Esempio:

Nella query seguente, una vista denominata ExamView è giunta a una tabella denominata StudentTable. Poiché la vista contiene la regola di analisi della sovrapposizione degli elenchi JOIN_ANY, è necessaria almeno una riga sovrapposta da ExamView e StudentTable. Poiché è presente almeno una sovrapposizione, la query viene eseguita correttamente.

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"join_restriction_policy": {"join_condition": "JOIN_ANY", "join_allowed_columns": ["test_score", "last_name"]}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- Query a view called ExamView and a table called StudentTable.
SELECT *
FROM mydataset.ExamView INNER JOIN mydataset.StudentTable USING (test_score);

/*------------+-----------+---------+-------------*
 | test_score | last_name | test_id | last_name_1 |
 +------------+-----------+---------+-------------+
 | 490        | Ivanov    | U25     | Ivanov      |
 | 500        | Wang      | U25     | Wang        |
 | 510        | Hansen    | P91     | Hansen      |
 | 550        | Silva     | U25     | Silva       |
 | 580        | Devi      | U25     | Devi        |
 *------------+-----------+---------+-------------*/

Bloccare un'operazione di join interno senza intera sovrapposizione

Puoi bloccare un'operazione di join se non include una sovrapposizione con tutte le colonne obbligatorie.

Esempio:

Nell'esempio seguente, viene tentata un'operazione di join su una vista denominata ExamView e su una tabella denominata StudentTable, ma la query non riesce. L'errore si verifica perché la regola di analisi della sovrapposizione degli elenchi ExamView richiede l'unione in tutte le colonne presenti nel criterio di limitazione di join. Poiché la tabella denominata StudentTable non contiene queste colonne, non tutte le righe si sovrappongono e viene generato un errore.

-- Create a view that includes ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"join_restriction_policy": {"join_condition": "JOIN_ALL", "join_allowed_columns": ["test_score", "last_name"]}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- Query error: Joining must occur on all of the following columns
-- [test_score, last_name] on table mydataset.ExamView.
SELECT *
FROM mydataset.ExamView INNER JOIN mydataset.StudentTable USING (last_name);

Utilizza un criterio di limitazione di join con un altro criterio

Il criterio di limitazione di join può essere utilizzato con altri criteri nella soglia di aggregazione e nelle regole di analisi della privacy differenziale. Tuttavia, dopo aver utilizzato un criterio di limitazione di join con un altro criterio, non potrai modificarlo in seguito.

Esempio:

Nell'esempio seguente, un criterio di limitazione di join viene utilizzato in una regola di analisi della soglia di aggregazione:

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"aggregation_threshold_policy":{"threshold": 3, "privacy_unit_column": "last_name"}, "join_restriction_policy": {"join_condition": "JOIN_ANY", "join_allowed_columns": ["test_id", "test_score"]}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

Blocca un'operazione di join senza colonna obbligatoria

Puoi bloccare un'operazione di join se non include almeno una colonna obbligatoria. A tale scopo, includi le seguenti parti nella regola di analisi di sovrapposizione dell'elenco:

"join_restriction_policy": {
  "join_condition": "JOIN_ANY",
  "join_allowed_columns": ["column_name", ...]
}

Esempio:

Nella query seguente, la query è bloccata con un errore perché non contiene operazioni di join nella colonna test_score o test_id in ExamView e StudentTable:

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"aggregation_threshold_policy": {"threshold": 3, "privacy_unit_column": "last_name"}, "join_restriction_policy": {"join_condition": "JOIN_ANY", "join_allowed_columns": ["test_score", "test_id"]}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- Query error: Joining must occur on at least one of the following columns
-- [test_score, test_id] on table mydataset.ExamView.
SELECT *
FROM mydataset.ExamView INNER JOIN mydataset.StudentTable USING (last_name);

Per eseguire la query precedente, nella clausola USING sostituisci last_name con test_score.

Blocca una query senza operazione di join

Se la query deve avere un'operazione di join, puoi bloccarla se non è presente operazione di join utilizzando una delle seguenti regole di analisi della sovrapposizione degli elenchi:

"join_restriction_policy": {
  "join_condition": "JOIN_NOT_REQUIRED"
}
"join_restriction_policy": {
  "join_condition": "JOIN_NOT_REQUIRED",
  "join_allowed_columns": []
}

Esempio:

Nella query seguente, la query è bloccata perché non è presente un'operazione di join con ExamView nella query:

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"aggregation_threshold_policy": {"threshold": 3, "privacy_unit_column": "last_name"}, "join_restriction_policy": {"join_condition": "JOIN_NOT_REQUIRED"}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- Query error: At least one allowed column must be specified with
-- join_condition = 'JOIN_NOT_REQUIRED'.
SELECT *
FROM mydataset.ExamView;

Blocca una query senza operazione di join e senza colonna obbligatoria

Se la query deve contenere un'operazione di join e l'operazione di join deve avere almeno una colonna obbligatoria, includi le seguenti parti nella regola di analisi della sovrapposizione dell'elenco:

"join_restriction_policy": {
  "join_condition": "JOIN_NOT_REQUIRED",
  "join_allowed_columns": ["column_name", ...]
}

Esempio:

Nella query seguente, la query è bloccata perché l'operazione di join non include una colonna nell'array ExamView join_allowed_columns:

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"aggregation_threshold_policy": {"threshold": 3, "privacy_unit_column": "last_name"}, "join_restriction_policy": {"join_condition": "JOIN_NOT_REQUIRED", "join_allowed_columns": ["test_score"]}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- Query error: Join occurring on a restricted column.
SELECT *
FROM mydataset.ExamView INNER JOIN mydataset.StudentTable USING (last_name);

Per eseguire la query precedente, nella clausola USING sostituisci last_name con test_score.

Blocca tutte le operazioni di join

Puoi bloccare tutte le operazioni di join. A tale scopo, includi solo le seguenti parti nella regola di analisi della sovrapposizione dell'elenco:

"join_restriction_policy": {
  "join_condition": "JOIN_BLOCKED",
}

Esempio:

Nella query seguente, la query è bloccata perché è presente un'operazione di join con una vista denominata ExamView:

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"aggregation_threshold_policy": {"threshold": 3, "privacy_unit_column": "last_name"}, "join_restriction_policy": {"join_condition": "JOIN_BLOCKED"}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- Query error: Join occurring on a restricted column.
SELECT *
FROM mydataset.ExamView INNER JOIN mydataset.StudentTable USING (last_name);

Per eseguire la query precedente, rimuovi l'operazione INNER JOIN.

Blocca un'operazione di join interno senza tutte le colonne obbligatorie

Puoi bloccare un'operazione di inner join se non include tutte le colonne richieste. A tale scopo, includi le seguenti parti nella regola di analisi della sovrapposizione dell'elenco:

"join_restriction_policy": {
  "join_condition": "JOIN_ALL",
  "join_allowed_columns": ["column_name", ...]
}

Esempio:

Nella query seguente, la query è bloccata con un errore perché la query non include test_score nell'operazione di join con la vista denominata ExamView:

-- Create a view that includes a table called ExamTable.
CREATE OR REPLACE VIEW mydataset.ExamView
OPTIONS(
  privacy_policy= '{"aggregation_threshold_policy": {"threshold": 3, "privacy_unit_column": "last_name"}, "join_restriction_policy": {"join_condition": "JOIN_ALL", "join_allowed_columns": ["test_score", "last_name"]}}'
)
AS ( SELECT * FROM mydataset.ExamTable );

-- Query error: Joining must occur on all of the following columns
-- [test_score, last_name] on table mydataset.ExamView.
SELECT *
FROM mydataset.ExamView INNER JOIN mydataset.StudentTable USING (last_name);

Per eseguire la query precedente, sostituisci USING (last_name) con USING (last_name, test_score).

Tabelle di esempio

Alcuni esempi in questo documento fanno riferimento a due tabelle denominate ExamTable e StudentTable. ExamTable contiene un elenco dei punteggi dei test prodotti dagli studenti, mentre StudentTable contiene un elenco degli studenti e i relativi punteggi dei test.

Per testare gli esempi in questo documento, aggiungi prima le seguenti tabelle di esempio al tuo progetto:

-- Create a table called ExamTable.
CREATE OR REPLACE TABLE mydataset.ExamTable AS (
  SELECT "Hansen" AS last_name, "P91" AS test_id, 510 AS test_score UNION ALL
  SELECT "Wang", "U25", 500 UNION ALL
  SELECT "Wang", "C83", 520 UNION ALL
  SELECT "Wang", "U25", 460 UNION ALL
  SELECT "Hansen", "C83", 420 UNION ALL
  SELECT "Hansen", "C83", 560 UNION ALL
  SELECT "Devi", "U25", 580 UNION ALL
  SELECT "Devi", "P91", 480 UNION ALL
  SELECT "Ivanov", "U25", 490 UNION ALL
  SELECT "Ivanov", "P91", 540 UNION ALL
  SELECT "Silva", "U25", 550);

-- Create a table called StudentTable.
CREATE OR REPLACE TABLE mydataset.StudentTable AS (
  SELECT "Hansen" AS last_name, 510 AS test_score UNION ALL
  SELECT "Wang", 500 UNION ALL
  SELECT "Devi", 580 UNION ALL
  SELECT "Ivanov", 490 UNION ALL
  SELECT "Silva", 550);

Limitazioni

Le regole di analisi hanno le seguenti limitazioni:

  • Se hai già aggiunto una regola di analisi a una vista, non puoi passare tra le regole di analisi della soglia di aggregazione e le regole di analisi della privacy differenziale.

Una regola di analisi della soglia di aggregazione ha le seguenti limitazioni:

  • Puoi utilizzare solo le funzioni di aggregazione supportate in una query su una vista applicata dalla regola di analisi della soglia di aggregazione.
  • Non puoi aggiungere una regola di analisi della soglia di aggregazione a una vista materializzata.
  • Se utilizzi una vista applicata da una regola di analisi della soglia di aggregazione in una query sulla soglia di aggregazione, devono avere entrambe lo stesso valore per la colonna dell'unità privacy.
  • Se utilizzi una vista applicata dalla regola di analisi della soglia di aggregazione in una query sulla soglia di aggregazione, la soglia nella query deve essere maggiore o uguale alla soglia nella vista.
  • L'opzione Viaggio nel tempo è disabilitata in tutte le viste che hanno una regola di analisi della soglia di aggregazione.

Una regola di analisi della privacy differenziale ha le seguenti limitazioni:

  • Una volta esaurito il budget di privacy per una vista, quest'ultima non può essere utilizzata e devi crearne una nuova.

Una regola di analisi della sovrapposizione degli elenchi ha le seguenti limitazioni:

  • Se combini una regola di analisi della soglia di aggregazione o una regola di analisi della privacy differenziale con una regola di analisi della sovrapposizione degli elenchi e non inserisci privacy_unit_column come join_allowed_column nella regola di analisi della sovrapposizione degli elenchi, in determinate situazioni potresti non riuscire a unire nessuna colonna.

Prezzi