Présentation des schémas

Cette page décrit les exigences des schémas Spanner, et explique comment utiliser le schéma pour créer des relations hiérarchiques, ainsi que les fonctionnalités des schémas. Elle introduit également des tables entrelacées, qui peuvent améliorer les performances des requêtes lors de l'interrogation de tables dans une relation parent-enfant.

Un schéma est un espace de noms qui contient des objets de base de données, tels que des tables, des vues, des index et des fonctions. Vous pouvez utiliser des schémas pour organiser les objets, appliquer des privilèges précis de contrôle des accès et éviter les conflits au niveau des noms. Vous devez définir un schéma pour chaque base de données dans Spanner.

Données fortement typées

Dans Spanner, les données sont fortement typées. Les types de données incluent les types scalaires et complexes, qui sont décrits dans les sections Types de données dans GoogleSQL et Types de données PostgreSQL.

Choisissez une clé primaire.

Les bases de données Spanner peuvent contenir une ou plusieurs tables. Les tableaux sont structurés sous forme de lignes et de colonnes. Le schéma de la table définit une ou plusieurs colonnes de table comme clé primaire de la table, ce qui identifie chaque ligne de manière unique. Les clés primaires sont toujours indexées pour une recherche rapide des lignes. Si vous souhaitez mettre à jour ou supprimer des lignes existantes d'une table, celle-ci doit disposer d'une clé primaire. Une table sans colonne de clé primaire ne peut comporter qu'une seule ligne. Seules les bases de données utilisant le dialecte GoogleSQL peuvent comporter des tables sans clé primaire.

Votre application dispose souvent déjà d'un champ qui peut parfaitement servir de clé primaire. Par exemple, pour une table Customers, un élément CustomerId fourni par l'application peut servir de clé primaire. Dans d'autres cas, vous devrez peut-être générer une clé primaire lors de l'insertion de la ligne. Il s'agit généralement d'une valeur entière unique sans signification métier (clé primaire de substitution).

Dans tous les cas, lors du choix de votre clé primaire, veillez à ne pas créer de hotspots. Par exemple, si vous insérez des données dont la clé est un nombre entier augmentant de manière monotone, les insertions se feront toujours à la fin de l'espace clé. Ce n'est pas souhaitable, car Spanner répartit les données entre les serveurs par plages de clés, ce qui signifie que les insertions seront dirigées vers un seul serveur, créant ainsi un hotspot. Il existe des techniques pouvant répartir la charge sur plusieurs serveurs et éviter la création de hotspots. Les voici :

  • Hacher la clé et la stocker dans une colonne. Utilisez la colonne de hachage (ou la colonne de hachage et les colonnes de clé unique ensemble) comme clé primaire.
  • Échanger l'ordre des colonnes dans la clé primaire.
  • Utilisez un identifiant unique universel (UUID). La version 4 d'UUID est recommandée, car elle utilise des valeurs aléatoires dans les bits de poids fort. N'utilisez pas d'algorithme UUID (tel que l'UUID version 1) qui stocke l'horodatage dans les bits de poids fort.
  • Utiliser des valeurs séquentielles de bits inversés.

Relations de table parents-enfants

Il existe deux façons de définir des relations parent-enfant dans Spanner : l'entrelacement de tables et les clés étrangères.

L'entrelacement de tables de Spanner constitue un bon choix pour de nombreuses relations parent-enfant. Avec l'entrelacement, Spanner rapproche physiquement les lignes enfants et les lignes parentes de l'espace de stockage. La colocation peut considérablement améliorer les performances. Par exemple, si vous avez une table Customers et une table Invoices, et que votre application récupère fréquemment toutes les factures d'un client, vous pouvez définir Invoices comme table enfant entrelacée de Customers. Ce faisant, vous déclarez une relation de localité des données entre deux tables indépendantes. Vous demandez à Spanner de stocker une ou plusieurs lignes de Invoices avec une ligne Customers.

Pour associer une table enfant à une table parente, utilisez le LDD qui déclare la table enfant comme étant entrelacée dans la table parente et incluez la clé primaire de la table parente comme première partie de la clé primaire composite de la table enfant. Pour en savoir plus sur l'entrelacement, consultez la section Créer des tables entrelacées plus loin sur cette page.

Les clés étrangères constituent une solution parent-enfant plus générale et répondent à des cas d'utilisation supplémentaires. Elles ne sont pas limitées aux colonnes de clé primaire, et les tables peuvent posséder plusieurs relations de clés étrangères en faisant office de tables parentes dans certaines relations et de tables enfants dans d'autres. Toutefois, une relation de clé étrangère n'implique pas la colocation des tables dans la couche de stockage.

Google vous recommande de représenter les relations parents-enfants soit comme des tables entrelacées, soit comme des clés étrangères, mais pas les deux. Pour en savoir plus sur les clés étrangères et leur comparaison avec les tables entrelacées, consultez la section Présentation des clés étrangères.

Clés primaires dans les tables entrelacées

Pour l'entrelacement, chaque table doit avoir une clé primaire. Si vous déclarez qu'une table est l'enfant entrelacé d'une autre, elle doit comporter une clé primaire composite qui inclut tous les composants de la clé primaire du parent, dans le même ordre, et, généralement, une ou plusieurs colonnes de table enfants supplémentaires.

Spanner stocke les lignes dans l'ordre de tri par valeurs de clé primaire, avec des lignes enfants insérées entre les lignes parentes. Pour voir une illustration des lignes entrelacées, consultez la section Créer des tables entrelacées plus loin sur cette page.

En résumé, Spanner peut cohéberger physiquement des lignes de tables associées. Les exemples de schéma montrent à quoi ressemble cette disposition physique.

Divisions de base de données

Vous pouvez définir des hiérarchies de relations parent-enfant entrelacées comportant jusqu'à sept couches, ce qui signifie que vous pouvez colocaliser les lignes de sept tables indépendantes. Si la taille des données contenues dans vos tables est petite, votre base de données ne peut être gérée qu'avec un seul serveur Spanner. Mais que se passe-t-il lorsque vos tables associées augmentent et commencent à atteindre les limites de ressources d'un serveur individuel ? Spanner est une base de données distribuée, ce qui signifie qu'à mesure que votre base de données s'agrandit, Spanner divise vos données en fragments appelés "divisions". Les divisions sont indépendantes les unes des autres et peuvent être affectées à différents serveurs pouvant être situés dans différents emplacements physiques. Un fractionnement contient une plage de lignes contiguës. Les clés de début et de fin de cette plage sont appelées "limites de division". Spanner ajoute et supprime automatiquement les limites de division en fonction de la taille et de la charge, ce qui modifie le nombre de divisions dans la base de données.

Répartition basée sur la charge

Pour illustrer la façon dont Spanner effectue une répartition basée sur la charge pour atténuer les points d'accès de lecture, supposons que votre base de données contient une table avec 10 lignes lues plus fréquemment que toutes les autres lignes de la table. Spanner peut ajouter des limites de division entre chacune de ces 10 lignes afin qu'elles soient chacune gérées par un serveur différent, au lieu d'autoriser toutes les lectures de ces lignes à consommer les ressources d'un seul serveur.

En règle générale, si vous suivez les bonnes pratiques pour la conception de schéma, Spanner peut limiter les hotspots de sorte que le débit en lecture s'améliore toutes les deux ou trois minutes jusqu'à ce que les ressources de votre instance soient saturées ou qu'aucune nouvelle limite de division ne puisse être ajoutée (car votre division ne couvre qu'une seule ligne sans enfants entrelacés).

Schémas nommés

Les schémas nommés vous aident à organiser des données similaires. Cela vous permet de trouver rapidement des objets dans la console Google Cloud, d'appliquer des droits et d'éviter les conflits au niveau des noms.

Les schémas nommés, comme les autres objets de base de données, sont gérés à l'aide du LDD.

Les schémas nommés Spanner vous permettent d'utiliser des noms complets pour rechercher des données. Les noms de domaine complets vous permettent de combiner le nom du schéma et le nom de l'objet pour identifier les objets de base de données. Par exemple, vous pouvez créer un schéma appelé warehouse pour l'unité commerciale "entrepôt". Les tables qui utilisent ce schéma peuvent inclure: product, order et customer information. Vous pouvez également créer un schéma appelé fulfillment pour l'unité commerciale de traitement. Ce schéma peut également comporter des tables appelées product, order et customer information. Dans le premier exemple, le nom de domaine complet est warehouse.product. Dans le deuxième exemple, il est fulfillment.product. Cela évite toute confusion dans les cas où plusieurs objets portent le même nom.

Dans le LDD CREATE SCHEMA, les objets de table reçoivent à la fois un nom de domaine complet (par exemple, sales.customers) et un nom court (par exemple, sales).

Les objets de base de données suivants sont compatibles avec les schémas nommés:

  • TABLE
    • CREATE
    • INTERLEAVE IN [PARENT]
    • FOREIGN KEY
    • SYNONYM
  • VIEW
  • INDEX
  • FOREIGN KEY
  • SEQUENCE

Pour en savoir plus sur l'utilisation des schémas nommés, consultez la page Gérer des schémas nommés.

Utiliser un contrôle des accès ultraprécis avec des schémas nommés

Les schémas nommés vous permettent d'accorder un accès au niveau du schéma à chaque objet du schéma. Cela s'applique aux objets de schéma qui existent au moment où vous accordez l'accès. Vous devez accorder l'accès aux objets qui seront ajoutés ultérieurement.

Un contrôle des accès ultraprécis limite l'accès à des groupes entiers d'objets de base de données, tels que les tables, les colonnes et les lignes de la table.

Pour en savoir plus, consultez la section Accorder des droits de contrôle des accès précis aux schémas nommés.

Exemples de schéma

Les exemples de schéma de cette section montrent comment créer des tables parents et enfants avec et sans entrelacement, et illustrent les dispositions physiques correspondantes des données.

Créer une table parente

Supposons que vous créiez une application musicale et que vous ayez besoin d'une table qui stocke des lignes de données d'artistes:

Table "Singers" (Chanteurs) avec cinq lignes et quatre colonnes

Notez que la table contient une colonne de clé primaire, SingerId, qui apparaît à gauche de la ligne en gras, et que les tables sont organisées par lignes et par colonnes.

Vous pouvez définir la table avec le LDD suivant:

GoogleSQL

CREATE TABLE Singers (
SingerId   INT64 NOT NULL,
FirstName  STRING(1024),
LastName   STRING(1024),
SingerInfo BYTES(MAX),
) PRIMARY KEY (SingerId);

PostgreSQL

CREATE TABLE singers (
singer_id   BIGINT PRIMARY KEY,
first_name  VARCHAR(1024),
last_name   VARCHAR(1024),
singer_info BYTEA
);

Veuillez noter ce qui suit à propos de l'exemple de schéma :

  • Singers est une table située à la racine de la hiérarchie de la base de données (car elle n'est pas définie en tant qu'enfant entrelacé d'une autre table).
  • Pour les bases de données utilisant le dialecte GoogleSQL, les colonnes de clé primaire sont généralement annotées avec NOT NULL (mais vous pouvez omettre cette annotation si vous souhaitez autoriser les valeurs NULL dans les colonnes de clé. Pour en savoir plus, consultez la section Colonnes clés.
  • Les colonnes qui ne sont pas incluses dans la clé primaire sont appelées colonnes "non clés" et peuvent comporter l'annotation facultative NOT NULL.
  • Les colonnes qui utilisent le type STRING ou BYTES dans GoogleSQL doivent avoir une longueur définie, qui représente le nombre maximal de caractères Unicode pouvant être stockés dans le champ. La spécification de longueur est facultative pour les types PostgreSQL varchar et character varying. Pour en savoir plus, consultez les pages Types de données scalaires pour les bases de données de dialecte GoogleSQL et Types de données PostgreSQL pour les bases de données de dialecte PostgreSQL.

À quoi ressemble la disposition physique des lignes dans la table Singers ? Le schéma suivant montre les lignes de la table Singers stockées par clé primaire ("Singers(1)", puis "Singers(2)", où le nombre entre parenthèses correspond à la valeur de clé primaire).

Exemple de lignes d'une table stockée dans l'ordre des clés primaires

Le schéma précédent illustre un exemple de limite de division entre les lignes correspondant aux champs Singers(3) et Singers(4), les données des divisions obtenues étant attribuées à différents serveurs. À mesure que cette table s'agrandit, il est possible que des lignes de données Singers soient stockées à différents emplacements.

Créer des tables parents et enfants

Supposons que vous souhaitiez maintenant ajouter des données de base sur les albums de chaque chanteur à l'application musicale.

Table des albums avec cinq lignes et trois colonnes

Notez que la clé primaire de la table Albums est composée de deux colonnes : SingerId et AlbumId, pour associer chaque album à son chanteur. L'exemple de schéma suivant définit les tables Albums et Singers à la racine de la hiérarchie de la base de données, ce qui en fait des tables sœurs.

-- Schema hierarchy:
-- + Singers (sibling table of Albums)
-- + Albums (sibling table of Singers)

GoogleSQL

CREATE TABLE Singers (
 SingerId   INT64 NOT NULL,
 FirstName  STRING(1024),
 LastName   STRING(1024),
 SingerInfo BYTES(MAX),
) PRIMARY KEY (SingerId);

CREATE TABLE Albums (
SingerId     INT64 NOT NULL,
AlbumId      INT64 NOT NULL,
AlbumTitle   STRING(MAX),
) PRIMARY KEY (SingerId, AlbumId);

PostgreSQL

CREATE TABLE singers (
singer_id   BIGINT PRIMARY KEY,
first_name  VARCHAR(1024),
last_name   VARCHAR(1024),
singer_info BYTEA
);

CREATE TABLE albums (
singer_id     BIGINT,
album_id      BIGINT,
album_title   VARCHAR,
PRIMARY KEY (singer_id, album_id)
);

La disposition physique des lignes de Singers et Albums ressemble au schéma suivant, avec les lignes de la table Albums stockées par clé primaire contiguë, puis les lignes de Singers stockées par une clé primaire contiguë:

Disposition physique des lignes

Remarque importante concernant le schéma : Spanner ne suppose aucune relation de localité des données entre les tables Singers et Albums, car il s'agit de tables de niveau supérieur. À mesure que la base de données s'agrandit, Spanner peut ajouter des limites de division entre les lignes. Cela signifie que les lignes de la table Albums peuvent se retrouver dans une division différente de celles de la table Singers et que les deux divisions peuvent se déplacer indépendamment l'une de l'autre.

En fonction des besoins de votre application, il peut s'avérer judicieux de permettre aux données de la table Albums d'être placées dans des divisions différentes de celles où se trouvent les données de la table Singers. Toutefois, cela peut entraîner une perte de performances en raison de la nécessité de coordonner les lectures et les mises à jour entre des ressources distinctes. Si votre application doit fréquemment récupérer des informations sur tous les albums d'un chanteur particulier, vous devez créer Albums en tant que table enfant entrelacée de Singers, qui rapproche les lignes des deux tables en fonction de la dimension de clé primaire. L'exemple suivant explique ce point plus en détail.

Créer des tables entrelacées

Une table entrelacée est une table que vous déclarez comme enfant entrelacée d'une autre table, car vous souhaitez que les lignes de la table enfant soient physiquement stockées avec la ligne parente associée. Comme indiqué précédemment, la clé primaire de la table parente doit être la première partie de la clé primaire composite de la table enfant.

Lors de la conception de votre application musicale, supposons que vous vous rendiez compte que l'application doit accéder fréquemment aux lignes de la table Albums lorsqu'elle accède à une ligne Singers. Par exemple, lorsque vous accédez à la ligne Singers(1), vous devez également accéder aux lignes Albums(1, 1) et Albums(1, 2). Dans ce cas, Singers et Albums doivent avoir une forte relation de localité des données. Vous pouvez déclarer cette relation de localité des données en créant Albums en tant que table enfant entrelacée de Singers.

-- Schema hierarchy:
-- + Singers
--   + Albums (interleaved table, child table of Singers)

La ligne en gras dans le schéma suivant montre comment créer Albums en tant que table entrelacée de Singers.

GoogleSQL

CREATE TABLE Singers (
 SingerId   INT64 NOT NULL,
 FirstName  STRING(1024),
 LastName   STRING(1024),
 SingerInfo BYTES(MAX),
 ) PRIMARY KEY (SingerId);

CREATE TABLE Albums (
 SingerId     INT64 NOT NULL,
 AlbumId      INT64 NOT NULL,
 AlbumTitle   STRING(MAX),
 ) PRIMARY KEY (SingerId, AlbumId),
INTERLEAVE IN PARENT Singers ON DELETE CASCADE;

PostgreSQL

CREATE TABLE singers (
 singer_id   BIGINT PRIMARY KEY,
 first_name  VARCHAR(1024),
 last_name   VARCHAR(1024),
 singer_info BYTEA
 );

CREATE TABLE albums (
 singer_id     BIGINT,
 album_id      BIGINT,
 album_title   VARCHAR,
 PRIMARY KEY (singer_id, album_id)
 )
 INTERLEAVE IN PARENT singers ON DELETE CASCADE;

Remarques sur ce schéma :

  • SingerId, qui est la première partie de la clé primaire de la table enfant Albums, est également la clé primaire de sa table parente Singers.
  • L'annotation ON DELETE CASCADE signifie que lorsqu'une ligne de la table parente est supprimée, ses lignes enfants sont automatiquement supprimées également. Si une table enfant ne comporte pas cette annotation ou si l'annotation est ON DELETE NO ACTION, vous devez supprimer les lignes enfants avant de pouvoir supprimer la ligne parente.
  • Les lignes entrelacées sont d'abord classées par lignes de la table parente, puis par lignes contiguës de la table enfant qui partagent la clé primaire du parent. Par exemple, "Singers(1)", "Albums(1, 1)", puis "Albums(1, 2)".
  • La relation de localité des données de chaque chanteur et les données de leur album est conservée si cette base de données est divisée, à condition que la taille d'une ligne Singers et de toutes ses lignes Albums reste inférieure à la limite de taille de fractionnement et qu'aucune de ces lignes Albums ne comporte de zone cliquable.
  • La ligne parent doit exister pour que vous puissiez insérer des lignes enfants. La ligne parente peut déjà exister dans la base de données ou être insérée avant l'insertion des lignes enfants dans la même transaction.

Les lignes de la table "Albums" sont entrelacées entre les lignes de la table "Singers" (Chanteurs)

Créer une hiérarchie de tables entrelacées

La relation parent-enfant entre les tables Singers et Albums peut être étendue à davantage de tables descendantes. Par exemple, vous pouvez créer une table entrelacée appelée Songs en tant qu'enfant de la table Albums pour stocker la liste des pistes de chaque album.

Table des chansons avec six lignes et quatre colonnes

Songs doit avoir une clé primaire qui inclut toutes les clés primaires des tables situées à un niveau supérieur dans la hiérarchie, c'est-à-dire SingerId et AlbumId.

-- Schema hierarchy:
-- + Singers
--   + Albums (interleaved table, child table of Singers)
--     + Songs (interleaved table, child table of Albums)

GoogleSQL

CREATE TABLE Singers (
 SingerId   INT64 NOT NULL,
 FirstName  STRING(1024),
 LastName   STRING(1024),
 SingerInfo BYTES(MAX),
) PRIMARY KEY (SingerId);

CREATE TABLE Albums (
 SingerId     INT64 NOT NULL,
 AlbumId      INT64 NOT NULL,
 AlbumTitle   STRING(MAX),
) PRIMARY KEY (SingerId, AlbumId),
 INTERLEAVE IN PARENT Singers ON DELETE CASCADE;

CREATE TABLE Songs (
 SingerId     INT64 NOT NULL,
 AlbumId      INT64 NOT NULL,
 TrackId      INT64 NOT NULL,
 SongName     STRING(MAX),
) PRIMARY KEY (SingerId, AlbumId, TrackId),
 INTERLEAVE IN PARENT Albums ON DELETE CASCADE;

PostgreSQL

CREATE TABLE singers (
 singer_id   BIGINT PRIMARY KEY,
 first_name  VARCHAR(1024),
 last_name   VARCHAR(1024),
 singer_info BYTEA
 );

CREATE TABLE albums (
 singer_id     BIGINT,
 album_id      BIGINT,
 album_title   VARCHAR,
 PRIMARY KEY (singer_id, album_id)
 )
 INTERLEAVE IN PARENT singers ON DELETE CASCADE;

CREATE TABLE songs (
 singer_id     BIGINT,
 album_id      BIGINT,
 track_id      BIGINT,
 song_name     VARCHAR,
 PRIMARY KEY (singer_id, album_id, track_id)
 )
 INTERLEAVE IN PARENT albums ON DELETE CASCADE;

Le schéma suivant représente une vue physique des lignes entrelacées.

Les chansons sont entrelacées dans la section "Albums", qui le sont entre les tables de la table "Singers" (Chanteurs).

Dans cet exemple, à mesure que le nombre d'artistes augmente, Spanner ajoute des limites de division entre les chanteurs afin de préserver la localité des données entre un chanteur et les données de ses albums et de ses chansons. Toutefois, si la taille d'une ligne "Singer" et de ses lignes enfants dépasse la limite de taille de fractionnement, ou si une zone cliquable est détectée dans les lignes enfants, Spanner tente d'ajouter des limites de fractionnement pour isoler cette ligne et toutes les lignes enfants situées en dessous.

En résumé, une table parent, et toutes ses tables enfants et descendantes, forment une hiérarchie de tables dans le schéma. Bien que chaque table de la hiérarchie soit logiquement indépendante, les entrelacer physiquement de cette manière peut améliorer les performances. En effet, les tables sont préjointes et vous pouvez accéder aux lignes associées tout en minimisant les accès au stockage.

Jointures avec des tables entrelacées

Si possible, joignez des données dans des tables entrelacées par clé primaire. Étant donné que chaque ligne entrelacée est généralement stockée physiquement dans la même division que sa ligne parente, Spanner peut effectuer des jointures par clé primaire localement, ce qui réduit l'accès au stockage et le trafic réseau. Dans l'exemple suivant, Singers et Albums sont joints sur la clé primaire SingerId.

GoogleSQL

SELECT s.FirstName, a.AlbumTitle
FROM Singers AS s JOIN Albums AS a ON s.SingerId = a.SingerId;

PostgreSQL

SELECT s.first_name, a.album_title
FROM singers AS s JOIN albums AS a ON s.singer_id = a.singer_id;

Colonnes de clé

Cette section inclut quelques remarques sur les colonnes clés.

Modifier les clés d'une table

Les clés d'une table ne peuvent pas changer ; vous ne pouvez ni ajouter, ni supprimer une colonne de clé dans une table existante.

Stocker des valeurs NULL dans une clé primaire

Dans GoogleSQL, si vous souhaitez stocker la valeur NULL dans une colonne de clé primaire, omettez la clause NOT NULL pour cette colonne dans le schéma. (Les bases de données de dialecte PostgreSQL ne prennent pas en charge les valeurs NULL dans une colonne de clé primaire.)

Voici un exemple d'omission de la clause NOT NULL dans la colonne de clé primaire SingerId. Notez que comme SingerId est la clé primaire, une seule ligne peut stocker NULL dans cette colonne.

CREATE TABLE Singers (
  SingerId   INT64,
  FirstName  STRING(1024),
  LastName   STRING(1024),
) PRIMARY KEY (SingerId);

La propriété pouvant accepter la valeur Null de la colonne de clé primaire doit correspondre aux déclarations des tables parents et enfants. Dans cet exemple, NOT NULL n'est pas autorisé pour la colonne Albums.SingerId, car Singers.SingerId l'omet.

CREATE TABLE Singers (
  SingerId   INT64,
  FirstName  STRING(1024),
  LastName   STRING(1024),
) PRIMARY KEY (SingerId);

CREATE TABLE Albums (
  SingerId     INT64 NOT NULL,
  AlbumId      INT64 NOT NULL,
  AlbumTitle   STRING(MAX),
) PRIMARY KEY (SingerId, AlbumId),
  INTERLEAVE IN PARENT Singers ON DELETE CASCADE;

Types non autorisés

Les colonnes suivantes ne peuvent pas être de type ARRAY:

  • Les colonnes de clé d'une table
  • Les colonnes de clé d'un index

Concevoir pour l'architecture mutualisée

Vous pouvez mettre en œuvre l'architecture mutualisée si vous stockez des données appartenant à différents clients. Par exemple, un service de musique peut vouloir stocker le contenu de chaque maison de disques séparément.

Architecture mutualisée classique

La méthode classique de conception d'une architecture mutualisée consiste à créer une base de données distincte pour chaque client. Dans cet exemple, chaque base de données possède sa propre table Singers :

Base de données 1: Ackworth Records
SingerId FirstName LastName
1MarcRichards
2CatalinaSmith
Base de données 2: Cama Records
SingerId FirstName LastName
1AliceTrentor
2GabrielWright
Base de données 3: Eagan Records
SingerId FirstName LastName
1BenjaminMartinez
2HannahHarris

Architecture mutualisée gérée par schéma

Une autre façon de concevoir une architecture mutualisée dans Spanner consiste à regrouper tous les clients dans une seule table dans une seule base de données et à utiliser une valeur de clé primaire différente pour chaque client. Par exemple, vous pouvez inclure une colonne de clé CustomerId dans vos tables. Si vous faites de CustomerId la première colonne de clé, les données de chaque client ont une bonne localité. Spanner peut ensuite utiliser efficacement les divisions de base de données pour optimiser les performances en fonction de la taille des données et des modèles de charge. Dans l'exemple suivant, il existe une seule table Singers pour tous les clients:

Base de données d'architecture mutualisée Spanner
CustomerId SingerId FirstName LastName
11MarcRichards
12CatalinaSmith
21AliceTrentor
22GabrielWright
31BenjaminMartinez
32HannahHarris

Si vous devez avoir des bases de données distinctes pour chaque locataire, vous devez prendre en compte les contraintes suivantes:

  • Le nombre de bases de données par instance, ainsi que le nombre de tables et d'index par base de données sont limités. Selon le nombre de clients, il n'est peut-être pas possible d'avoir des bases de données ou des tables distinctes.
  • L'ajout de nouvelles tables et d'index non entrelacés peut prendre beaucoup de temps. Vous ne pourrez peut-être pas obtenir les performances souhaitées si la conception de votre schéma dépend de l'ajout de nouvelles tables et de nouveaux index.

Si vous souhaitez créer des bases de données séparées, il sera peut-être plus efficace de répartir vos tables sur plusieurs bases de données de sorte que chaque base de données subisse peu de modifications de schéma par semaine.

Si vous créez des tables et des index distincts pour chaque client de votre application, ne placez pas tous les tableaux et index dans la même base de données. Répartissez-les plutôt sur de nombreuses bases de données afin de limiter les problèmes de performances liés à la création d'un grand nombre d'index.

Pour en savoir plus sur les autres modèles de gestion des données et sur la conception d'applications pour l'architecture mutualisée, consultez la page Implémenter l'architecture mutualisée dans Spanner.