Table relationships

Lors de l'utilisation de la génération de données synthétiques par l'IA de Syntho, la meilleure utilité possible des données nécessitant le moins de ressources possible, il est préférable de prepare your data as a single entity table. Si vous devez générer des données pour plusieurs tables, Syntho propose trois options :

  1. [Synthesize individual tables with automatic key matching(synthesize-individual-tables-with-automatic-key-matching.md) :) Pour s'assurer que les ressources matérielles restent dans des limites raisonnables, Syntho synthétise par défaut chaque table séparément, et génère ensuite de nouvelles clés pour chaque table. Cette méthode ne maintient pas les relations inhérentes entre les tables (c'est-à-dire les relations entre les colonnes clés et non clés). Par exemple, un diagnostic de grossesse dans la table synthétique Diagnostics pourrait pointer vers un patient de sexe masculin dans la table synthétique Patients. Néanmoins, il respecte l'intégrité référentielle technique en générant de nouvelles clés, en veillant à ce que chaque clé étrangère corresponde à une clé primaire existante dans une autre table. Si vous devez préserver les relations entre tables, vous avez trois possibilités : convertir les informations pertinentes de la table Diagnostics et de la table Patients en a single entity table et ensuite synthétiser, synthétiser en utilisant Syntho's sequence model (jusqu'à 2 tables), ou appliquer [PII de-identification(de-identify-pii-columns.md) (nombre de tableaux illimité).

  2. Synthesize using sequence model : Si vous souhaitez préserver les relations entre 2 tables liées, où vous préservez également les relations entre les colonnes clés et non clés, vous pouvez utiliser le modèle de séquence des données synthétiques de Syntho. Cette fonctionnalité de Syntho est particulièrement utile si vous souhaitez synthétiser des données séquentielles (par exemple, des séries temporelles ou des trajectoires).

  3. [PII de-identification] (de-identify-pii-columns.md) : Outre la synthèse, la plate-forme Syntho peut être utilisée pour de-identify your PII columns avec l'aide du Syntho PII scanner et Syntho mockers et laisser toutes les autres colonnes intactes. Cette approche présente l'avantage de préserver les relations entre les tables et est plus populaire pour les cas d'utilisation liés aux tests et au développement.

Vous trouverez ci-dessous un résumé des approches clés proposées par Syntho pour préserver les relations entre les tables.

Voici les articles de cette section :

ApprocheRelations entre tablesIntégrité référentielleÉchantillonnage partielPréservation des informations de séquenceLimite de table

Synthétiser des tableaux individuels avec correspondance automatique des clés

Unlimited (sans préserver les relations entre tableaux)

false

true

false

true

Illimité

Synthétiser à l'aide d'un modèle de séquence modèle de séquence

2

PII de-identification

Unlimited

Unlimited

Synthétiser les tables avec la correspondance automatique des clés (option par défaut)Synthétiser les relations de table avec le classement entité-table (fonctionnalité bêta)

Last updated