Table relationships

Bij het gebruik van Syntho's AI-aangedreven synthetische data generatie, de best mogelijke data utility met de minste hoeveelheid middelen, is het best practice om prepare your data as a single entity table. Als je echter gegevens voor meerdere tabellen moet genereren, biedt Syntho drie opties:

  1. [Synthesize individual tables with automatic key matching] (synthesize-individual-tables-with-automatic-key-matching.md): Om ervoor te zorgen dat de hardwarebronnen binnen redelijke grenzen blijven, synthetiseert Syntho standaard elke tabel afzonderlijk van een andere en genereert daarna nieuwe sleutels voor elke tabel. Deze methode onderhoudt geen inherente relaties tussen tabellen (d.w.z. relaties tussen kolommen met en zonder sleutel). Een zwangerschapsdiagnose in de synthetische tabel Diagnosis zou bijvoorbeeld kunnen verwijzen naar een mannelijke patiënt in de synthetische tabel Patients. Desondanks handhaaft het de technische referentiële integriteit door nieuwe sleutels te genereren en ervoor te zorgen dat elke foreign key overeenkomt met een bestaande primaire sleutel in een andere tabel. Als je relaties tussen tabellen moet behouden, heb je drie opties: converteer de relevante informatie uit de tabel Diagnose en de tabel Patiënten naar a single entity table en dan synthetize, synthetize met Syntho's sequence model (maximaal 2 tabellen), of pas [PII de-identification] (de-identify-pii-columns.md) (onbeperkte tabellen).

  2. Synthesize using sequence model: Als je tabeloverstijgende relaties tussen 2 gerelateerde tabellen wilt behouden, waarbij je ook relaties tussen sleutelkolommen en niet-sleutelkolommen wilt behouden, kun je Syntho's synthetische gegevens sequentiemodel gebruiken. Deze Syntho-functie is vooral waardevol als je sequentiegegevens wilt synthetiseren (bijv. tijdreeksen of trajecten).

  3. [PII de-identification] (de-identify-pii-columns.md): Behalve voor syntheses kan het Syntho-platform ook worden gebruikt om de-identify your PII columns met behulp van de Syntho PII scanner en Syntho mockers en laat alle overige kolommen intact. Deze aanpak heeft het voordeel dat relaties tussen tabellen behouden blijven en is het populairst voor gebruikssituaties die te maken hebben met testen en ontwikkeling.

Zie hieronder een samenvatting van de belangrijkste benaderingen die Syntho biedt om tabelrelaties te behouden.

Aanpak
Tabeloverschrijdende relaties
Referentiële integriteit
Upsampling
Reekseninformatie behouden
Tabellimiet

Synthetiseer afzonderlijke tabellen met automatische sleutelherkenning

Unlimited (zonder behoud van kruislingse-tabelrelaties)

Synthetiseren met behulp van sequentie model

2

PII de-identificatie

Unlimited

Dit zijn de artikelen in deze sectie:

Verifieer vreemde sleutels

Syntheseer tabellen met automatische sleutelmapping (standaardoptie)

Syntheseer tabelrelaties met entiteit-tabel rangschikking (bètafunctie)

Last updated