LogoLogo
Go to Syntho.AI
Dutch (AI Translated)
Dutch (AI Translated)
  • Welcome to Syntho
  • Overzicht
    • About Syntho
    • Get started
      • Introduction to data generation methods
      • Use Case: AI-generated synthetic data
      • Use Case: AI-generated synthetic time series data
      • Use Case: Database de-identification
    • Frequently asked questions
  • Werkruimten instellen
    • View workspaces
    • Create a workspace
      • Connect to a database
        • PostgreSQL
        • MySQL / MariaDB
        • Oracle
        • Microsoft SQL Server
        • DB2
        • Databricks
        • Hive
        • SAP Sybase
        • Azure Data Lake Storage (ADLS)
        • Amazon Simple Storage Service (S3)
    • Edit a workspace
    • Delete a workspace
    • Share a workspace
    • Transfer workspace ownership
  • Een gegevensgeneratietaak configureren
    • Configure table settings
    • Configure column settings
      • AI-powered generation
        • Sequence model
          • Prepare your sequence data
      • Mockers
        • Consistent mapping
        • Supported languages
      • Duplicate
      • Exclude
      • Hashing
      • Calculated columns
      • Primary Key / Foreign Key
    • Manage personally identifiable information (PII)
      • Discover and de-identify PII columns
        • Identify PII columns manually
        • Automatic PII discovery with PII scanner
      • Remove columns from PII list
      • Automatic PII discovery and de-identification in free text columns
      • Supported PII & PHI entities
    • Manage foreign keys
      • Foreign key inheritance
      • Add virtual foreign keys
        • Add virtual foreign keys
        • Use foreign key scanner
        • Import foreign keys via JSON
        • Export foreign keys via JSON
      • Delete foreign keys
      • Circular foreign key references
    • Validate and Synchronize workspace
    • View and adjust generation settings
    • Table relationships
      • Verify foreign keys
      • Synthesize individual tables with automatic key matching
      • De-identify PII columns
  • Syntho implementeren
    • Introduction
      • Syntho architecture
      • Requirements
        • Requirements for Docker deployments
        • Requirements for Kubernetes deployments
      • Access Docker images
        • Using internet
        • Without internet
    • Deploy Syntho using Docker
      • Preparations
      • Deploy using Docker Compose
      • Run the application
      • Manually saving logs
    • Deploy Syntho using Kubernetes
      • Preparations
      • Deploy Ray using Helm
        • Troubleshooting
      • Deploy Syntho using Helm
      • Validate the deployment
      • Troubleshooting
      • Upgrading the applications
    • Manage users and access
      • Single Sign-On (SSO) in Azure
      • Manage admin users
      • Manage non-admin users
    • Logs and monitoring
  • Subsetting
    • What is subsetting
    • Verify foreign keys
    • Configure subsetting
  • Syntho API
    • Syntho REST API
Powered by GitBook
On this page

Was this helpful?

  1. Een gegevensgeneratietaak configureren

Table relationships

PreviousView and adjust generation settingsNextVerify foreign keys

Last updated 10 months ago

Was this helpful?

Bij het gebruik van Syntho's AI-aangedreven synthetische data generatie, de best mogelijke data utility met de minste hoeveelheid middelen, is het best practice om prepare your data as a single entity table. Als je echter gegevens voor meerdere tabellen moet genereren, biedt Syntho drie opties:

  1. [Synthesize individual tables with automatic key matching] (synthesize-individual-tables-with-automatic-key-matching.md): Om ervoor te zorgen dat de hardwarebronnen binnen redelijke grenzen blijven, synthetiseert Syntho standaard elke tabel afzonderlijk van een andere en genereert daarna nieuwe sleutels voor elke tabel. Deze methode onderhoudt geen inherente relaties tussen tabellen (d.w.z. relaties tussen kolommen met en zonder sleutel). Een zwangerschapsdiagnose in de synthetische tabel Diagnosis zou bijvoorbeeld kunnen verwijzen naar een mannelijke patiënt in de synthetische tabel Patients. Desondanks handhaaft het de technische referentiële integriteit door nieuwe sleutels te genereren en ervoor te zorgen dat elke foreign key overeenkomt met een bestaande primaire sleutel in een andere tabel. Als je relaties tussen tabellen moet behouden, heb je drie opties: converteer de relevante informatie uit de tabel Diagnose en de tabel Patiënten naar a single entity table en dan synthetize, synthetize met Syntho's sequence model (maximaal 2 tabellen), of pas [PII de-identification] (de-identify-pii-columns.md) (onbeperkte tabellen).

  2. Synthesize using sequence model: Als je tabeloverstijgende relaties tussen 2 gerelateerde tabellen wilt behouden, waarbij je ook relaties tussen sleutelkolommen en niet-sleutelkolommen wilt behouden, kun je Syntho's synthetische gegevens sequentiemodel gebruiken. Deze Syntho-functie is vooral waardevol als je sequentiegegevens wilt synthetiseren (bijv. tijdreeksen of trajecten).

  3. [PII de-identification] (de-identify-pii-columns.md): Behalve voor syntheses kan het Syntho-platform ook worden gebruikt om de-identify your PII columns met behulp van de Syntho PII scanner en Syntho mockers en laat alle overige kolommen intact. Deze aanpak heeft het voordeel dat relaties tussen tabellen behouden blijven en is het populairst voor gebruikssituaties die te maken hebben met testen en ontwikkeling.

Zie hieronder een samenvatting van de belangrijkste benaderingen die Syntho biedt om tabelrelaties te behouden.

Aanpak
Tabeloverschrijdende relaties
Referentiële integriteit
Upsampling
Reekseninformatie behouden
Tabellimiet

Synthetiseer afzonderlijke tabellen met automatische sleutelherkenning

Unlimited (zonder behoud van kruislingse-tabelrelaties)

Synthetiseren met behulp van sequentie model

2

PII de-identificatie

Unlimited

Dit zijn de artikelen in deze sectie:

Verifieer vreemde sleutels

Syntheseer tabellen met automatische sleutelmapping (standaardoptie)

Syntheseer tabelrelaties met entiteit-tabel rangschikking (bètafunctie)