LogoLogo
Go to Syntho.AI
Dutch (AI Translated)
Dutch (AI Translated)
  • Welcome to Syntho
  • Overzicht
    • About Syntho
    • Get started
      • Introduction to data generation methods
      • Use Case: AI-generated synthetic data
      • Use Case: AI-generated synthetic time series data
      • Use Case: Database de-identification
    • Frequently asked questions
  • Werkruimten instellen
    • View workspaces
    • Create a workspace
      • Connect to a database
        • PostgreSQL
        • MySQL / MariaDB
        • Oracle
        • Microsoft SQL Server
        • DB2
        • Databricks
        • Hive
        • SAP Sybase
        • Azure Data Lake Storage (ADLS)
        • Amazon Simple Storage Service (S3)
    • Edit a workspace
    • Delete a workspace
    • Share a workspace
    • Transfer workspace ownership
  • Een gegevensgeneratietaak configureren
    • Configure table settings
    • Configure column settings
      • AI-powered generation
        • Sequence model
          • Prepare your sequence data
      • Mockers
        • Consistent mapping
        • Supported languages
      • Duplicate
      • Exclude
      • Hashing
      • Calculated columns
      • Primary Key / Foreign Key
    • Manage personally identifiable information (PII)
      • Discover and de-identify PII columns
        • Identify PII columns manually
        • Automatic PII discovery with PII scanner
      • Remove columns from PII list
      • Automatic PII discovery and de-identification in free text columns
      • Supported PII & PHI entities
    • Manage foreign keys
      • Foreign key inheritance
      • Add virtual foreign keys
        • Add virtual foreign keys
        • Use foreign key scanner
        • Import foreign keys via JSON
        • Export foreign keys via JSON
      • Delete foreign keys
      • Circular foreign key references
    • Validate and Synchronize workspace
    • View and adjust generation settings
    • Table relationships
      • Verify foreign keys
      • Synthesize individual tables with automatic key matching
      • De-identify PII columns
  • Syntho implementeren
    • Introduction
      • Syntho architecture
      • Requirements
        • Requirements for Docker deployments
        • Requirements for Kubernetes deployments
      • Access Docker images
        • Using internet
        • Without internet
    • Deploy Syntho using Docker
      • Preparations
      • Deploy using Docker Compose
      • Run the application
      • Manually saving logs
    • Deploy Syntho using Kubernetes
      • Preparations
      • Deploy Ray using Helm
        • Troubleshooting
      • Deploy Syntho using Helm
      • Validate the deployment
      • Troubleshooting
      • Upgrading the applications
    • Manage users and access
      • Single Sign-On (SSO) in Azure
      • Manage admin users
      • Manage non-admin users
    • Logs and monitoring
  • Subsetting
    • What is subsetting
    • Verify foreign keys
    • Configure subsetting
  • Syntho API
    • Syntho REST API
Powered by GitBook
On this page
  • Consistente mapping inschakelen
  • Voordelen van consistente mapping
  • Voorbeeld van consistente mapping
  • Consequente toewijzing begrijpen
  • Gevolgen voor de privacy
  • Hoe consistentie in databases werkt
  • Ordering and Indexing Considerations
  • Beperkingen

Was this helpful?

  1. Een gegevensgeneratietaak configureren
  2. Configure column settings
  3. Mockers

Consistent mapping

PreviousMockersNextSupported languages

Last updated 10 months ago

Was this helpful?

Consistent mapping maakt het mogelijk om telkens wanneer de mocker wordt toegepast, dezelfde mockgegevenswaarden te genereren voor een gegeven set originele gegevenswaarden. Deze functie kan worden uitgebreid naar verschillende databasetypes, waardoor consistente resultaten worden verkregen. Het is vooral handig als je consequent dezelfde mockwaarden moet genereren op basis van dezelfde invoerwaarden, bijvoorbeeld voor test- of demonstratiedoeleinden.


Consistente mapping inschakelen

Om consistente toewijzing in te schakelen, open je kolomconfiguraties door op de kolominstellingen voor de geselecteerde tabel te klikken. Zie hieronder hoe je het venster opent.

Kolominstellingen openen

Je kunt ook op de "Configure" na een PII-scan wordt ook het venster met kolomconfiguraties geopend.

Klik op het vakje naast de "Consistent Mapping" om consistente mapping met mocker mogelijk te maken. Houd er rekening mee dat u "Mocker" als "Generation Method".

Voordelen van consistente mapping

Linking data: Zelfs als je database bepaalde regels voor het koppelen van gegevens niet afdwingt (zoals zorgen dat e-mailadressen overeenkomen), kun je met consistentie toch dingen aan elkaar koppelen. Je kunt bijvoorbeeld achternamen bespotten om ze privé te houden, maar toch gerelateerde kolommen aan elkaar koppelen.

Keeping variety in data: Als je een lijst met verschillende items hebt, zoals 20 functietitels in een kolom, en je wilt ze mengen zonder de algemene variatie te verliezen (nog steeds rond de 20 functietitels), dan is consistentie je vriend. Het houdt de variatie ongeveer hetzelfde.

Denk er echter aan dat, hoewel consistentie de variëteit behoudt, het misschien niet elk item uniek houdt. De variëteit zal niet groeien, maar kan wel iets veranderen. Als je wilt dat elk item één-op-één overeenkomt met een nieuwe unieke waarde, moet je de Mocker unique.

Matching data across places: Als je te maken hebt met gegevens die verspreid zijn over verschillende databases, zoals namen op de ene plaats en e-mailadressen op een andere, helpt consistentie je om de namen overal hetzelfde te houden, zelfs nadat je ze privé hebt gemaakt. Op deze manier wordt alles nog steeds correct gematcht zonder dat er privégegevens worden gedeeld.

Voorbeeld van consistente mapping

Stel dat we een tabel hebben waarin de voornaam "Mavis612" twee keer voorkomt. Als u consistente toewijzing inschakelt, zullen beide namen consistent worden toegewezen aan dezelfde naam in alle tabellen. Zie de illustraties hieronder van MySQL tabellen waar spotters met consistente toewijzing de naam "Mavis612" toewijzen aan "Jillian". Merk op dat andere namen ook kunnen worden toegewezen aan Jillian. Consistent mapping suggereert niet dat alleen en alleen "Mavis612" zal worden vervangen door "Jillian".

Consequente toewijzing begrijpen

Consistent mapping equals predictability: Als je dezelfde gegevens invoert in een mocker met consistent mapping ingeschakeld, krijg je altijd hetzelfde resultaat. Het is alsof je elke keer hetzelfde recept gebruikt om een cake te bakken; het resultaat is voorspelbaar.

Uniqueness not guaranteed: Het is niet omdat het proces consistent is, dat elk gegeven er anders uit zal zien. Twee verschillende inputs kunnen tot dezelfde output leiden. Zie het als verschillende ingrediënten die een taart soms hetzelfde laten smaken.

Gevolgen voor de privacy

No mappings stored: Het Syntho-platform slaat geen informatie op over de transformatie van invoer- naar uitvoerwaarden. U kunt dus zien dat "Karl" 10 keer voorkomt, maar niet dat "Karl" oorspronkelijk "Immanuel" was. Je kunt ook veranderen hoe invoerwaarden worden omgezet naar uitvoerwaarden.

Reduced privacy: gebruiken consistent mapping kan informatie onthullen, zoals hoe vaak bepaalde gegevens voorkomen. Als "Karl" bijvoorbeeld 10 keer voorkomt, blijft dat patroon hetzelfde nadat de gegevens zijn verwerkt.

Hoe consistentie in databases werkt

Whole database application: Consistentie geldt voor je hele database, niet alleen binnen een enkele tabel. Als je consistent mapping voor namen in zowel a Customers en een Employees tabel, wordt dezelfde oorspronkelijke naam altijd bijgewerkt naar dezelfde nieuwe naam in beide tabellen.

Not automatically across multiple jobs: Als je gegevens meer dan eens genereert, wordt de consistentie standaard automatisch overgedragen van de ene genereertaak naar de volgende. Als je dit niet wilt en je wilt de consistentie tussen jobs wijzigen, dan kun je een andere beginwaarde instellen. Je kunt dit doen door naar de Workspace Default Settingsdoor CTRL + ALT + SHIFT + 0 te selecteren en de seed_value te updaten naar een andere gehele waarde.

Kortom, consistentie in het genereren van gegevens helpt ervoor te zorgen dat je gegevens zich voorspelbaar gedragen, terwijl je ook de balans zoekt tussen het behouden van bruikbare patronen en het beschermen van privacy.

Ordering and Indexing Considerations

Voor een nauwkeurige ordening is het essentieel dat de toepassing een index of een primaire sleutel in de brontabel heeft. Als deze ontbreken, sorteert de toepassing standaard op basis van de eerste kolom van de tabel. Als de eerste kolom echter dubbele waarden bevat, kan de volgorde niet worden gegarandeerd, omdat deze afhankelijk is van het sorteeralgoritme van de database om dubbele waarden te verwerken. Het toevoegen van een index aan de brontabel lost dit probleem op.

Het is belangrijk om op te merken dat het gebruik van consistente mapping in een tabel zonder gedefinieerde primaire sleutels of indexen kan leiden tot onverwachte resultaten. In dergelijke gevallen gebruikt de toepassing de eerste kolom voor het ordenen, die mogelijk geen unieke waarden bevat, wat leidt tot niet-deterministische resultaten.

Beperkingen

  • Consistent mapping garandeert geen consistentie voor gegenereerde gegevens onder verschillende Syntho platformversies.

Consistente mapping
Een voorbeeld van consistente toewijzing
width=