Consistent mapping
Last updated
Last updated
Consistent mapping maakt het mogelijk om telkens wanneer de mocker wordt toegepast, dezelfde mockgegevenswaarden te genereren voor een gegeven set originele gegevenswaarden. Deze functie kan worden uitgebreid naar verschillende databasetypes, waardoor consistente resultaten worden verkregen. Het is vooral handig als je consequent dezelfde mockwaarden moet genereren op basis van dezelfde invoerwaarden, bijvoorbeeld voor test- of demonstratiedoeleinden.
Om consistente toewijzing in te schakelen, open je kolomconfiguraties door op de kolominstellingen voor de geselecteerde tabel te klikken. Zie hieronder hoe je het venster opent.
Je kunt ook op de "Configure" na een PII-scan wordt ook het venster met kolomconfiguraties geopend.
Klik op het vakje naast de "Consistent Mapping" om consistente mapping met mocker mogelijk te maken. Houd er rekening mee dat u "Mocker" als "Generation Method".
Linking data: Zelfs als je database bepaalde regels voor het koppelen van gegevens niet afdwingt (zoals zorgen dat e-mailadressen overeenkomen), kun je met consistentie toch dingen aan elkaar koppelen. Je kunt bijvoorbeeld achternamen bespotten om ze privé te houden, maar toch gerelateerde kolommen aan elkaar koppelen.
Keeping variety in data: Als je een lijst met verschillende items hebt, zoals 20 functietitels in een kolom, en je wilt ze mengen zonder de algemene variatie te verliezen (nog steeds rond de 20 functietitels), dan is consistentie je vriend. Het houdt de variatie ongeveer hetzelfde.
Denk er echter aan dat, hoewel consistentie de variëteit behoudt, het misschien niet elk item uniek houdt. De variëteit zal niet groeien, maar kan wel iets veranderen. Als je wilt dat elk item één-op-één overeenkomt met een nieuwe unieke waarde, moet je de Mocker unique.
Matching data across places: Als je te maken hebt met gegevens die verspreid zijn over verschillende databases, zoals namen op de ene plaats en e-mailadressen op een andere, helpt consistentie je om de namen overal hetzelfde te houden, zelfs nadat je ze privé hebt gemaakt. Op deze manier wordt alles nog steeds correct gematcht zonder dat er privégegevens worden gedeeld.
Stel dat we een tabel hebben waarin de voornaam "Mavis612" twee keer voorkomt. Als u consistente toewijzing inschakelt, zullen beide namen consistent worden toegewezen aan dezelfde naam in alle tabellen. Zie de illustraties hieronder van MySQL tabellen waar spotters met consistente toewijzing de naam "Mavis612" toewijzen aan "Jillian". Merk op dat andere namen ook kunnen worden toegewezen aan Jillian. Consistent mapping suggereert niet dat alleen en alleen "Mavis612" zal worden vervangen door "Jillian".
Consistent mapping equals predictability: Als je dezelfde gegevens invoert in een mocker met consistent mapping ingeschakeld, krijg je altijd hetzelfde resultaat. Het is alsof je elke keer hetzelfde recept gebruikt om een cake te bakken; het resultaat is voorspelbaar.
Uniqueness not guaranteed: Het is niet omdat het proces consistent is, dat elk gegeven er anders uit zal zien. Twee verschillende inputs kunnen tot dezelfde output leiden. Zie het als verschillende ingrediënten die een taart soms hetzelfde laten smaken.
No mappings stored: Het Syntho-platform slaat geen informatie op over de transformatie van invoer- naar uitvoerwaarden. U kunt dus zien dat "Karl" 10 keer voorkomt, maar niet dat "Karl" oorspronkelijk "Immanuel" was. Je kunt ook veranderen hoe invoerwaarden worden omgezet naar uitvoerwaarden.
Reduced privacy: gebruiken consistent mapping kan informatie onthullen, zoals hoe vaak bepaalde gegevens voorkomen. Als "Karl" bijvoorbeeld 10 keer voorkomt, blijft dat patroon hetzelfde nadat de gegevens zijn verwerkt.
Whole database application: Consistentie geldt voor je hele database, niet alleen binnen een enkele tabel. Als je consistent mapping voor namen in zowel a Customers en een Employees tabel, wordt dezelfde oorspronkelijke naam altijd bijgewerkt naar dezelfde nieuwe naam in beide tabellen.
Not automatically across multiple jobs: Als je gegevens meer dan eens genereert, wordt de consistentie standaard automatisch overgedragen van de ene genereertaak naar de volgende. Als je dit niet wilt en je wilt de consistentie tussen jobs wijzigen, dan kun je een andere beginwaarde instellen. Je kunt dit doen door naar de Workspace Default Settingsdoor CTRL + ALT + SHIFT + 0
te selecteren en de seed_value
te updaten naar een andere gehele waarde.
Kortom, consistentie in het genereren van gegevens helpt ervoor te zorgen dat je gegevens zich voorspelbaar gedragen, terwijl je ook de balans zoekt tussen het behouden van bruikbare patronen en het beschermen van privacy.
Voor een nauwkeurige ordening is het essentieel dat de toepassing een index of een primaire sleutel in de brontabel heeft. Als deze ontbreken, sorteert de toepassing standaard op basis van de eerste kolom van de tabel. Als de eerste kolom echter dubbele waarden bevat, kan de volgorde niet worden gegarandeerd, omdat deze afhankelijk is van het sorteeralgoritme van de database om dubbele waarden te verwerken. Het toevoegen van een index aan de brontabel lost dit probleem op.
Het is belangrijk om op te merken dat het gebruik van consistente mapping in een tabel zonder gedefinieerde primaire sleutels of indexen kan leiden tot onverwachte resultaten. In dergelijke gevallen gebruikt de toepassing de eerste kolom voor het ordenen, die mogelijk geen unieke waarden bevat, wat leidt tot niet-deterministische resultaten.
Consistent mapping garandeert geen consistentie voor gegenereerde gegevens onder verschillende Syntho platformversies.