LogoLogo
Go to Syntho.AI
French (AI Translated)
French (AI Translated)
  • Welcome to Syntho
  • Vue d'ensemble
    • About Syntho
    • Get started
      • Introduction to data generation methods
      • Use Case: AI-generated synthetic data
      • Use Case: AI-generated synthetic time series data
      • Use Case: Database de-identification
    • Frequently asked questions
  • Setup Workspaces
    • View workspaces
    • Create a workspace
      • Connect to a database
        • PostgreSQL
        • MySQL / MariaDB
        • Oracle
        • Microsoft SQL Server
        • DB2
        • Databricks
        • Hive
        • SAP Sybase
        • Azure Data Lake Storage (ADLS)
        • Amazon Simple Storage Service (S3)
    • Edit a workspace
    • Delete a workspace
    • Share a workspace
    • Transfer workspace ownership
  • Configurer une tâche de génération de données
    • Configure table settings
    • Configure column settings
      • AI-powered generation
        • Sequence model
          • Prepare your sequence data
      • Mockers
        • Consistent mapping
        • Supported languages
      • Duplicate
      • Exclude
      • Hashing
      • Calculated columns
      • Primary Key / Foreign Key
    • Manage personally identifiable information (PII)
      • Discover and de-identify PII columns
        • Identify PII columns manually
        • Automatic PII discovery with PII scanner
      • Remove columns from PII list
      • Automatic PII discovery and de-identification in free text columns
      • Supported PII & PHI entities
    • Manage foreign keys
      • Foreign key inheritance
      • Add virtual foreign keys
        • Add virtual foreign keys
        • Use foreign key scanner
        • Import foreign keys via JSON
        • Export foreign keys via JSON
      • Delete foreign keys
      • Circular foreign key references
    • Validate and Synchronize workspace
    • View and adjust generation settings
    • Table relationships
      • Verify foreign keys
      • Synthesize individual tables with automatic key matching
      • De-identify PII columns
  • Déployer Syntho
    • Introduction
      • Syntho architecture
      • Requirements
        • Requirements for Docker deployments
        • Requirements for Kubernetes deployments
      • Access Docker images
        • Using internet
        • Without internet
    • Deploy Syntho using Docker
      • Preparations
      • Deploy using Docker Compose
      • Run the application
      • Manually saving logs
    • Deploy Syntho using Kubernetes
      • Preparations
      • Deploy Ray using Helm
        • Troubleshooting
      • Deploy Syntho using Helm
      • Validate the deployment
      • Troubleshooting
      • Upgrading the applications
    • Manage users and access
      • Single Sign-On (SSO) in Azure
      • Manage admin users
      • Manage non-admin users
    • Logs and monitoring
  • Sous-ensemble
    • What is subsetting
    • Verify foreign keys
    • Configure subsetting
  • Syntho API
    • Syntho REST API
Powered by GitBook
On this page
  • Modes de table
  • Vue d'ensemble des modes de table
  • Navigation dans le menu du mode Table
  • Affectation automatique du mode tableau
  • Ajustez le nombre de lignes à générer
  • Considérations pour ajuster le nombre de lignes à générer
  • Pagination
  • Paramètres avancés du tableau

Was this helpful?

  1. Configurer une tâche de génération de données

Configure table settings

PreviousTransfer workspace ownershipNextConfigure column settings

Last updated 10 months ago

Was this helpful?

Sur l'écran Job configuration vous pouvez appliquer plusieurs configurations au niveau de la colonne.

Modes de table

Les modes de table vous permettent de contrôler la manière dont les tables de la base de données source sont traitées et transférées vers la base de données de destination. Les trois modes disponibles sont les suivants : Synthesize, De-identifyet Exclude.

Vue d'ensemble des modes de table

Il existe trois modes de table que vous pouvez utiliser pour définir la manière dont chaque table de la base de données source est traitée :

  • Synthesize: Dans ce mode, les tables de la base de données source sont synthétisées à l'aide de l'IA de Syntho, puis écrites dans la base de données de destination.

Lorsqu'une table est listée sous la rubrique Synthesize Le mode de colonne appliqué par défaut est AI-powered generation. Toutefois, vous avez la possibilité de modifier ce paramètre par défaut.

Étapes pour changer le mode colonne dans Synthesize:

  1. Sélectionner le tableau figurant sous "Synthesize".

  2. Accédez aux paramètres des colonnes pour le tableau sélectionné.

  3. Par défaut, le mode de colonne est défini sur AI-powered generation.

  4. Changez le mode de colonne pour l'une des options suivantes :

    • Mocker: Utilisez cette option pour remplir les colonnes avec des données fictives.

    • Duplicate: Sélectionnez cette option si vous souhaitez que les colonnes soient une copie exacte de la source.

    • Exclude: Choisissez cette option si vous ne souhaitez pas inclure des colonnes spécifiques dans le tableau synthétisé.

Pour plus d'informations, voir Configure column settings.

  • De-identify: Lorsque les tables sont définies dans ce mode, elles sont directement copiées, avec ou sans aucune modification, de la base de données source à la base de données de destination, à la demande de l'utilisateur.

Lorsqu'une table est répertoriée sous le mode Désidentification, le mode colonne appliqué par défaut est également Duplicate. Cela signifie que les colonnes seront exactement copiées à partir de la source. Vous pouvez toutefois modifier ce paramètre.

Étapes pour changer le mode de colonne dans Duplicate:

  1. Sélectionner le tableau figurant sous "Duplicate".

  2. Accédez aux paramètres des colonnes pour le tableau sélectionné.

  3. Par défaut, le mode de colonne est défini sur Duplicate.

  4. Changez le mode de colonne pour l'une des options suivantes :

    • Mocker: Utilisez cette option pour remplir les colonnes avec des données fictives.

    • Exclude: Choisissez cette option si vous ne souhaitez pas inclure des colonnes spécifiques dans le tableau dupliqué.

Pour plus d'informations, voir Configure column settings.

  • Exclude: Les tables affectées à ce mode ne seront pas transférées dans la base de données de destination.

Caution: L'exclusion d'une table peut entraîner des conflits avec les contraintes de clés étrangères dans votre base de données de destination.

Navigation dans le menu du mode Table

Le menu Table Mode Menu est situé sur le panneau gauche de l'interface Syntho.

  • Pour assigner un tableau à un mode spécifique, il suffit de faire glisser le tableau depuis la liste et de le déposer sous le mode de tableau désiré (Synthesize, Duplicateou Exclude) dans le menu du mode tableau.

Hint: Vous pouvez faire glisser plusieurs tableaux simultanément en maintenant la touche "CTRL" ou "SHIFT" enfoncée, puis en sélectionnant et en faisant glisser les tableaux.

Affectation automatique du mode tableau

Après avoir créé votre espace de travail, Syntho assigne automatiquement votre table à l'un des modes de table en fonction du nombre de lignes dans la table source. Il est important de vérifier que le mode de table assigné automatiquement est bien le même que celui de la table source. Table Mode pour chaque tableau est adapté à votre cas d'utilisation :

  • Examinez les Table Mode attribuée à chaque table dans le Table Mode Menu.

  • Si vous constatez qu'un tableau devrait être dans un mode différent, vous pouvez simplement glisser et déposer le tableau dans le mode souhaité, comme expliqué dans la section 2.

  • Assurez-vous que tous les tableaux sont dans le bon mode avant de continuer.

Ajustez le nombre de lignes à générer

Par défaut, Syntho génère le même nombre de lignes dans le tableau de destination que dans le tableau source.

Pour modifier le nombre de lignes à générer pour une table :

  1. Aller à Rows to generate dans le champ Table settings à droite dans le panneau Paramètres du travail.

  2. Mettez à jour la valeur du champ en fonction du nombre de lignes de destination souhaité.

Le comportement lors de l'ajustement du nombre de lignes de la table de destination est le suivant :

  • Pour les tables marquées comme Synthesize, génère le nombre de lignes spécifiées en utilisant l'IA de Syntho et tous les mockers appliqués.

  • Pour les tables marquées comme Duplicate, génère le nombre de lignes spécifiées (n) en prenant des échantillons aléatoires de la table originale (n_original). Si n <= n_original, les lignes originales sont copiées. Si n > n_original, alors les n lignes originales sont copiées telles quelles, et les lignes suivantes sont échantillonnées aléatoirement (avec remplacement) à partir des lignes originales.

  • Pour les tables marquées comme Excludene génère aucune ligne (puisque la table est exclue).

Considérations pour ajuster le nombre de lignes à générer

  • Le Rows to generate sera désactivé si la table ne prend pas en charge le suréchantillonnage, ce qui peut être dû aux raisons suivantes :

    • La table utilise un autre mode de table que Synthesize.

    • La table a une autre méthode que Generate comme méthode de génération de clé appliquée.

  • Si son nombre a été modifié précédemment et que la table ne prend plus en charge le suréchantillonnage, la valeur sera ramenée à la valeur d'origine.

  • Ajustement Rows to generate pourrait entraîner des conflits avec les contraintes de clés étrangères dans votre base de données de destination.

Pagination

Un bouton "Charger plus" permet aux utilisateurs de charger des données supplémentaires à la demande, évitant ainsi les retards causés par le chargement de toutes les données en une seule fois.

Paramètres avancés du tableau

Déplier Advanced settings dans le cadre de la Table settings pour afficher et ajuster les paramètres au niveau de la table. Notez que ces paramètres ne s'appliquent qu'aux colonnes qui utilisent la génération assistée par ordinateur.

Vous pouvez ajuster les paramètres de table avancés suivants :

  1. Maximum rows used for training: Le nombre maximum de lignes à utiliser pour la formation. L'utilisation d'un nombre inférieur de lignes peut accélérer le processus, mais au prix d'une moindre utilité des données synthétiques.

  2. Take random sample:

    • On: prend un échantillon aléatoire des lignes utilisées pour l'entraînement. Notez que le choix de cette option peut allonger considérablement la durée d'exécution d'un travail de génération de données, en fonction de la base de données.

    • Off (default): prend les premières lignes telles qu'elles sont définies dans la base de données.

Pour améliorer l'expérience de l'utilisateur lors du chargement des écrans d'application et des tableaux de bord, Syntho dispose de mécanismes efficaces de chargement des données. Ceux-ci visent à assurer une interaction plus fluide, en particulier lorsque la base de données source contient une quantité importante de données.

Bouton "Load More"
Trois modes de table : Synthétiser, Dé-identifier et Exclure.
Paramètres avancés dans la vue Paramètres du tableau