Table relationships

SynthoのAIによる合成データ生成を使用する場合, 最小限のリソースで最高のデータユーティリティを実現する, それがベストプラクティスである。 prepare your data as a single entity table.複数のテーブルのデータを生成する必要がある場合, しかし, シンセには3つのオプションがある。:

  1. Synthesize individual tables with automatic key matching: ハードウェアリソースが合理的な範囲内に収まるようにする, デフォルト, シントーは、各テーブルを別のテーブルとは別に合成する。, を生成し、その後に各テーブルの新しいキーを生成する。この方法では、テーブル間の固有のリレーションシップ(キー・カラムとキー・カラム以外のカラムのリレーションシップ)は維持されない。例えば, 合成 Diagnosis テーブルの Pregnancy 診断は、合成 Patients テーブルの男性患者を指し示すことができる。それにもかかわらず, 新しいキーを生成することで、技術的な参照整合性を維持する。, 各外部キーが他のテーブルの既存の主キーに対応していることを確認する。テーブル間のリレーションシップを保持する必要がある場合, 次の3つの選択肢があります。: DiagnosisテーブルとPatientsテーブルの関連情報を次のように変換します。 a single entity table を合成する。, を使用して合成する。 Syntho's sequence model (2テーブルまで), または PII de-identification (テーブル数無制限)。

  2. Synthesize using sequence model: 関連する2つのテーブル間のクロステーブル関係を保持したい場合, ここで、キー・カラムとキー・カラム以外のカラムの関係も保持する。, を使用すると、Syntho の合成データシーケンスモデルを使用できます。このSynthoの機能は、シーケンスデータを合成したい場合に特に役立ちます(例えば, 時系列または軌跡)。

  3. PII de-identification: 合成以外, シンセオ・プラットフォームは次のような用途に使用できる。 de-identify your PII columns の助けを借りている。 Syntho PII scanner そして Syntho mockers に変更し、残りのカラムはすべてそのまま残します。この方法は、テーブル間の関係を保持する利点があり、テストや開発に関連するユースケースで最も人気があります。

Syntho が提供するテーブル関係を保持する主なアプローチの概要は以下の通りです。

アプローチテーブル間の関係参照整合性アップサンプリングシーケンス情報の保存テーブル・リミット

自動キーマッチングによる個々のテーブルの合成

無制限(テーブル間の関係を保持しない)

シーケンスモデルを使って合成する

2

PIIの非識別化

無制限

このセクションの記事はこちら:

Last updated