Table relationships
SynthoのAIによる合成データ生成を使用する場合, 最小限のリソースで最高のデータユーティリティを実現する, それがベストプラクティスである。 prepare your data as a single entity table.複数のテーブルのデータを生成する必要がある場合, しかし, シンセには3つのオプションがある。:
Synthesize individual tables with automatic key matching: ハードウェアリソースが合理的な範囲内に収まるようにする, デフォルト, シントーは、各テーブルを別のテーブルとは別に合成する。, を生成し、その後に各テーブルの新しいキーを生成する。この方法では、テーブル間の固有のリレーションシップ(キー・カラムとキー・カラム以外のカラムのリレーションシップ)は維持されない。例えば, 合成 Diagnosis テーブルの Pregnancy 診断は、合成 Patients テーブルの男性患者を指し示すことができる。それにもかかわらず, 新しいキーを生成することで、技術的な参照整合性を維持する。, 各外部キーが他のテーブルの既存の主キーに対応していることを確認する。テーブル間のリレーションシップを保持する必要がある場合, 次の3つの選択肢があります。: DiagnosisテーブルとPatientsテーブルの関連情報を次のように変換します。 a single entity table を合成する。, を使用して合成する。 Syntho's sequence model (2テーブルまで), または PII de-identification (テーブル数無制限)。
Synthesize using sequence model: 関連する2つのテーブル間のクロステーブル関係を保持したい場合, ここで、キー・カラムとキー・カラム以外のカラムの関係も保持する。, を使用すると、Syntho の合成データシーケンスモデルを使用できます。このSynthoの機能は、シーケンスデータを合成したい場合に特に役立ちます(例えば, 時系列または軌跡)。
PII de-identification: 合成以外, シンセオ・プラットフォームは次のような用途に使用できる。 de-identify your PII columns の助けを借りている。 Syntho PII scanner そして Syntho mockers に変更し、残りのカラムはすべてそのまま残します。この方法は、テーブル間の関係を保持する利点があり、テストや開発に関連するユースケースで最も人気があります。
Syntho が提供するテーブル関係を保持する主なアプローチの概要は以下の通りです。
アプローチ | テーブル間の関係 | 参照整合性 | アップサンプリング | シーケンス情報の保存 | テーブル・リミット |
---|---|---|---|---|---|
自動キーマッチングによる個々のテーブルの合成 | 無制限(テーブル間の関係を保持しない) | ||||
シーケンスモデルを使って合成する | 2 | ||||
PIIの非識別化 | 無制限 |
このセクションの記事はこちら:
Last updated