LogoLogo
Go to Syntho.AI
French (AI Translated)
French (AI Translated)
  • Welcome to Syntho
  • Vue d'ensemble
    • About Syntho
    • Get started
      • Introduction to data generation methods
      • Use Case: AI-generated synthetic data
      • Use Case: AI-generated synthetic time series data
      • Use Case: Database de-identification
    • Frequently asked questions
  • Setup Workspaces
    • View workspaces
    • Create a workspace
      • Connect to a database
        • PostgreSQL
        • MySQL / MariaDB
        • Oracle
        • Microsoft SQL Server
        • DB2
        • Databricks
        • Hive
        • SAP Sybase
        • Azure Data Lake Storage (ADLS)
        • Amazon Simple Storage Service (S3)
    • Edit a workspace
    • Delete a workspace
    • Share a workspace
    • Transfer workspace ownership
  • Configurer une tâche de génération de données
    • Configure table settings
    • Configure column settings
      • AI-powered generation
        • Sequence model
          • Prepare your sequence data
      • Mockers
        • Consistent mapping
        • Supported languages
      • Duplicate
      • Exclude
      • Hashing
      • Calculated columns
      • Primary Key / Foreign Key
    • Manage personally identifiable information (PII)
      • Discover and de-identify PII columns
        • Identify PII columns manually
        • Automatic PII discovery with PII scanner
      • Remove columns from PII list
      • Automatic PII discovery and de-identification in free text columns
      • Supported PII & PHI entities
    • Manage foreign keys
      • Foreign key inheritance
      • Add virtual foreign keys
        • Add virtual foreign keys
        • Use foreign key scanner
        • Import foreign keys via JSON
        • Export foreign keys via JSON
      • Delete foreign keys
      • Circular foreign key references
    • Validate and Synchronize workspace
    • View and adjust generation settings
    • Table relationships
      • Verify foreign keys
      • Synthesize individual tables with automatic key matching
      • De-identify PII columns
  • Déployer Syntho
    • Introduction
      • Syntho architecture
      • Requirements
        • Requirements for Docker deployments
        • Requirements for Kubernetes deployments
      • Access Docker images
        • Using internet
        • Without internet
    • Deploy Syntho using Docker
      • Preparations
      • Deploy using Docker Compose
      • Run the application
      • Manually saving logs
    • Deploy Syntho using Kubernetes
      • Preparations
      • Deploy Ray using Helm
        • Troubleshooting
      • Deploy Syntho using Helm
      • Validate the deployment
      • Troubleshooting
      • Upgrading the applications
    • Manage users and access
      • Single Sign-On (SSO) in Azure
      • Manage admin users
      • Manage non-admin users
    • Logs and monitoring
  • Sous-ensemble
    • What is subsetting
    • Verify foreign keys
    • Configure subsetting
  • Syntho API
    • Syntho REST API
Powered by GitBook
On this page
  • Avant de commencer
  • Se connecter et configurer l'espace de travail
  • Types de données supportés

Was this helpful?

  1. Setup Workspaces
  2. Create a workspace
  3. Connect to a database

Databricks

PreviousDB2NextHive

Last updated 10 months ago

Was this helpful?

Important

Ce connecteur ne peut être utilisé que comme base de données source. Les données générées peuvent être écrites sur ou sous forme de fichiers Parquet.

Avant de commencer

Avant de commencer, rassemblez ces informations de connexion :

  • Nom du serveur qui héberge la base de données à laquelle vous voulez vous connecter et numéro de port

  • Le nom de la base de données à laquelle vous souhaitez vous connecter

  • Chemin d'accès HTTP à la source de données

  • Token d'accès personnel

  • Dans Databricks, trouvez le nom d'hôte de votre serveur cluster et le chemin HTTP en utilisant les instructions dans [Construire l'URL JDBC] (https://docs.databricks.com/user-guide/bi/jdbc-odbc-bi.html#http-path) sur le site web de Databricks.

Se connecter et configurer l'espace de travail

Lancer Syntho et sélectionner Connect to a databaseou sous Create workspace, sélectionner Databricks. Pour obtenir une liste complète des connexions de données, sélectionnez More sous From database. Procédez ensuite comme suit :

  1. Saisissez le nom d'hôte du serveur.

  2. Saisissez le nom du catalogue.

  3. Entrez le nom de la base de données.

  4. Entrez le chemin HTTP vers la source de données.

  5. Enter Personal Access Token. (Voir [Jetons d'accès personnels] (https://docs.databricks.com/api/latest/authentication.html#token-management) sur la page d'accueil. Databricks pour obtenir des informations sur les jetons d'accès).

  6. Sélectionnez Create Workspace.

    Si Syntho ne parvient pas à établir la connexion, vérifiez que vos informations d'identification sont correctes. Si vous n'arrivez toujours pas à vous connecter, votre ordinateur a du mal à localiser le serveur. Contactez votre administrateur réseau ou votre administrateur de base de données.

Types de données supportés

Le tableau suivant résume les limites actuelles de la prise en charge de divers types de données lors de l'utilisation de connecteurs avec Databricks. Les capacités sont divisées en trois catégories : la synthèse, la duplication et le traitement.

Type de données
Synthétisation
Duplication

Byte

☑️

☑️

Short

☑️

☑️

Integer

☑️

☑️

Long

☑️

☑️

Float

☑️

☑️

Double

☑️

☑️

Decimal

☑️

☑️

String

☑️

☑️

Binary

☐️

☑️

Boolean

☑️

☑️

Date

☑️

☑️

Timestamp

☑️

☑️

Array

☐️

☑️

Map

☐️

☑️

Struct

☐️

☑️

Azure Data Lake Storage (ADLS)
Amazon Simple Storage Service (S3)
Bases de données source et destination