Amazon Simple Storage Service (S3)
Last updated
Last updated
{ヒント style="info" %}。 Destination only
このコネクタは、生成したデータの書き込み先としてのみ使用できます。
対応ファイル形式: パルケ
対応パーティション: 書き込みバッチサイズに基づく水平パーティショニング(すなわち、各バッチは別々のファイルに書き込まれる)。ファイル出力構造の例も示してください。
ファイル出力構造の例も示してください。
始める前に, この接続情報を収集する:
接続の詳細を取得し S3 bucket
サポートされているファイル形式:
パルケ
ORC
Syntho の S3 出力コネクターは、生成されたすべてのデータを以下のようにファイルに書き込みます。:
生成された各テーブルは、以下のフォーマットでParquetファイルに書き込まれる。:
{schema-name}-{table_name}_part_{part_number}.parquet
1つのParquetファイル(パート)の行数は batch_generate
サイズになります。1つのテーブルのすべてのParquetパートは、それぞれのディレクトリに格納されます。, これはその特定のテーブル専用である。
各フォルダ名には以下の形式が使用されます。:
{schema_name}.{table_name}
Syntho を起動し Connect to a database, 以下 Create workspace > Destination Database, 選ぶ S3.データ接続の完全なリスト, 選ぶ More アンダー From database.そして、次のようにする。:
1.バケツ名を入力します。 2.リージョン名を入力します。 3.ポート番号を入力する。 4.AWSアクセスキーIDを入力します。 5.AWSシークレットアクセスキーを入力します。 6.プレフィックスを入力します。 Synthoが接続できない場合, 認証情報が正しいことを確認してください。それでも接続できない場合は, コンピュータがサーバーを見つけられない。ネットワーク管理者またはデータベース管理者に連絡してください。
このコネクターに関する制限事項については、Syntho の担当者にお問い合わせください。
ORCファイルの場合, カラムは Char 型の None 値でいっぱいです。, StringまたはVarcharは、Noneの代わりに "None"(すなわち文字列値)として宛先データベースに書き込まれます。
サポートされていないデータタイプが含まれる場合、ORCファイルへの書き込み時にデータ変換中にエラーが発生することがあります。 Supported Data Types: ORCファイルのサポートされるデータ型は、Apache Arrowのドキュメントで指定されています。
Logical type | マップされた矢印のタイプ |
---|---|
BOOLEAN | ブーリアン |
BYTE | イント8 |
SHORT | Int16|(英語 |
INT | Int32|(イント |
LONG | Int64|(英語 |
FLOAT | フロート32 |
DOUBLE | Float64|フロート |
STRING | String/LargeString|ストリング/ラージストリング |
BINARY | バイナリ/ラージバイナリー/フィックスサイズバイナリー |
TIMESTAMP | タイムスタンプ/Date64 |
TIMESTAMP_INSTANT | タイムスタンプ |
LIST | リスト/ラージリスト/サイズ固定リスト |
MAP | 地図 |
STRUCT | 構造 |
UNION | SparseUnion/DenseUnion|スパースユニオン/デンスユニオン |
DECIMAL | Decimal128/Decimal256|Decimal128/Decimal256|Decimal256 |
DATE | 日付|32 |
VARCHAR | ストリング |
CHAR | ストリング |
このコネクタに関する制限の可能性については、Syntho の担当者にお問い合わせください。