BSONEachRow
| Вход | Выход | Псевдоним | 
|---|---|---|
| ✔ | ✔ | 
Описание
Формат BSONEachRow парсит данные как последовательность документов Binary JSON (BSON) без какого-либо разделителя между ними. Каждая строка форматируется как единственный документ, а каждая колонка форматируется как одно поле документа BSON с именем колонки в качестве ключа.
Соответствие типов данных
Для вывода используется следующее соответствие между типами ClickHouse и типами BSON:
| Тип ClickHouse | Тип BSON | 
|---|---|
| Bool | \x08булевый | 
| Int8/UInt8/Enum8 | \x10int32 | 
| Int16/UInt16/Enum16 | \x10int32 | 
| Int32 | \x10int32 | 
| UInt32 | \x12int64 | 
| Int64/UInt64 | \x12int64 | 
| Float32/Float64 | \x01double | 
| Date/Date32 | \x10int32 | 
| DateTime | \x12int64 | 
| DateTime64 | \x09datetime | 
| Decimal32 | \x10int32 | 
| Decimal64 | \x12int64 | 
| Decimal128 | \x05binary,\x00двоичный подкласс, размер = 16 | 
| Decimal256 | \x05binary,\x00двоичный подкласс, размер = 32 | 
| Int128/UInt128 | \x05binary,\x00двоичный подкласс, размер = 16 | 
| Int256/UInt256 | \x05binary,\x00двоичный подкласс, размер = 32 | 
| String/FixedString | \x05binary,\x00двоичный подкласс или \x02 строка, если настройка output_format_bson_string_as_string включена | 
| UUID | \x05binary,\x04uuid подкласс, размер = 16 | 
| Array | \x04массив | 
| Tuple | \x04массив | 
| Named Tuple | \x03документ | 
| Map | \x03документ | 
| IPv4 | \x10int32 | 
| IPv6 | \x05binary,\x00двоичный подкласс | 
Для ввода используется следующее соответствие между типами BSON и типами ClickHouse:
| Тип BSON | Тип ClickHouse | 
|---|---|
| \x01double | Float32/Float64 | 
| \x02string | String/FixedString | 
| \x03document | Map/Named Tuple | 
| \x04array | Array/Tuple | 
| \x05binary,\x00двоичный подкласс | String/FixedString/IPv6 | 
| \x05binary,\x02старый двоичный подкласс | String/FixedString | 
| \x05binary,\x03старый uuid подкласс | UUID | 
| \x05binary,\x04uuid подкласс | UUID | 
| \x07ObjectId | String/FixedString | 
| \x08булевый | Bool | 
| \x09datetime | DateTime64 | 
| \x0Aнулевое значение | NULL | 
| \x0Dкод JavaScript | String/FixedString | 
| \x0Eсимвол | String/FixedString | 
| \x10int32 | Int32/UInt32/Decimal32/IPv4/Enum8/Enum16 | 
| \x12int64 | Int64/UInt64/Decimal64/DateTime64 | 
Другие типы BSON не поддерживаются. Кроме того, производится преобразование между различными целочисленными типами. Например, возможно вставить значение BSON int32 в ClickHouse как UInt8.
Большие целые числа и десятичные числа, такие как Int128/UInt128/Int256/UInt256/Decimal128/Decimal256, могут быть распознаны из двоичного значения BSON с подтипом \x00. В этом случае формат будет проверять, что размер бинарных данных равен размеру ожидаемого значения.
Этот формат не работает должным образом на платформах Big-Endian.
Пример использования
Настройки формата
| Настройка | Описание | По умолчанию | 
|---|---|---|
| output_format_bson_string_as_string | Использовать тип BSON String вместо Binary для строковых колонок. | false | 
| input_format_bson_skip_fields_with_unsupported_types_in_schema_inference | Позволить пропускать колонки с неподдерживаемыми типами во время вывода схемы для формата BSONEachRow. | false | 
