Telegram-канал clickhouse_ru - ClickHouse не тормозит: Unsorted - каталог телеграмм

clickhouse_ru | Unsorted

Subscribe to a channel

Telegram-канал clickhouse_ru - ClickHouse не тормозит

11238

Обсуждаем ClickHouse

Subscribe to a channel

ClickHouse не тормозит

21 October 2025 23:49

Ну да, такое сработает если на одном сервере все парты помержились и больше не планируют, и надо это на реплики разлить. Считай то же, что и с нуля реплику налить... Тогда остановлюсь на полной переналивке "слабой" реплики. Спасибо за ответ ночью

Читать полностью…

ClickHouse не тормозит

21 October 2025 23:42

Они и так помержены. При аттаче партов должны мержиться парты из non-replicated с партами в replicated же? В этих мержах проблема. Не мержить вовсе - не выйдет, вставки в таблицы продолжаются и рано или поздно лопнут из-за too many parts

Читать полностью…

ClickHouse не тормозит

21 October 2025 22:48

Привет! Подскажи, а какой способ есть решить проблему из сообщения Сергея, помимо always_fetch_merged_part?

У нас кейс следующий:
- есть 3 replicated инстанса, 2 "сильных" сервера и один "слабый"
- на одном из сильным инстансов мы из non-replicated таблицы аттачим террабайты партов в replicated таблицу
- данные разливаются на реплики и начинают мержиться

И если на двух "сильных" серверах мержи проходят успешно, то на одной "слабой" реплике мержи работают в полку слишком продолжительное время. Хочется перетянуть смерженные парты с соседних реплик.
Мы используем версию 22.3.11, на которой, насколько я понял, нет опции always_fetch_merged_part. Из вариантов решения вижу только наливать "слабую" реплику с нуля, но мб есть менее радикальный способ?

Читать полностью…

ClickHouse не тормозит

21 October 2025 19:10

Спасибо, пойду изучать)

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:19

не пока

в итоге я правильно понимаю вашу идею:

чтобы я сделал
max_threads=1 и max_block_size = 50000 чтобы понять сколько памяти будет есть чтение паркетов на максимуме (memory_usage (system.query_log )и дальше поднимать max_threads чтобы понимать сколько ядер можно утилизировать и при этом чтобы не выжирало всю память?

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:10

https://clickhouse.com/docs/interfaces/formats/Parquet
о, щас сюда покопаю, спасибо

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:08

я бы подозревал что 16 мб это пер колонка, но надо читать описание параметра

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:06

щас
т.е. у нас есть паркет , у него есть блок
input_format_parquet_prefer_block_bytes прмерно 16 МБ
у нас есть 8 ядер

т.е. каждый блок развернется в памяти но ок на 160 мб
8* 160 мб = 1.6 гб запишется в кх. откуда там на 30 гб?
сорри если не так считаю

Объем всех паркетов за день =2 ГБ

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:00

Дак попробуйте, если поможет, то у вас не хватает памяти, чтобы обрабатывать файлы во все потоки

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:00

но у нас нет проекций, таблицы system.projection_parts system.projection_parts_columns system.projection пустые

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:59

так я не против ) я просто понять хочу из-за чего проблема с памятью

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:57

а что за файлы? а то у паркетов, там свой размер блока, через размер роугрупы

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:57

вот это то и не понятно )
т.е. он нормально читает с 1 до 20 файла, а на 22 условно падает
я делаю вывод, что где то накапление в памяти чего то идет
причем размер max_block_size роли не играет все равно на 20 падает

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:55

нет, в таком случае, остальне ядра будут проставить и будет долго грузиться же.

я размером блока же рулю объем обработки батчей
т.е. идея есть много маленькими порциями

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:52

в 1 дне: 25 файлов ( по часам)
сорри, я не понимаю связь

да даже если 8 потоков
у него max_block_size = 1

он же не будет пытаться все паркеты в памяти держать,
он прочитал 8 файликов = по 1 строке вставляет (8 строк)

Читать полностью…

ClickHouse не тормозит

21 October 2025 23:46

тогда нет решения, да и always_fetch_merged_part , вот смержился парт в 300ГБ и что теперь фетчить его на другие реплики? сеть 10гбит?
в смысле много раз будет фетчится, и 50ГБ и 100 и 150

Читать полностью…

ClickHouse не тормозит

21 October 2025 23:39

мержить пока они в non-replicated ?
уменьшить max_bytes_to_merge_at_max_space_in_pool чтобы вообще не мержилось в replicated

Читать полностью…

ClickHouse не тормозит

21 October 2025 21:59

Немного дополняю
Получаю от человека данные с 1с в виде 9 штук xlsx
конвертирую их через python скрипт в 1 csv
загружаю csv в clickhouse cloud

хочу сделать кластер на яндексе (данные берутся для чартов datalens, так что яндекс удобен)

могу я подключить напрямую выгрузку к кластеру яндекса или кликхаус cloud?

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:58

Я думаю более перспективно крутить

input_format_parquet_enable_row_group_prefetch │ 1
input_format_parquet_max_block_size │ 65409
input_format_parquet_prefer_block_bytes │ 16744704

Первую выключить, вторую и третью уменьшать

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:12

вы кстати не пробовали settings input_format_parquet_use_native_reader_v3=1 ?

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:10

>Объем всех паркетов за день =2 ГБ
это смешно, в issues у КХ есть специально созданный паркет размером 1МБ чтобы прочитать его надо 400ГБ памяти и в КХ и в spark и в python

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:07

calc_time у вас в partition by ?

можете проверить например у mergeTree* таблиц в system.parts колонки min_time и max_time

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:02

implicit_projections это проекции созданные в памяти неявно из minmax индексов от partitionby и orderby

читайте как дебажат и воспроизводят иши https://github.com/ClickHouse/ClickHouse/issues?q=is%3Aissue%20state%3Aopen%20optimize_use_implicit_projections
читайте все закрытые и все открытые иши

Читать полностью…

ClickHouse не тормозит

21 October 2025 18:00

вы представляете как паркет устроен? что оттуда нельзя прочитать одну строку?

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:59

Всем привет, столкнулся с проблемой, в КХ заливаются логи командой 'INSERT INTO db.table FORMAT JSONEachRow' в поле c типом String.Проблема: в поле ничего не записывается, вставки пустые, в err.log ошибки отсутствуют, в query.log в эту таблицу по цифрам есть вставка. Может кто-то знает куда копать?

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:58

input_format_parquet_enable_row_group_prefetch │ 1
input_format_parquet_max_block_size │ 65409
input_format_parquet_prefer_block_bytes │ 16744704

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:57

Может тогда стоит послушать Денни ?

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:55

Понял. А чё тогда памяти то не хватает )

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:52

Дак вы попробывали max_threads=1 ?

Читать полностью…

ClickHouse не тормозит

21 October 2025 17:48

да, предлагаю. Память у вас улетает, потому что КХ пытается разом проглотить 10005000 файлов

Читать полностью…

Subscribe to a channel