Telegram-канал clickhouse_ru - ClickHouse не тормозит: Unsorted - каталог телеграмм

clickhouse_ru | Unsorted

Subscribe to a channel

Telegram-канал clickhouse_ru - ClickHouse не тормозит

11238

Обсуждаем ClickHouse

Subscribe to a channel

ClickHouse не тормозит

03 October 2025 19:58

мне помогли вот такие опции
"SET min_insert_block_size_rows = 0",
"SET min_insert_block_size_bytes = 0"

какие могут быть подводные камни,если у меня запрос будет работать раз в день добавляя по 100 тыс строк с этими опциями? Изначально много партов создастся, но вроде как они быстро фоново склеиваются

Читать полностью…

ClickHouse не тормозит

03 October 2025 19:28

Я пока только поймал виноватых по логам и перегрузка из временных, которых больше нет.

Так что нужно еще воспроизвести :)

Читать полностью…

ClickHouse не тормозит

03 October 2025 19:23

Да, пока версия что там в полях чуть ли не doc файлы.
Буду разбираться что там на такой банальщине так на ядра налегает

Читать полностью…

ClickHouse не тормозит

03 October 2025 15:02

там все время улучшают, но суть в том что DateTime64 это децимал и там в общем случае нужна точка (dot) , чтобы отделить дробную часть от целой части секунд
т.е. либо 1759496469.555 либо 2025-10-03 15:01:54.555
но в разных версиях по разному, КХ пытаются научить угадывать что имелось в виду под 1759496469555 -- это наносекунды или секунды, но это типа тут работает (insert values), а вот тут не работает (insert csv).

Читать полностью…

ClickHouse не тормозит

03 October 2025 14:27

Привет! Вставляю из другой базы в кликхаус таймстемпы
Поле в которое вставляю названо так же timestamp, тип данных выставил DateTime64(N)

При N от 3 до 8 данные вставляются, однако кастятся не верно
Дело в том, что таймстемпы даны с точностью до наносекунд (например 1642435541563013422) и для них N от 3 до 8 неверно интерпретируется.
Но при DateTime64(9) - появляется ошибка:

 Decimal math overflow: while converting source column timestamp to destination column timestamp: while executing 'FUNCTION _CAST(timestamp :: 6, DateTime64(9) :: 21) -> _CAST(timestamp, DateTime64(9)) DateTime64(9)

Согласно доке DateTime64(9) - должен работать. Прошёлся по чату - здесь вроде тоже такие примеры были. Был похожий вопрос в чате 4 года назад, но его решили через обновление версии КХ. У меня версия более поздняя чем в кейсе - 25.3. Так что я думаю, что я делаю что-то не так

Подскажите пожалуйста, куда стоит глянуть, чтобы понять в чем проблема?

Читать полностью…

ClickHouse не тормозит

03 October 2025 14:06

Тупо drop table ...??

Читать полностью…

ClickHouse не тормозит

03 October 2025 13:12

У нас самописный, если инсталляция одна и под одним VPN то достаточно Airflow. У нас много в разных регионах под разными VPN, по этому пришлось сделать свой

Читать полностью…

ClickHouse не тормозит

03 October 2025 13:09

а DLQ топик на кафке вы используете?

Читать полностью…

ClickHouse не тормозит

03 October 2025 13:07

https://kb.altinity.com/altinity-kb-integrations/altinity-kb-kafka/error-handling/

Читать полностью…

ClickHouse не тормозит

03 October 2025 13:00

скип индекс у меня в файловом кеше висит in its entirety (я надеюсь; памяти с запасом и я повторяю запрос пока время выполнения не выровняется по нижней границе). остаётся только его распаковать, если он запакован

а что за кеш? query condition? я не могу найти ничего про dedicated skip index cache.

гранулярность надо попробовать.. у меня колонка почти из конца списка order by, дальше только таймстемп, интуиция говорит что станет хуже (но что-то она подводит пока :D)

Читать полностью…

ClickHouse не тормозит

03 October 2025 12:55

та нет обычно никакой проблемы написать select так чтобы не было ошибок, для практически всего есть OrZero , OrNull
не можем распарсить, пишем Null или 0

Читать полностью…

ClickHouse не тормозит

03 October 2025 12:52

да (скип индекс дорого загружать с диска), помогает использовать либо кеш на skip индексы, либо гранулярность побольше, я недавно поменял у minmax скип индекса гранулярность с 10 на 100, так сразу буст и во времени анализа запроса и в использованном cpu (особенно порадовал cpu, раз в 10 меньше стало использоваться) (кеша на скип индексы в той версии еще нет)

Читать полностью…

ClickHouse не тормозит

03 October 2025 12:48

но селект с таким индексом работает медленнее, чем если его временно отключить

Читать полностью…

ClickHouse не тормозит

03 October 2025 11:58

обычно люди не хотят терять данные. Но если вам пофиг, то почему бы и нет

Читать полностью…

ClickHouse не тормозит

03 October 2025 11:54

Спасибо! Это вообще более-менее нормальная практика - ставить игнор ошибкам матвью?

Читать полностью…

ClickHouse не тормозит

03 October 2025 19:31

Причем вставка во временную таблицу 1с
А перегрузка из нее в основную таблицу 6с и утилизация ядер

Читать полностью…

ClickHouse не тормозит

03 October 2025 19:26

В новых кх клиентах если пробел нажать профайлер показывает

Читать полностью…

ClickHouse не тормозит

03 October 2025 19:21

Не знаю, я бы попробовал выгрузить в csv файл и загрузить из файла и посмотреть сколько инсерт из файла ест.

Читать полностью…

ClickHouse не тормозит

03 October 2025 14:32

for future reference: в пару к index_mark_cache_size, есть метрика IndexMarkCacheBytes, чтобы понять не пора ли его бампнуть

Читать полностью…

ClickHouse не тормозит

03 October 2025 14:12

@den_crane в чате не хватает реакций конечно. большое агрегированное спасибо за ваши рассказы!

Читать полностью…

ClickHouse не тормозит

03 October 2025 14:06

Коллеги, подскажите пожалуйста!!. Какие действия для удаления таблицы?. Была таблица репликации. Её переименовали. Её надо грохнуть

Читать полностью…

ClickHouse не тормозит

03 October 2025 13:10

ага, вариант со скриптом по таймеру в голову приходил - получается, тоже рабочий вариант. а кстати, раз уж пошло (это у нас отдельная тема изысканий, простите 😁) - а шедулер какой используете?

Читать полностью…

ClickHouse не тормозит

03 October 2025 13:08

Примерно так, но я еще ставлю один MV вначале, который тупо вычитыввет топик.
Дальше в зависимости от нагрузки, либо как тут показано через два мат вью, либо вообще тупо скриптом по таймеру перекладываю и обрабатываю ошибки.
Если нагрузка небольшая, скрипт стабильнее и легче модифицировать

Читать полностью…

ClickHouse не тормозит

03 October 2025 13:03

а хотя он включен по дефолту
select * from system.server_settings where name like 'index_mark_cache_size';

Читать полностью…

ClickHouse не тормозит

03 October 2025 12:58

Полностью согласен. Мы и источник, к сожалению, не до конца контролируем, и парсинг не всегда делается умелыми специалистами. Сейчас вводим код-ревью и обязательное применение ...OrZero и подобного. Но хотелось бы и вот с этой стороны подстраховаться.

Читать полностью…

ClickHouse не тормозит

03 October 2025 12:54

подскажите, а как вы отвязали ошибки матвью от вычитки?

Читать полностью…

ClickHouse не тормозит

03 October 2025 12:50

это ожидаемо, особенно если индекс не на лидирующее поле, из pk индекса нельзя узнать последнее значение в грануле, только первое

Читать полностью…

ClickHouse не тормозит

03 October 2025 12:47

что-то у меня на индексы никак не отрастёт интуиция.

ожидание: если у меня есть колонка в первичном ключе, добавление minmax индекса по ней-же не будет прюнить гранулы никак,
реальность:

Читать полностью…

ClickHouse не тормозит

03 October 2025 11:55

вот не совсем понимаю, почему нет. Вы не могли бы чуть пояснить? Разве будет плохо, если мы отвяжем этап парсинга от этапа вычитки и первичного сохранения?

Читать полностью…

ClickHouse не тормозит

03 October 2025 11:38

Я складываю каждую строку отдельно как json, а потом через мат вью перекладываю в нормальную структуру и формирую DLQ через второй мат вью.

Читать полностью…

Subscribe to a channel