Telegram-канал clickhouse_ru - ClickHouse не тормозит: Неотсортированное

ClickHouse не тормозит

08 июня 2025 14:55

вооот.... тут мы и поняли что надо что-то с этим делать )

Читать полностью…

ClickHouse не тормозит

08 июня 2025 14:54

а Файнал как я понял будет очень дорогой, если в базе уже будут миллионы строк.

Читать полностью…

ClickHouse не тормозит

08 июня 2025 14:53

Не удаляются. Надо использовать FINAL - https://kb.altinity.com/altinity-kb-queries-and-syntax/altinity-kb-final-clause-speed/

Читать полностью…

ClickHouse не тормозит

08 июня 2025 14:48

1. Вместо FINAL можно использовать GROUP BY + функции вроде argMax(), но естественно тогда это вручную нужно прописывать

Читать полностью…

ClickHouse не тормозит

08 июня 2025 14:42

взял дэфолт конфигурацию на 3 реплики в clickhouse cloud
как энджин автоматом у всех таблиц SharedMergeTree

Читать полностью…

ClickHouse не тормозит

08 июня 2025 07:43

что показывает select * from system.clusters

Читать полностью…

ClickHouse не тормозит

08 июня 2025 05:43

Всем привет, вожусь с проблемой уже достаточно долго, но думаю, что решение элементарное
До этого всегда юзал оупенсурсный клик, сейчас решил попробовать Clickhouse Cloud + SharedMergeTree
Сделал сетап на 3 реплики, но проблема в том, что поехали все старые запросы.
Условно даже count(*) просто не тот, так как возвещает только кол-во строк на одном шарде (условно в таблице 170к, возвращается 2300)

Где можно почитать, что с этим делать? Заранее благодарен за ответ

Читать полностью…

ClickHouse не тормозит

07 июня 2025 18:33

Лимиты в целом штука очень нетривиальная для SQL баз почему-то

Читать полностью…

ClickHouse не тормозит

07 июня 2025 17:56

кликхаус не пробрасывает limit 10 на сторону MySQL - те он вычитывает все 6м записей. Пробрасывается только where. попробуйте where id = ? написать - должно моментально отработать как и в MySQL

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:56

ну тогда insert_quorum=число_реплик можно поставить и посмотреть не сильно ли начал лагать топик

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:52

а insert_quorum=N в связке KAFKA ENGINE -> MV не решит проблему реплиции на корню? Или в MV пихать не дает эту настройку?

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:35

Нет. При обновлении версии (если обновлять плавно, без даунтайма) блоки могут застревать из-за новой версии формата данных, и они не будут реплицироваться, пока не обновятся все узлы. Также при любом скачке нагрузки, сбое сети и т.д. задержка может увеличиваться непредсказуемо

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:31

Нет гарантии, когда блоки доедут, схема нерабочая

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:29

Репликация асинхронная, так что инкремент точно работать надежно не будет

Читать полностью…

ClickHouse не тормозит

07 июня 2025 10:50

⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠🤖 Я позвал админов, а больше ничем не могу помочь.

Мне не выдали прав на удаление сообщений, поэтому у меня лапки.

Читать полностью…

ClickHouse не тормозит

08 июня 2025 14:55

Это осуществляется фоновыми мержами, нет никакой гарантии, когда они запустятся

Читать полностью…

ClickHouse не тормозит

08 июня 2025 14:54

удаляются, проверяли, там на фоне видимо дефолтная политика бежит (мы сделали дефолтную инсталляцию) и через 4-5 минут старая строка удаляется из базы

Читать полностью…

ClickHouse не тормозит

08 июня 2025 14:49

вручную в смысле в самом квери по таблице? потом что там старые строки как показывает практика удаляется только в течени 4-10 минут

Читать полностью…

ClickHouse не тормозит

08 июня 2025 14:43

пересоздал инстансы, прогнал миграции снова и вроде бы починилось... не менял ничего абсолютно

Читать полностью…

ClickHouse не тормозит

08 июня 2025 14:41

Всем привет, я новичок с ClickHouse, есть вопрос:
У нас одна большая таблица в ClickHouse (ожидаются сотни миллионов строк), хотим избежать join'ов. Для реализации обновлений используем ReplacingMergeTree с колонкой version.
1. Как правильно забирать только последнюю версию строки по ключу (без использования FINAL в проде)? На самом деле задачи не вообще строку забрать а построить квери по всей таблице так, чтобы старые дубли были проигнорированы
2. Какие подводные камни у такого подхода на больших таблицах? Как избежать merge-затор, как поддерживать производительность?
3. Есть ли best practices по управлению размерами и скоростью фоновыми merge-ов?
Интересует опыт реального продакшна.

Читать полностью…

ClickHouse не тормозит

08 июня 2025 07:42

вы точно реплики сделали а не шарды?

вообще sharedmergetree никаких реплик не надо насколько я помню

Читать полностью…

ClickHouse не тормозит

07 июня 2025 18:36

Вот тут в pr написано почему все непросто https://github.com/ClickHouse/ClickHouse/pull/80070

Читать полностью…

ClickHouse не тормозит

07 июня 2025 18:03

ещё раз спасибо, нащел в документации
надо более внимательней читать
“The rest of the conditions and the LIMIT sampling constraint are executed in ClickHouse only after the query to MySQL finishes.”

Читать полностью…

ClickHouse не тормозит

07 июня 2025 17:55

Всем привет.
Создал таблицу используя ENGINE = MySQL
Таблица в 6M записей, проблема в том что если я делаю запрос на mysql стороне всё летает
select * from some_table limit 10;
а вот на стороне clickhouse всё как виснет, хотя есть другие таблицы в 2M записей читает быстро.
Может кто то сталкивался?
Спасибо

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:53

если в шард вставляете, то решит по идее, если не в шард, то есть insert_distributed_sync настройка, но наверное оно может затормозить вставку прилично

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:49

есть настройка max_replica_delay_for_distributed_queries (по умолчанию 300 сек)

If set, distributed queries of Replicated tables will choose servers with replication delay in seconds less than the specified value (not inclusive). Zero means do not take delay into account.

она говорит выбирать реплики у которых < max_replica_delay_for_distributed_queries delay на селект из дистрибьютед таблицы, так что можно ее выкрутить на минимум по идее, чтобы не было отставания при селекте

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:33

Нет гарантии, но как будто по вероятности 5-10 минут достаточно здоровому кластеру реплицироваться нормально в большинстве случаев?

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:30

Благодарю, видимо нужно лаг делать по временному окну, чтобы дать данным "растечся"

Читать полностью…

ClickHouse не тормозит

07 июня 2025 11:26

Всем привет, пытаясь со случайно реплики вычитать инкремент из распределенной таблицы в которую на каждый шард пишет MV из Kafka engine, может ли репликация на какой то реплике не успеть доставить строчки на другую (если вот вот во время чтения была запись из Kafka) с которой мы пытаемся вычитать?

Читать полностью…

ClickHouse не тормозит

06 июня 2025 23:02

ClickHouse uses one of previous versions of CityHash from Google.

CityHash у гугла менялся раза 3, кх понятно не может себе такое позволить, он же персистентный.

ну и да разница есть, например clickhouse cityHash64 for integers falls back to intHash64

т.е. проще всего использовать другую хешфункцию

Читать полностью…