Обсуждаем ClickHouse
а insert_quorum=N в связке KAFKA ENGINE -> MV не решит проблему реплиции на корню? Или в MV пихать не дает эту настройку?
Читать полностью…Нет. При обновлении версии (если обновлять плавно, без даунтайма) блоки могут застревать из-за новой версии формата данных, и они не будут реплицироваться, пока не обновятся все узлы. Также при любом скачке нагрузки, сбое сети и т.д. задержка может увеличиваться непредсказуемо
Читать полностью…Нет гарантии, когда блоки доедут, схема нерабочая
Читать полностью…Репликация асинхронная, так что инкремент точно работать надежно не будет
Читать полностью…🤖 Я позвал админов, а больше ничем не могу помочь.
Мне не выдали прав на удаление сообщений, поэтому у меня лапки.
Странно кипер создавался ,чтобы исключить недостатки зукипера
Читать полностью…Подскажите, а у clickhouse keeper или zookeper ? У меня clickhouse keeper просто дох, а с переходом на zoo стало лучше
Читать полностью…так в ClickHouse Cloud нет шардов, там один шард и отсюда все проблемы с размером первичного индекса в памяти и скоростью селектов и попыткой ускорить селекты выполняя запрос многими репликами
Читать полностью…Вроде альтинити и ClickHouse Cloud это никак не связанные вещи
Читать полностью…В 4 раза дешевле цены за диск. Траффик в одном регионе моего провайдера не тарифицируется, тарифицируются запросы. При размере файлов от 100 кб плата за запросы уже несущественна.
Читать полностью…По-моему гениально) Могу уточнить, какое количество файлов на s3 ?
Читать полностью…atop -r /var/log/atop/atop_20250601 -b 12:00 :)
Читать полностью…есть настройка max_replica_delay_for_distributed_queries (по умолчанию 300 сек)
If set, distributed queries of Replicated tables will choose servers with replication delay in seconds less than the specified value (not inclusive). Zero means do not take delay into account.
она говорит выбирать реплики у которых < max_replica_delay_for_distributed_queries delay на селект из дистрибьютед таблицы, так что можно ее выкрутить на минимум по идее, чтобы не было отставания при селекте
Нет гарантии, но как будто по вероятности 5-10 минут достаточно здоровому кластеру реплицироваться нормально в большинстве случаев?
Читать полностью…Благодарю, видимо нужно лаг делать по временному окну, чтобы дать данным "растечся"
Читать полностью…Всем привет, пытаясь со случайно реплики вычитать инкремент из распределенной таблицы в которую на каждый шард пишет MV из Kafka engine, может ли репликация на какой то реплике не успеть доставить строчки на другую (если вот вот во время чтения была запись из Kafka) с которой мы пытаемся вычитать?
Читать полностью…ClickHouse uses one of previous versions of CityHash from Google.
CityHash у гугла менялся раза 3, кх понятно не может себе такое позволить, он же персистентный.
ну и да разница есть, например clickhouse cityHash64 for integers falls back to intHash64
т.е. проще всего использовать другую хешфункцию
у clickhouse cloud конечно clickhouse keeper
Читать полностью…https://www.linkedin.com/company/altinity/ 11-50 employees
https://www.linkedin.com/company/clickhouseinc/ 201-500 employees
clickhouseinc в 10 раз больше чем altinity и у clickhouseinc valuation $6.35 billion
А кому доказывать то? История выхода КХ из Я общеизвестна же.
Читать полностью…у них цены я сейчас глянул в 3 раза дешевле чем в яндексе лол
Читать полностью…а его не альтинити разве держат? к рф он вроде отношения не имеет
Читать полностью…там запрос в сообщении поправлен
/channel/clickhouse_ru/423248
GROUP BY ALL в конец добавьте
А сколько вам обходится такое хранилище + трафик в месяц на гигабайт данных ?
Читать полностью…Для разбора какой процесс где срал в указанный период. Мониторинг этого не умеет. Некоторые datadog это умеет, но стоит космос. Вообщем учитывая бесплатность оттадача просто космос.
Читать полностью…