clickhouse_ru | Unsorted

Telegram-канал clickhouse_ru - ClickHouse не тормозит

11238

Обсуждаем ClickHouse

Subscribe to a channel

ClickHouse не тормозит

ClickHouse/ClickHouse tagged: v25.8.12.129-lts
Link: https://github.com/ClickHouse/ClickHouse/releases/tag/v25.8.12.129-lts
Release notes:

Release v25.8.12.129-lts

Читать полностью…

ClickHouse не тормозит

плюс стоит учесть ретраи, если они у вас есть

Читать полностью…

ClickHouse не тормозит

• Если internal_replication = true, при вставке в Distributed выбирается одна живая реплика шарда, туда пишутся данные, а дальше уже репликация делает Replicated*MergeTree.
• Если internal_replication = false (значение по умолчанию), Distributed сам пишет данные на все реплики шарда, и согласованность между ними не проверяется.

Читать полностью…

ClickHouse не тормозит

да, теперь все валидно, спасибо.

Читать полностью…

ClickHouse не тормозит

еще может быть async_insert без включённой дедупликации

Читать полностью…

ClickHouse не тормозит

еще дубликация у вас может быть на ретраях
смотрите
deduplicate_blocks_in_dependent_materialized_views

Читать полностью…

ClickHouse не тормозит

например
internal_replication = false (по умолчанию) — Distributed сам дублирует вставку на все реплики шарда, и их согласованность никем не контролируется, что как раз может приводить к расхождениям и дубликатам

https://clickhouse.com/docs/engines/table-engines/special/distributed#distributed-writing-data

Читать полностью…

ClickHouse не тормозит

Да, я его скинул. Вы про целевую таблицу куда вьюха вставляет, или дистрибьютед откуда читает?

Читать полностью…

ClickHouse не тормозит

ENGINE = Distributed(cluster, database, table[, sharding_key[, policy_name]])

вот тут есть ключ шардирования

Читать полностью…

ClickHouse не тормозит

дистрибуция как настроена?

Читать полностью…

ClickHouse не тормозит

то есть все же шарды?
и какой ключ шардирования?

Читать полностью…

ClickHouse не тормозит

по идее дистриб должен вставлять на одну реплику. Так что в теории вьюха должна срабатывать один раз на вставку. там точно не две вьюхи случайно повесились на одну таблицу или на дистриб и таблицу?

Читать полностью…

ClickHouse не тормозит

Есть у кого-то мысль что я делаю не так?

Читать полностью…

ClickHouse не тормозит

CREATE MATERIALIZED VIEW db.my_view ON CLUSTER 'my_cluster'
TO db.my_agg_table
AS SELECT
a,
b,
c
FROM db.my_other_table -- if here use my_other_table_all (_all is Distributed, everything works fine)
GROUP BY ALL;

Читать полностью…

ClickHouse не тормозит

Когда вьюха смотрит на Distributed Table, то переносит данные без дублей. Когда вьюха смотрит на физическую (хотел, чтобы данные по сети не гуляли), получаю 2 строки (итого х2 данных) в своей ReplicatedAggregatingMergeTree таблице.

Читать полностью…

ClickHouse не тормозит

Да, я уже почитал, к счастью на проде стояло true, я уже подумал что мы данные дублируем.

Читать полностью…

ClickHouse не тормозит

соответственно если сам пишет = вставляет во все реплики = срабатывает MV на всех репликах и задваивает

Читать полностью…

ClickHouse не тормозит

за опции в конфигах выше - почитаю

Читать полностью…

ClickHouse не тормозит

internal_replication у меня не прописано, на проде у нас стоит true. подозреваю что дело в этом

Читать полностью…

ClickHouse не тормозит

да, есть данные, они вставляются в 4 таблицы, по итогу я хочу собрать из тех 4 в одну аггрегацию по дням.

Читать полностью…

ClickHouse не тормозит

это как? вы пишите в одну дистрибуционную а читаете из другой?

Читать полностью…

ClickHouse не тормозит

Вставляет в rand(), читает из intHash64(some_field)

Читать полностью…

ClickHouse не тормозит

Я вставляю всего одну строку, но в табличке с Aggregate вижу две записи (которые в конце концов схлопываются в одну строку с х2 данных)

Читать полностью…

ClickHouse не тормозит

вопроса не понял, конфиг такой


<shard>
<replica>
<host>clickhouse01</host>
<port>9000</port>
</replica>
<replica>
<host>clickhouse02</host>
<port>9000</port>
</replica>
</shard>
<shard>
<replica>
<host>clickhouse03</host>
<port>9000</port>
</replica>
<replica>
<host>clickhouse04</host>
<port>9000</port>
</replica>
</shard>


Ключ шардирования у дистрибьютед - intHash64(some_field)

Читать полностью…

ClickHouse не тормозит

2 шарда, в каждом по две реплики.

Читать полностью…

ClickHouse не тормозит

а как связана Дистрибьютед с репликами?
Дистрибуцию обычно делают поверх шардов.

Можно и поверх нод являющихся репликами, но так вы просто дублируете операции вставки

Читать полностью…

ClickHouse не тормозит

Вставляю я всегда на одну (через Distributed), только вот результат разный, как будто вьюха вешается на обе реплики, и срабатывает дважды, на каждом сервере, у меня как раз 2 реплики в шарде.

Читать полностью…

ClickHouse не тормозит

Флоу с проблемой такой:


-> Insert into distributed -> Distributed Inserts to physical -> View reads from physical, inserts to physical -> Read from distributed, got x2 rows and x2 data


А нормально работает такой:

-> (Insert into distributed -> Distributed Inserts to physical) -> View reads from distributed, inserts to physical -> Read from distributed, got correct rows count and data

Читать полностью…

ClickHouse не тормозит

Осторожно , у нас жарко !

Читать полностью…

ClickHouse не тормозит

вообщем где был инсерт, на той реплике и MV сработает

Читать полностью…
Subscribe to a channel