clickhouse_ru | Unsorted

Telegram-канал clickhouse_ru - ClickHouse не тормозит

11238

Обсуждаем ClickHouse

Subscribe to a channel

ClickHouse не тормозит

Чем лучше? Тоже самое и будет, только геммороя больше

Читать полностью…

ClickHouse не тормозит

1. Важно не злоупотреблять DELETE/UPDATE. Запускайте их батчами и нечасто. IN PARTITION - это правильно. Вот специально для того что вы спрашиваете и придумали.
2. Пора уже заканчивать с извращениями типа ALTER UPDATE/DELETE и переползать на PATCH UPDATE/DELETE

Читать полностью…

ClickHouse не тормозит

В данный момент update, но, если правильно помню, delete так же себя ведёт.

Читать полностью…

ClickHouse не тормозит

а это у вас alter table update или alter table delete?

Читать полностью…

ClickHouse не тормозит

Казалось бы, поменять местами действия - проверку и клонирование - и вот. Но чужую работу оценивать легко, да. Буду ждать. Спасибо.

Читать полностью…

ClickHouse не тормозит

in partition достаточно удобно. Просто странно, зачем и почему кликхаус пытается резервировать место под парты, которые гарантированно не содержат нужных данных.

Читать полностью…

ClickHouse не тормозит

ну в общем ваше дело, просто выбрать из пяти плохих опций, минимально плохую

* макс. размер куска был например 30ГБ
* mdraid
* s3
* не делать мутации
* использовать in partition (найдя нужные партиции)

Читать полностью…

ClickHouse не тормозит

s3 (150-200Mb/s) - это время выполнения запроса "никогда". К старым данным бывают обращения.
То, что можно - на s3 копируется и дропается.

Читать полностью…

ClickHouse не тормозит

на тестах чего? мои кадры просто смотрят как "на тестах кх рвёт в пг в чистую", и у них формируется в голове картина, что это такой современный быстрый пг.

потом с удивлением узнают, что транзакций нет, атомарности нет, гарантий нет. потом выясняется, что если дёргать из клика по десять строк много много раз в секунду, то он работает медленнее чем постгрес. очередь с задачками на кликхаусе у них тоже как-то почему-то не очень летит.

Читать полностью…

ClickHouse не тормозит

ну и конечно надо тупо mdraid делать на все диски, вместо использования кх disks

Читать полностью…

ClickHouse не тормозит

Ну, само - не появится(у нас много дисков по 16 Тб), приходится или держать запас на каждом по х2 от самого жирного куска, или гонять их по дискам туда-сюда.

Читать полностью…

ClickHouse не тормозит

это ожидаемое поведение, не надо с этим бороться, место появится со временем, и ретраи успешно завершатся

Читать полностью…

ClickHouse не тормозит

Есть табличка на merge tree, partition by toYYYYMM(timestamp).
Если применять к ней ALTER TABLE ... WHERE toYYYYMM(timestamp) = <конкретный месяц>, тем не менее создаётся мутация для каждой партиции за всю историю.
Те, в которых нет нужного таймстемпа, пролетают быстро, но выделение места при этом обязательно должно произойти. Если на диске нет нужного резерва - оно ретраится с ошибкой.
Вопрос: можно с этим бороться чем-то, кроме IN PARTITION? В партах с другим toYYYYMM(timestap) ведь никогда не может быть данных с неправильным месяцем.

Читать полностью…

ClickHouse не тормозит

Потому что даже в пг в связи все равно не смогут. Акхем

Читать полностью…

ClickHouse не тормозит

https://github.com/duckdb/pg_duckdb

Читать полностью…

ClickHouse не тормозит

если речь про партицию, то не лучше ли взять ее целиком в другую таблицу, изменить, а потом присоединить обратно?

Читать полностью…

ClickHouse не тормозит

да, но для delete можно по логике заюзать soft delete, а потом просто в момент, когда вы точно знаете, что резерв дисков есть, запускать apply deleted mask

Читать полностью…

ClickHouse не тормозит

объясните им один раз разницу между oltp и olap, сэкономите себе и им кучу времени и списки обманутых ожиданий в будущем )

Читать полностью…

ClickHouse не тормозит

так в том то и проблема, что клонирование безусловно обязательный шаг, даже если менять парт не надо, и мы знаем заранее что менять не надо.
т.е. скорее можно резервировать место как-то более умнее, лениво, и возможно ронять мутацию текущего парта, потому что места на самом деле нет (оно закончилось на ходу из-за того что идет мутация другого парта).

но тут тоже проблема, начались 10 тяжелых мутаций, дошли до середины, все упали.

Читать полностью…

ClickHouse не тормозит

а он не знает заранее, что там не нужных данных, так мутации устроены, и по другому не сделать для просто mergetree таблиц (точнее можно сделать, но алгоритм слишком сложен, и там pr уже 3 года не могут доделать)

Мутируют все парты, резервируется место, парт клонируется используя хардлинки, мутация начинает проверять какие файлы надо поменять, меняет если надо, присоединяет новый парт, убирает старый парт.

Читать полностью…

ClickHouse не тормозит

Я в курсе, спасибо. Пойнт не в том что кто-то из них плох или хорош, а в том что для каждого дела свой инструмент.

Читать полностью…

ClickHouse не тормозит

А вы не путайте тесты с эксплуатацией) на самом деле в пг тоже есть специфика, всякие статистики, вакумы. Надо просто пожить с этим👍

Читать полностью…

ClickHouse не тормозит

а не проще s3 использовать для старых партиций если у вас aws?

Читать полностью…

ClickHouse не тормозит

Из mdraid выкидывать диски при освобождении не очень удобно. И для aws ebs кажется избыточным.

Читать полностью…

ClickHouse не тормозит

ну поставьте тогда чтобы макс. размер куска был например 30ГБ

Читать полностью…

ClickHouse не тормозит

и IN PARTITION кстати работает только для replicated таблиц

Читать полностью…

ClickHouse не тормозит

А если без toYYYYMM, просто timestap>=дата and timestap<дата

Читать полностью…

ClickHouse не тормозит

Настроить ПГ и запрос

Читать полностью…

ClickHouse не тормозит

Брать постгрес и не Ебать себе мозг

Читать полностью…

ClickHouse не тормозит

Не слушать подобные консультации 😁

Читать полностью…
Subscribe to a channel