cryptovalerii | Криптовалюты

Telegram-канал cryptovalerii - Время Валеры

23002

Мне платят за то, что я говорю другим людям что им делать. Автор книги https://www.manning.com/books/machine-learning-system-design https://www.linkedin.com/in/venheads

Подписаться на канал

Время Валеры

Нашел профессию будущего
Machine Unlearning Engineer

Читать полностью…

Время Валеры

3 июля поговорим в режиме онлайн почему ML System Design сломан

Читать полностью…

Время Валеры

Ещё одного из списка Форбс 30 до 30 арестовали на днях

Очень сильная фича
Твит со списком всех бедодаг

Читать полностью…

Время Валеры

Когда я читал что Франция очень переживает свое технологическое отстаивание в гонке стартапов и AI я думал, что же они сделают?

Неужели станут чаще привлекать иностранцев и наконец то перестанут делать вид что не говорят по английски?

Все оказалось хуже

Трем местным, умным пацанам (работали до недавнего в Гугле/Фб), у которых нет продукта, а стартапу 4 недели и ещё только начинают нанимать уже дали 105 млн евро

Пацаны умные, поэтому под это дело уже продали половину своего стартапа, ведь половина от нуля через 5 лет это ноль, а миллионы евро сейчас - это хорошо

В твиттере обсуждают вайб веб 3.0

P.S. прочитал что они собираются делать на их сайте и стало ещё грустнее, говорят что в 2024 обучим нашу генеративную текстовую модель и будем думать как сделать AI полезным

Может быть это чей то троллинг и СЕО по имени Артур Человек (Mensch), а так же француз Тимоти Лакросс дают надежду на то что фаундеры сгенерированы

Читать полностью…

Время Валеры

Пришло время рассказать про мега простынку, которую купил в середине апреля

Однозначно лучшая покупка года, последний раз я так радовался три года назад - покупке термоса на Амазоне, который мне отлично зашёл, но термос и стоит в 125 раз меньше

Эффект простыни я почувствовал в первый же день, после вечерних занятий по джиу джитсу. Обычно после того как меня вечером изобьет тренер, я плохо засыпаю и неважно восстаналвиваюсь - простыня остановила этот беспредел, теперь я восстаналвиваюсь нормально и как результат, вместо 4-5 персональных занятия по БЖЖ в неделю, их стало 6-9

В целом тяжело передать кайф от постоянно прохладной простыни под тобой, которая к тому же может выдасть твои показатели восстановления и сна и подстраивает в режиме автопилота температуру под тебя, чтобы максимизировать эффект.

Отдельно мне понравилась функция теплового будильника, простыня за 15 минут до момента просыпания нагревается до 40 градусов, чем будит меня.

Читать полностью…

Время Валеры

Прочитал неплохую статью про новую систему левелов в Shopify - Inside Shopify's Leveling Split: Exclusive

Если кратко - и что видно на картинке превью, добавили еще одну ось - Mastery
Например ты можешь быть Staff Engineer и быть крутым на этом уровне и дальше перед тобой стоит выбор, идти на уровень выше, но тогда ты там уже не крутой, а просто обычный типан или расти и становиться гуру, но на своем уровне.

Идея интересная и разумная, потому что действительно, есть ряд людей, которых вроде как и повысить можно, а вроде как и не нужно. Ведь тогда вместо пользы в виде своей глубокой экспертизы на текущем уровне, они вынуждены будут становиться клеем для абстракции более высокого уровня, а нужны и те и те. Поэтому хочется им денег накинуть, а как это сделать без промо, не всегда понятно - поэтому и повышают бедолаг. Теперь можно повышать по деньгам, но не по уровню, за мастерство.

Тонко - интересно будет посмотреть - основную сложность вижу в еще одной калибровке, теперь по мастерству - а калибровка это всегда большой оверхэд

Из интересного - в компании появляются волшебники (впрочем в какой большой компании их нет?)

The concept of “wizards” is interesting. Mastery scores do not stop at 50; individuals can be assigned a mastery score that exceeds 50. Getting a score above this level makes someone a “wizard,” and needs exceptional justification. The general expectation is that wizards will be incredibly rare.

Остальное по мелочи - подрезали менеджеров (кто же против?) и рассказывают про компенсацию ( у шопифай интересная тема - что можно самому выбирать сколько стоков и сколько кэша получать - менять пропорцию в рамках своего компа)

В целом - интересно

Читать полностью…

Время Валеры

3-5 лет назад внутренне сокрушался, от того что Форбс не пришел ко мне и не поставил во главу списка 30 до 30

Сегодня прочитал статью от Guardian - что это мол сильная фича, сигнализирующая о вероятном приближении казенного дома
Много думал

Читать полностью…

Время Валеры

Говорят наша книга вошла в лист топ-10 новых релизов

I wanted to give you some exciting and good news; your book was on Manning's Top 10 Titles list last week, making it one of the most popular and best-selling releases in our catalog.


This is a great achievement and something that you should celebrate with your network.

С другой стороны эти же люди недавно сказали что надо бы продать чуть больше копий за оставшееся до 5 недель с релиза время, чтобы они были довольны

Поэтому покупайте книгу сейчас. Помните, книга - лучший подарок.

Читать полностью…

Время Валеры

Вышло продолжение ответов на вопросы про А/B тесты, ниже анонс от Карпов Курсес:

Всегда ли для проверки гипотезы необходимо использовать A/B-тест? Можно ли сравнивать попарно несколько разных категорий пользователей? Какие есть подходы к повышению чувствительности A/B-тестов? 

На эти и ещё более узконаправленные вопросы, которые вы задавали Валерию Бабушкину, ответим сегодня во второй части «10 вопросов»

Читать полностью…

Время Валеры

Прочитал небольшую статью Neural Networks are Decision Trees.

Краткая идея простая - we have shown that neural networks can be equivalently represented as decision trees. The tree equivalence holds for fully connected layers, convolutional layers, residual connections, normalizations, recurrent layers and any activation.

Приводят алгоритм как сконвертировать сетку в дерево. В целом, почему бы и нет? Полезного особо не вижу, но удивить друга вполне можно

Читать полностью…

Время Валеры

Видео второго стрима, в котором мы узнаем про секреты тайм-менеджмента Игоря

Читать полностью…

Время Валеры

Хочу поделиться ссылкой на Шаблон документа для дизайна ML-систем от телеграм-канала Reliable ML

Насколько я понял, Ира железной рукой насаживает этот шаблон как стандарт в учебной системе для молодых МЛщиков, хотя мы с Игорем знаем, что никаких молодых МЛщиков не будет

Читать полностью…

Время Валеры

Случилось то, чего я долго ждал, в ранний доступ вышла наша с Арсением книга: Machine Learning System Design With end-to-end examples

Сейчас доступны первые 5 глав (в черновиках есть еще 8), каждую вторую неделю планируем выкладывать по новой главе и править опечатки в выложенных.

Скидка на книгу до 9 мая: MEAP launch code: mlbabushkin (45% off Machine Learning System Design in all formats)

Читать полностью…

Время Валеры

Читаю старую статью про churn prediction из 2016 года. Статья отличная, так как я проповедаю практически тоже самое + еще кое-что сверху. Цитата:

The last point is the most important one. One can argue that ‘churn’-modeling is something you should only be doing if you’re in a clear-cut subscription based service. Even then it might be hard. The Netflix-class action lawsuit, where shareholders felt mislead over reported churn-rates, showed that all stakeholders seems to be confused about how to define churn. The court even dropped the case concluding that there’s no official definition of it.

Читать полностью…

Время Валеры

Второй стрим с Игорем проведем 27 апреля в 15 по Лондону.

В прошлый раз поговорили про рефлексию языковых моделей, немного про алайнмент(нужно развить тему дальше), автономных агентов и неполную модель мира. Так же затронули нечеловеческие условия работы на заводах в викторианскую эпоху и сходство между генеративным контентом и космическим мусором. Даже страшно представить что бы мы обсуждали, будь у Игоря высшее образование, благо у нас была затронута только четверть из подготовленного

Читать полностью…

Время Валеры

Начинаем стрим https://www.youtube.com/watch?v=6YBMU6475KQ

Читать полностью…

Время Валеры

Мой друг открыл в Сербии компанию, которая помогает легализоваться и спокойно жить без визаранов и прочих неудобств.
ООО, ИП, ВНЖ, счета в банке - всё и сразу

Подробности на сайте, в инстаграммее или в телеге у @relocom_serbia

P.S. Я ждал примерно две недели, прежде чем опубликовать и подумал что события прошедших выходных - явный знак

Читать полностью…

Время Валеры

Выиграл награду в рамках AI Summit London, спасибо всем причастным

Valerii Babushkin, VP for data science at Blockchain.com took home the Solution Provider of the Year award, which recognizes individuals who have demonstrated passion, skills, and world-class expertise in developing an AI technology or solution.

Вспоминаются строчки Высоцкого:
Мне руку поднял рефери,
Которой я не бил.

Читать полностью…

Время Валеры

Ну что сказать, молодец премьер министр новый, кажется так и создается правильный инвест климат и AI и Web3 и Финансы. Даже предсказанная рецессия отменяется: The International Monetary Fund no longer expects Britain's economy to fall into a recession this year, it said on Tuesday, praising the steps taken by Britain's government to stabilise the economy and fight inflation.23 May 2023

Кратко - самый большой фонд в мире на AI Safety - договорились с тремя лидирующими компаниями получать ранний приоритетный доступ к моделям
A16Z - открывает первый (по моему) офис за рубежом
Ну и и в дополнение ЮК увеличило отрыв еще больше по стартапам в Европе

Читать полностью…

Время Валеры

Что за день 7 июня

Deepmind утверждает что с помощью RL нашли алгоритмы для ускорения сортировки. New algorithms will transform the foundations of computing

AlphaDev uncovered new sorting algorithms that led to improvements in the LLVM libc++ sorting library that were up to 70% faster for shorter sequences and about 1.7% faster for sequences exceeding 250,000 elements.

AlphaDev not only found faster algorithms, but also uncovered novel approaches. Its sorting algorithms contain new sequences of instructions that save a single instruction each time they’re applied. This can have a huge impact as these algorithms are used trillions of times a day.

Еще затронули скорость хэш функций

We applied AlphaDev to one of the most commonly used algorithms for hashing in data structures to try and discover a faster algorithm. And when we applied it to the 9-16 bytes range of the hashing function, the algorithm that AlphaDev discovered was 30% faster.

Теперь осталось понять, так ли это, ребята авторитетные, но и понимать бы с чем что сравнивали и в каких условиях

Читать полностью…

Время Валеры

Немного разочаровался сегодня в алгоритмах oura Ring

У меня относительно низкий пульс, ночью во время сна он обычно 50-45. Сегодня нижняя точка составила 40.

Так как эта точка в 40 была достигнута к концу сна, кольцо сообщило что мне капец, ведь мой пульс долго приходил в норму ( с 50 в начале до 40 в конце), мой readiness score - 74 и лучше сегодня не двигаться. Но если убрать последние три часа сна - readiness score резко растет до 82 и кольцо пишет - все ништяк молодец! (Ведь нижняя точка теперь другая )

Вот такая техническая шизофрения из мира анализа данных

Читать полностью…

Время Валеры

Товарищ наткнулся на мою дискуссию в LinkedIn касаемо ужасов прослушивающих нас аппараты и на основе его комментария решил выложить, в комментариях выложу текстом

История про системдизайн сторону подслушивания для рекламы вотсапом, которую ты написал в Linkedin- это вообще топовый пост для твоего канала.
Как минимум хочется в закладки добавить и кидать сразу всей пастой в друзей, которые начинают со мной говорить об этом


В моем ответе ошибка/оговорка, не tts, но stt (speech to text)

Читать полностью…

Время Валеры

Прочитал блогпост Coinbase: Scaling Experimentation for Machine Learning at Coinbase. Хорошо, что я больше не работаю в Blockchain.com, иначе бы сказали, что ругаю конкурента, но блог пост позорный, уровень информативности и нововведений практически нулевой. Настолько, что мне даже нужна помощь, может быть я просто что-то пропустил или не понял? Но начальное заявление : we've built a uniquely elegant approach that combines universes with simple configurations for our ML engines

Не бьется с тем что дальше рассказывают - неслыханное дело, дошли до такой истории как бакеты и что самое смешное, чуваки даже не знают про пересолку:

Hashing in a universe is quite similar to hashing in a split test, using the following formula:
slot_num = hash(universe_name + universe_version + user_id) % num_slots
However, one important aspect to consider is that universe hashing remains consistent over time. This means that historical tests might have a slight influence on the results of future tests. For instance, if a test in slot 1 performs poorly and causes all new users to stop using the app, future tests in that slot could be negatively affected.
To address this issue, we use the "universe version" to allow for rehashing the entire universe when no experiments are running. We've also explored a more advanced technique called "hashing on demand." In this approach, creating a new slot pulls a user group randomly from the entire unused user space rather than from a pre-allocated space. When the slot is emptied, the user group is then returned to the unused user space.

В свое время с @opaOz в Яндексе пересаливаемый конвеер на 1000 бакетов занял у нас целую неделю на имплементацию (вместе с дизайном) и делали сколько угодно экспов в месяц.

На мега платформе coinbase теперь могут гонять до 14 экспериментов в месяц! (пиковое значение)
Еще как мне кажется, чуваки не используют разные слои, хотя на слайде есть Function layer - в тексте про это ни слова

В целом понятно, написали потому что нужно промо, но если я вдруг что-то пропустил, напишите в комментах как я не прав

Читать полностью…

Время Валеры

Через 25 минут поговорим здесь про ML System Design на русском, вопросы и ответы. Вход свободный

Читать полностью…

Время Валеры

Когда я только переехал в Лондон, у меня был план. Согласно плану если после первого года жизни мне там нравится, я делаю визу Global Talent и получаю бессрочный вид на жительство не через 5, а через 3 года. Так я и поступил, в декабре 2021 года обратился к ребятам из Immigram, которые все сделали за меня - от меня было только 3-4 раза поговорить с ними по видео и рассказать какой я классный. В начале мая 2022 года получил свою визу.

Не думаю что кто-то удивился , узнав что в 2022 году спрос ну услуги Immigram и любой другой конторы, помогающий с визами вырост в десятки из раз от людей из Росси, Украины и Беларуси.
Понятное дело, пропускная способность настолько не выросла, отсюда изменилась и скорость работы.

Они проанализировали свои сотни успешных и не очень кейсов и на их базе выкатили платформу где можно самостоятельно собрать себе кейс на Global Talent не занося деньги никаким юристам (непонятно правда в чем тут их выгода). Говорят, что О1 идет следом и уже в разработке.

Сегодня они запустились с ней на Product Hunt - и им нужна поддержка.

Читать полностью…

Время Валеры

# Рецензия: Machine Learning System Design

Валерий Бабушкин и Арсений Кравченко выпустили в early access книгу про дизайн ML систем. До 9 мая можно получить скидку 45% по промокоду mlkravchenko.

Мне повезло получить копию для рецензии, я прочитал и презентую вам свой отзыв.

Первым делом спойлер: это не про MLOps! Многие могли подумать, что в книге будут учить строить пайплайны на Spark, или оптимизировать инференс нейросетей или что-то в таком духе. Нет. Эта книга про более важный вопрос: как сделать, чтобы ML проект не оказался на полке?

Вот как авторы определяют ML System Design:
> MACHINE LEARNING SYSTEM DESIGN is a complex, multistep process of designing, implementing, and maintaining machine learning-based systems that involves a combination of techniques and skills from various fields and roles

То есть книга о том, как строить ML системы от идеи до планирования до реализации до мониторинга и развития. Сейчас доступны пять глав из шестнадцати. Они покрывают три темы: введение в ML System Design, создание дизайн документа, выбор метрик.

Авторы рассматривают вопросы на верхнем уровне. Лишь иногда вдаются в детали для иллюстрации общих идей. Это хорошо работает, потому что для решения вопросов вроде “как понять, какую систему надо построить?” примеры с кодом не нужны. Особенно ценно, что каждая рекомендация сопровождается реальным кейсом из опыта авторов.

Кому подойдет эта книга? Middle ML инженерам, которые хотят вырасти с уровня реализации фич до уровня стратегического планирования. Senior ML инженерам и тимлидам как настольная книга.

Кому она не подойдет? Я считаю, что она не для начинающих: слишком высокий уровень абстракции. Так же она требует базовых знаний про ML инжиниринг в индустрии, или хотя бы понимания, зачем он нужен.

Лично я даже прочитав доступные пять глав почерпнул для себя много полезного. Например, в книге описано как создать дизайн документ системы. Это лучший подход к сбору требований к ML решению, что я видел. Я буду применять это в работе на текущем проекте. Подводя итог, я думаю, что скоро описанное в книге станет стандартом индустрии.

Напомню, что это рецензия лишь на первые пять глав. Дальше авторы обещают больше хардкора. Книгу можно найти здесь, промокод для скидки 45% mlkravchenko.

@boris_again

Читать полностью…

Время Валеры

Пост для комментов по второму стриму

Читать полностью…

Время Валеры

По многочисленным просьбам продолжение стрима будет 27 апреля, но не в 15, а в 18 по Лондону

Читать полностью…

Время Валеры

Подоспело и видео со стрима

Читать полностью…

Время Валеры

Пост для комментариев по стриму

Читать полностью…
Подписаться на канал