Мне платят за то, что я говорю другим людям что им делать. Автор книги https://www.manning.com/books/machine-learning-system-design https://venheads.io https://www.linkedin.com/in/venheads
Вышла запись нашего с Арсением интервью по поводу книги
Читать полностью…Поехали
https://youtube.com/live/Ow88hoEnsq8?feature=share
Прочитал статью DISCOVERING LATENT KNOWLEDGE IN LANGUAGEMODELS WITHOUT SUPERVISION
Авторы статьи сделали ряд неожиданных предположений и предложений:
1. Вероятности ответов Да и Нет на один и тот же вопрос (имеющий только один правильный ответ из этих двух вариантов) - должны суммировать в единицу
2. Создаем набор из пар вопросов и ответов, где вопрос повторяется два раза, ответ же Да в одном случае и нет в другом
3. Забираем из модели активации которые генерируются при каждом из вариантов
4. Делаем такой лосс чтобы эти активации выдавали вероятности (после накладывания некоторой матрицы параметров) и суммировались в единицу для каждой пары (и еще учитываем уверенность, чтобы избежать модели дегенерата, которая будет всегда говорить - не все так однозначно, всей правды мы не узнаем и выдавать вероятность в 0.5 на любой вопрос и ответ Да/Нет)
5. Ну и все - обучили сеть из которой можно вытаскивать ответы да/нет, правда очевидно что может сработать не сразу и нужно будет умножать ответ на - 1 (вдруг она да в ноль будет скидывать, а нет в единицу).
Говорят что решили и это ( Technically, we also need to determine whether p˜(qi) > 0.5 corresponds to “Yes” or “No,” as this isn’t specified by LCCS. For simplicity in our evaluations we take the maximum accuracy over the two possible ways of labeling the predictions of a given test set. However, in Appendix A we describe how one can identify the two clusters without any supervision in principle by leveraging conjunctions.) но в апендикс я понятное дело не лез.
Пишут что всех порвали (среди zero shot подходов) и даже дают код
В целом годное чтиво
В четверг 13 июля в 19 часов по мск вместе с @JustStas поговорим про построение модели Marketing Mix с помощью библиотеки Robyn.
Расскажем, как она работает и чем применение на практике отличается от теории.
Серия постов про Robyn тут.
Нашел профессию будущего
Machine Unlearning Engineer
3 июля поговорим в режиме онлайн почему ML System Design сломан
Читать полностью…Ещё одного из списка Форбс 30 до 30 арестовали на днях
Очень сильная фича
Твит со списком всех бедодаг
Когда я читал что Франция очень переживает свое технологическое отстаивание в гонке стартапов и AI я думал, что же они сделают?
Неужели станут чаще привлекать иностранцев и наконец то перестанут делать вид что не говорят по английски?
Все оказалось хуже
Трем местным, умным пацанам (работали до недавнего в Гугле/Фб), у которых нет продукта, а стартапу 4 недели и ещё только начинают нанимать уже дали 105 млн евро
Пацаны умные, поэтому под это дело уже продали половину своего стартапа, ведь половина от нуля через 5 лет это ноль, а миллионы евро сейчас - это хорошо
В твиттере обсуждают вайб веб 3.0
P.S. прочитал что они собираются делать на их сайте и стало ещё грустнее, говорят что в 2024 обучим нашу генеративную текстовую модель и будем думать как сделать AI полезным
Может быть это чей то троллинг и СЕО по имени Артур Человек (Mensch), а так же француз Тимоти Лакросс дают надежду на то что фаундеры сгенерированы
Пришло время рассказать про мега простынку, которую купил в середине апреля
Однозначно лучшая покупка года, последний раз я так радовался три года назад - покупке термоса на Амазоне, который мне отлично зашёл, но термос и стоит в 125 раз меньше
Эффект простыни я почувствовал в первый же день, после вечерних занятий по джиу джитсу. Обычно после того как меня вечером изобьет тренер, я плохо засыпаю и неважно восстаналвиваюсь - простыня остановила этот беспредел, теперь я восстаналвиваюсь нормально и как результат, вместо 4-5 персональных занятия по БЖЖ в неделю, их стало 6-9
В целом тяжело передать кайф от постоянно прохладной простыни под тобой, которая к тому же может выдасть твои показатели восстановления и сна и подстраивает в режиме автопилота температуру под тебя, чтобы максимизировать эффект.
Отдельно мне понравилась функция теплового будильника, простыня за 15 минут до момента просыпания нагревается до 40 градусов, чем будит меня.
Прочитал неплохую статью про новую систему левелов в Shopify - Inside Shopify's Leveling Split: Exclusive
Если кратко - и что видно на картинке превью, добавили еще одну ось - Mastery
Например ты можешь быть Staff Engineer и быть крутым на этом уровне и дальше перед тобой стоит выбор, идти на уровень выше, но тогда ты там уже не крутой, а просто обычный типан или расти и становиться гуру, но на своем уровне.
Идея интересная и разумная, потому что действительно, есть ряд людей, которых вроде как и повысить можно, а вроде как и не нужно. Ведь тогда вместо пользы в виде своей глубокой экспертизы на текущем уровне, они вынуждены будут становиться клеем для абстракции более высокого уровня, а нужны и те и те. Поэтому хочется им денег накинуть, а как это сделать без промо, не всегда понятно - поэтому и повышают бедолаг. Теперь можно повышать по деньгам, но не по уровню, за мастерство.
Тонко - интересно будет посмотреть - основную сложность вижу в еще одной калибровке, теперь по мастерству - а калибровка это всегда большой оверхэд
Из интересного - в компании появляются волшебники (впрочем в какой большой компании их нет?)
The concept of “wizards” is interesting. Mastery scores do not stop at 50; individuals can be assigned a mastery score that exceeds 50. Getting a score above this level makes someone a “wizard,” and needs exceptional justification. The general expectation is that wizards will be incredibly rare.
Остальное по мелочи - подрезали менеджеров (кто же против?) и рассказывают про компенсацию ( у шопифай интересная тема - что можно самому выбирать сколько стоков и сколько кэша получать - менять пропорцию в рамках своего компа)
В целом - интересно
3-5 лет назад внутренне сокрушался, от того что Форбс не пришел ко мне и не поставил во главу списка 30 до 30
Сегодня прочитал статью от Guardian - что это мол сильная фича, сигнализирующая о вероятном приближении казенного дома
Много думал
Говорят наша книга вошла в лист топ-10 новых релизов
I wanted to give you some exciting and good news; your book was on Manning's Top 10 Titles list last week, making it one of the most popular and best-selling releases in our catalog.
This is a great achievement and something that you should celebrate with your network.
С другой стороны эти же люди недавно сказали что надо бы продать чуть больше копий за оставшееся до 5 недель с релиза время, чтобы они были довольны
Поэтому покупайте книгу сейчас. Помните, книга - лучший подарок.
Вышло продолжение ответов на вопросы про А/B тесты, ниже анонс от Карпов Курсес:
Всегда ли для проверки гипотезы необходимо использовать A/B-тест? Можно ли сравнивать попарно несколько разных категорий пользователей? Какие есть подходы к повышению чувствительности A/B-тестов?
На эти и ещё более узконаправленные вопросы, которые вы задавали Валерию Бабушкину, ответим сегодня во второй части «10 вопросов»
Вышло записанное некоторое время назад интервью
Обсуждаем:
1.Артура Человека и мои душевные терзания по этому поводу
2. Игоря и стартапы, Прекрасную Мета Россию будущего
3. Сильных пацанов
4. Кто важнее - старший или главный начальник
5. Этику AI
6.Краткий период в жизни, в который можно нормально поработать - и многое другое
21 июля 18:00 по мск “Валерий Бабушкин, Арсений Кравченко: Интервью с авторами Machine Learning System Design”
Читать полностью…Подоспело видео из которого вы узнаете:
Кто сильнее: Терминатор или Робокоп? МГУ или Hard ML? А также самую страшную тайну Aliexpress
Небольшая поправка, стрим проведем на час позже, в 18 по Лондону
Читать полностью…Небольшой Анонс. 14 июля в 19:30 (GMT+3) Валерий проведёт System Design интервью в прямом эфире! На повестке — дизайн системы сети заправок и ритейл-магазинов при ней. Ждём вас на трансляции :)
Читать полностью…Понравилась картинка из рассылки pragmatic engineer
Во многом фреймворк перемежается с тем что я рассказывал здесь. Да и сам автор скорее пользуется им, однако такая вещь как автономность/независимость тоже очень влияет, особенно на первых 3-4 уровнях
Начинаем стрим https://www.youtube.com/watch?v=6YBMU6475KQ
Читать полностью…Мой друг открыл в Сербии компанию, которая помогает легализоваться и спокойно жить без визаранов и прочих неудобств.
ООО, ИП, ВНЖ, счета в банке - всё и сразу
Подробности на сайте, в инстаграммее или в телеге у @relocom_serbia
P.S. Я ждал примерно две недели, прежде чем опубликовать и подумал что события прошедших выходных - явный знак
Выиграл награду в рамках AI Summit London, спасибо всем причастным
Valerii Babushkin, VP for data science at Blockchain.com took home the Solution Provider of the Year award, which recognizes individuals who have demonstrated passion, skills, and world-class expertise in developing an AI technology or solution.
Вспоминаются строчки Высоцкого:
Мне руку поднял рефери,
Которой я не бил.
Ну что сказать, молодец премьер министр новый, кажется так и создается правильный инвест климат и AI и Web3 и Финансы. Даже предсказанная рецессия отменяется: The International Monetary Fund no longer expects Britain's economy to fall into a recession this year, it said on Tuesday, praising the steps taken by Britain's government to stabilise the economy and fight inflation.23 May 2023
Кратко - самый большой фонд в мире на AI Safety - договорились с тремя лидирующими компаниями получать ранний приоритетный доступ к моделям
A16Z - открывает первый (по моему) офис за рубежом
Ну и и в дополнение ЮК увеличило отрыв еще больше по стартапам в Европе
Что за день 7 июня
Deepmind утверждает что с помощью RL нашли алгоритмы для ускорения сортировки. New algorithms will transform the foundations of computing
AlphaDev uncovered new sorting algorithms that led to improvements in the LLVM libc++ sorting library that were up to 70% faster for shorter sequences and about 1.7% faster for sequences exceeding 250,000 elements.
AlphaDev not only found faster algorithms, but also uncovered novel approaches. Its sorting algorithms contain new sequences of instructions that save a single instruction each time they’re applied. This can have a huge impact as these algorithms are used trillions of times a day.
Еще затронули скорость хэш функций
We applied AlphaDev to one of the most commonly used algorithms for hashing in data structures to try and discover a faster algorithm. And when we applied it to the 9-16 bytes range of the hashing function, the algorithm that AlphaDev discovered was 30% faster.
Теперь осталось понять, так ли это, ребята авторитетные, но и понимать бы с чем что сравнивали и в каких условиях
Немного разочаровался сегодня в алгоритмах oura Ring
У меня относительно низкий пульс, ночью во время сна он обычно 50-45. Сегодня нижняя точка составила 40.
Так как эта точка в 40 была достигнута к концу сна, кольцо сообщило что мне капец, ведь мой пульс долго приходил в норму ( с 50 в начале до 40 в конце), мой readiness score - 74 и лучше сегодня не двигаться. Но если убрать последние три часа сна - readiness score резко растет до 82 и кольцо пишет - все ништяк молодец! (Ведь нижняя точка теперь другая )
Вот такая техническая шизофрения из мира анализа данных
Товарищ наткнулся на мою дискуссию в LinkedIn касаемо ужасов прослушивающих нас аппараты и на основе его комментария решил выложить, в комментариях выложу текстом
История про системдизайн сторону подслушивания для рекламы вотсапом, которую ты написал в Linkedin- это вообще топовый пост для твоего канала.
Как минимум хочется в закладки добавить и кидать сразу всей пастой в друзей, которые начинают со мной говорить об этом
В моем ответе ошибка/оговорка, не tts, но stt (speech to text)
Прочитал блогпост Coinbase: Scaling Experimentation for Machine Learning at Coinbase. Хорошо, что я больше не работаю в Blockchain.com, иначе бы сказали, что ругаю конкурента, но блог пост позорный, уровень информативности и нововведений практически нулевой. Настолько, что мне даже нужна помощь, может быть я просто что-то пропустил или не понял? Но начальное заявление : we've built a uniquely elegant approach that combines universes with simple configurations for our ML engines
Не бьется с тем что дальше рассказывают - неслыханное дело, дошли до такой истории как бакеты и что самое смешное, чуваки даже не знают про пересолку:
Hashing in a universe is quite similar to hashing in a split test, using the following formula:
slot_num = hash(universe_name + universe_version + user_id) % num_slots
However, one important aspect to consider is that universe hashing remains consistent over time. This means that historical tests might have a slight influence on the results of future tests. For instance, if a test in slot 1 performs poorly and causes all new users to stop using the app, future tests in that slot could be negatively affected.
To address this issue, we use the "universe version" to allow for rehashing the entire universe when no experiments are running. We've also explored a more advanced technique called "hashing on demand." In this approach, creating a new slot pulls a user group randomly from the entire unused user space rather than from a pre-allocated space. When the slot is emptied, the user group is then returned to the unused user space.
В свое время с @opaOz в Яндексе пересаливаемый конвеер на 1000 бакетов занял у нас целую неделю на имплементацию (вместе с дизайном) и делали сколько угодно экспов в месяц.
На мега платформе coinbase теперь могут гонять до 14 экспериментов в месяц! (пиковое значение)
Еще как мне кажется, чуваки не используют разные слои, хотя на слайде есть Function layer - в тексте про это ни слова
В целом понятно, написали потому что нужно промо, но если я вдруг что-то пропустил, напишите в комментах как я не прав
Через 25 минут поговорим здесь про ML System Design на русском, вопросы и ответы. Вход свободный
Читать полностью…