В среду, 1 мая проведем стрим с Эмели Co-founder and CTO Evidently AI - и со-автором курсов по МЛ от Яндекса
Добавить в календарь
Недавно в одном чатике успешных аналитиков зашли разговоры про мотивационные примеры о том, как кто-то из руководителя инфраструктуры дорос до CDO. Будем считать что CDO репортит CEO, отвечает за все что связано с данными в компании и в его команде 200+ человек.
Мое мнение простое - весь бурный рост и невероятные карьерные возможности были во многом обусловлены новизной профессии и свободным рынком. По мере сатурации рынка и формализации профессии - жизнь потихоньку изменится и нужно быть реалистичным и откровенным в признании этого факта. Если в компании всего один CDО - то всем ни стать CDO, более того, любой уровень выше синьора - это скорее исключение из правила, поэтому синьор и является терминальным левелом.
Это конечно не значит, что никто не станет CDO, но и не стоит становиться проджект менеджером Экселя в надежде затем возглавить самую дорогую компанию мира.
Если меня спросят про пример успешной и реальной карьеры - то вот она - 47 лет в разработке, последние 33 года - Senior, 12 лет отработал в Гугле.
Прочитал неплохую статью How to avoid machine learning pitfalls:a guide for academic researchers - которая зайдет не только академикам.
Понятно что серьезным пацанам нужно брать серьезную книгу Machine Learning System Design With end-to-end examples
Но список вещей, которые в статье затрагивается - хорош, рекомендую
Before Building Models:Читать полностью…
Consider data usage and limitations.
Understand your data thoroughly.
Avoid examining all data to prevent bias.
Ensure you have enough data.
Consult with domain experts.
Review relevant literature.
Plan for model deployment.
Reliable Model Building:
Prevent test data from leaking into training.
Explore different models.
Avoid using inappropriate models.
Stay updated with deep learning developments.
Don't default to deep learning.
Be cautious with feature selection.
Optimize model hyperparameters.
Avoid learning spurious correlations.
Robust Model Evaluation:
Use an appropriate test set.
Perform data augmentation after splitting data.
Avoid sequential overfitting.
Evaluate models multiple times.
Save some data for final model evaluation.
Select evaluation metrics carefully.
Handle time series data correctly.
Fair Model Comparison:
Don't assume higher numbers mean better performance.
Use statistical tests for comparisons.
Adjust for multiple comparisons.
Be critical of community benchmark results.
Combine models with caution.
Reporting Results:
Maintain transparency in methods and findings.
Report performance through various metrics.
Avoid generalizing beyond your data.
Report statistical significance with care.
Examine your models closely.
Use a machine learning checklist to ensure completeness. (На него есть ссылка)
В понедельник, 8 апреля в 15 по Лондону (17 по Москве), проведем стрим на канале. Поговорим с Игорем про модели мира, почитаем посты с фейсбука и посмеемся над ними, а также обсудим почему мы не позвали staff research scientist-а из DeepMind
Добавить в календарь
Мой друг Жанибек выходит на работу в БиПи в середине апреля. Мы познакомились с ним ещё в Фейсбуке, затем работали вместе в blockchain.com, теперь продолжим в BP
Перед тем как стартовать на новой работе, Жанибек съездил домой в Казахстан, заодно мама передала ему с собой подарок для меня.
Нагайку
Очень мудрая женщина
Познакомился с человеком, про которого раньше переодически слышал.
Его зовут Кирилл и он профессиональный бездомный. Впрочем многие мои друзья стали бездомными в последнее время, но почему-то они предпочитают называть себя номадами. Хотя думаю, что если бы я маме в детстве сказал, что хочу поиграть с номадом Василием, вместо его стандартного прозвища, думаю она все равно бы не разрешила. В целом тема бродяжничества настолько актуальна, что даже на обложку книги про МЛ дизайн мы поставили бродягу-вагабонда
Но Кирилл не такой, он человек опытный и странствует по свету уже более 10 лет, живет в разных городах и странах, останавливаясь где-то от месяца до пары лет. Работает удаленно всю жизнь, еще до того как это стало мейнстримом. Сейчас временно осел в Барселоне
Что еще интереснее, так это то, что он сооснователь b2b стартапа, с которым они прошли в S21 батч Y Combinator и закрыли раунд инвестиций
Надеюсь, что когда-то мы сможем с Кириллом сделать стартап по возвращению криптодолгов из цифровых номадов, совместив весь наш опыт в этом деле. Но пока этот день не настал, можно почитать его канал, дядька опытный и мудрый, если ваши темы пересекаются с его интересами, будет полезно
Рецидивисты из Х5 ( по их словам это их 7-ая статья), опять берутся за старое и в этот раз обсуждают А/Б тестирование на маленьких выборках.
Именно на основе этого в 2018 году было открыто распределение Х5
Общался с сотрудником, и пытался объяснить ему, что выступления на конференциях переоценены и нужно делать крутые штуки, например лучше сделать один раз pandas ai и получить 10к звезд на гите (да-да Игорь, это укол в твою сторону), чем сто раз выступить на средней руки конфе, если задача повысить визибилити.
Он мне в ответ - выступить на London AI Summit это почетно и таких людей уважают - супер бустит визибилити. На это у меня нашелся контр аргумент
- Знаешь ли ты keynote спикеров AI Summit 2023?
- Нет
- Ну хорошо, а вот победителя AIconics award 2023 знаешь?
Дальше пять сообщений от него:
- No
- But I suspect you know them? 👀
- Why am I not surprised that you won it
- 😳😳😳
- whats would you say was helpful? being kaggle grandmaster?
Таким образом этот канал и моя любовь к А/Б тестам и наградам спасли еще одну душу
Записал девятую лекцию курса по мл систем дизайну на русском языке.
Пока ее записывал - все думал: жуть, десятая же совсем сложная и она следующая, мы ее текст с редактором когда правили - столько сил потратили, надо держаться.
Когда записал - вспомнил, что это как раз была девятая лекция, которая оказалась самой тяжёлой.
Все-таки в битве колец побеждает Oura. Сircular ring - оказалось полной ерундой, батарейка держит плохо, алгоритмы сна работают странно, зарядка - дурацкая и кроме того из-за нее я разбил один из макбуков. Кроме того, недавно я заметил что аккумулятор в Oura стал быстро разряжаться - написал поддержку, спросил в чем дело? Может быть новая прошивка? Саппорт ответил в тот же день, что то посмотрел удаленно и прислал новое кольцо через два дня. Вызывает уважение
Читать полностью…Мы с Арсением не так давно закончили последнюю главу в нашей книжке про ML System Design, и пока она проходит через все остальные стадии паблишинга, решили адаптировать тот же контент под другие форматы. Многие хотят большей вовлеченности, послушать говорящую голову, посмотреть на спикера в зуме и задавать там же вопросы.
По этому поводу думаем провести курс в формате онлайн-лекций. Контент концептуально тот же, две лекции в неделю, на английском с британским и/или славянским акцентом, платно на том уровне, чтобы окупить наше время по обычной ставке, возможны приглашенные эксперты. Если наберется достаточно желающих в Лондоне или Варшаве, устроим гибридный формат (например, вещание из пивнухи 🍺).
Пока что сделали опросник, чтобы понять интерес к этой идее. Если вам интересно, заполните, пожалуйста - это поможет понять ожидания и адаптироваться под них.
Вторая часть
Читать полностью…
Science fiction
Note: меня в художественных произведениях больше интересует не развитие героя, а хорошо простроенная, логичная и непротиворечивая вселенная, т.е. setting.
Ложная Слепота + Эхопраксия (фантастика, книга про то как может выглядеть контакт с инопланетянами которые совсем не люди, в отличие от обычной фантастики где инопланетянин это такой же человек только зеленый там или с жабрами. В книге одновременно есть вампиры+инопланетяне+сильный ИИ и при этом это hard science fiction, с настоящей физикой и биологией)
Карантин (Грег Иган, фантастика для тех, кто все равно не понял квантовую механику, но хочет понять как работают квантовые алгоритмы)
Задача Трех Тел (фантастика, трилогия. Это уже не hard science fiction, но имхо это одно из лучших фантастических произведений лет за 10. Неожиданно 2 и 3 книги лучше чем первая)
Квантовый Вор (фантастика, про то, что будет когда мозги можно будет заливать в комп и наоборот)
Fiction
Гарри поттер и методы рационального мышления
Если честно великая книга(без стеба). Взрослому с критическим мышлением вообще тяжело читать оригигнального гаррри поттера. Ну потому что он рассчитан на 10-летних детей, и логичен с их точки зирения, в их мире препод может конфликтовать с 10-летним пиздюком, а подход “пойти и рассказать взрослому” который решает 90% проблем в оригинальных книгах абсолютно невозможен для применения.
В новой же книге все основные герои ведут себя рационально, это поведение начинается даже не с начала книги, за 15-20 лет до рождения гарри, где Лилли Поттер не ссорилась со своей немагической сестрой, а наоборот магичекси помогла ей стать красивой и успешной, что привело к тому что Петунья вышла замуж не за неудачника Дурсля, а за профессора биохимии из оксфорда
Книга помимо того, что имеет фантастически сильный сюжет (там часть вещей происходят точно так же как в оригинальной книге, а часть ровно наоборот, что не позволяет предсказать что в ней произойдет), является неиссякаемым источником троллинга классической вселенной гарри Поттера
Перебирал паспорт, увидел там старую китайскую визу от ноября 2019 до февраля 2020 года и вспомнил как мой друг-Китаец, к которому я собирался ехать в гости в январе, попросил отложить поездку, потому что у них там какая то простуда и просят не приезжать.
Помню я тогда еще подумал, ну что за нелепая отмазка, не ожидал от тебя
Интересный взгляд на аналитику - Disband the analytics team
Проводится аналогия между отделом аналитики и пирамидой
Постоянно что-то обещают - причем то - что выполнить не получится никогда, что ведет к циклу неисполнения ожиданий и оправдания своего существования
Но говорится что не получается потому что нужно сделать data quality, data governance, data driven и заживем, когда-то в светлом будущем, просто дайте еще денег
Но факт в том, что идеально не будет никогда - возможно следует признать эти ограничения и начать жить с ними, став более практичными и прагматичными?
В очередной раз подумал, какую невероятную вещь проделал Герман Греф. Взял неповоротливую машину Сбербанка и сделал из нее монстра, лезущего своими щупальцами всюду
Здесь, конечно, можно возразить и сказать:
Залили деньгами
Купили компании, а не сделали сами
Просто копируют других
Многие поделки по качеству ± равны опенсурсу
Да, все это валидно и Сбер не является прорывной технологической компаний, выдающей нам новые языки программирования становящиеся стандартом, фреймворки для обучения нейронных сетей, которые используют все или продукты дисраптящие мировой рынок, но:
Банк, в который ты приходил с бумажной сберкнижкой 10-12 лет назад, смог относительно быстро вкорячить в свою софтину для видео конференций функцию автоматического подведения итогов видео встреч, которая реализована на базе их же STT и LLM
Купленные компании интегрируются в единую экосистему и SberID как ни крути, а используется в рунете, так что видимо есть у пацанов работающая золотая запись
Залить деньгами себе позволяют все конторы с высокой маржой, покупка других компаний это практика повсеместная и как известно - покупка это только начало, проблемы начинаются потом
Самое главное - движение Сбера в этом направлении продолжается уже который год
Я смутно догадываюсь - как невероятно тяжело и сложно было запустить и продолжать толкать эту машину, и просто удивляюсь, что в течении более десяти лет этот человек все еще удерживает в себе железной волю, дисциплину для долгосрочного вижена и , видимо, почти абсолютную власть в компании.
Кажется даже Сатья Надела начинал с базы получше
Одна из вещей, которые мне не нравятся в ЮК - заставляют брать отпуск. Ну, то есть как заставляют, хочешь - не бери и он просто сгорит, на следующий год перенести больше 5 дней нельзя. Деньгами взять нельзя, отпуска - 6 недель - крутись как хочешь - одно слово, леваки. Поэтому чтобы сжигать отпуск, я стал его брать в те периоды, когда в отпуск уходят все остальные, например недавние пасхальные каникулы.
Самый большой отдых для меня - это возможность не ходить на встречи и общаться с людьми, поэтому я с радостью закопался в репозитории top AI продуктов компании, тем более что с недавних пор я был назначен ответственным за их успешную раскатку и операционализацию
Долго ли, коротко-ли, один сервис пришлось профилировать, чтобы понять где теряется больше всего времени: RAG? Установка соединения? Запрос к бд? Запрос к API?
К сожалению, дырка пробивается только из офиса, либо с remote desktop машины, которая на винде, поэтому полностью все воспроизвести можно только в таких условиях
Пожалуй худшего user experience в ипостаси разработчика у меня давно не было, возможно никогда. Нет, ну то есть по продуктам компании Microsoft ты начинаешь догадываться - что-то не так. Стоит просто сравнить teams vs slack или в тысячный раз поставить галочку и нажать кнопку - больше не показывать это сообщение (зная что его покажут в ближайший час). Но банальные задачи установки каких-то пакетов на Винде превращаются в танцы на снегу и непрерывную боль, причем иногда кажется что это сознательное решение со стороны MS. И конечно самое обидное, что при наличии гораздо более классных альтернатив, корпорации полувынуждено продолжают пользоваться этими решениями
Леваки в Калифорнии решили помочь работникам фастфуда и законодательно ввели минимальную зарплату в 20 долларов в часов.
Владельцы фастфуда тоже не дураки, посчитали и поняли что при таких раскладах выгоднее увольнять, чем нанимать и начали народ сокращать.
Спасибо правительству, помогли так помогли. Вся надежда теперь остается на президента Аргентины
Прочитал хорошую обзорная статью от пацанов и Кохави - Statistical Challenges in Online Controlled Experiments: A Review of A/B Testing Methodology
Статья приятна тем, что она: а) понятная (главный критерий хорошей статьи для меня) б) по ней можно быстро пройтись и найти нужные вещи в) большинство вещей плюс/минус применимо
В очередной раз задумался, почему я не пишу статьи на архив, такую статью я наверное смог бы выдать
Основные вещи которые рассматривают
1. Sensitivity and Small Treatment Effects - классическая история, нам бы побыстрее, да поточнее
2. Triggered Analysis - а что если оценивать не всех пользователей, а только тех, кого задело? Классический случай репрезентативность vs релевантность
3. Heterogeneous Treatment Effects - fancy описание когортного анализа, чтобы оценить перфоманс разных групп в рамках а/б тест, отличии от простого колоритного анализа в том, что добавляется модель, которая изолирует остальные эффекты (на которые у нее есть фичи), в целом кажется работает если группы недостаточно большие или нету случайного ассайнмента на уровне когорты. Напоминает стратификацию
4. Long-Term Effects - тут вспоминается веселый фермер, не будет вашего итальянского сыра. Xa-xa-xa!
5. Optional stopping - иногда нужно вовремя остнановится
6. Interference - вмешательство различных нетворк эффектов и как от них изолироваться
В целом хороший обзор
Судя по последней инфе, больше всего с Gen AI зарабатывают компании, которые говорят как заработать на Gen AI.
Цитирую из рассылки Pragmatic Engineer :
The company generating the highest revenue from GenAI… Accenture?
As far as we know, OpenAI and Microsoft are generating the most revenue from generative AI applications. OpenAI is likely doing close to $2B/year in annual revenue. For Microsoft, this number is unclear, although GitHub Copilot generates around $130-150M in annual recurring revenue, with 1.3M paying subscribers paying $10/month or $100/year).
A surprising data point is the management consultancy Accenture generating more revenue than any AI companies. It’s on track for $2.4B of generative AI-related consulting revenue! These are, most likely, explorative projects with companies that want to figure out how to integrate GenAI to their business. From Accenture’s earnings call:
“We [Accenture] are working closely with our ecosystem partners to help our clients understand the right data and AI backbone that is needed and how to achieve tangible business value.”
Симулятор МЛ отжил свое, Пикачу эволюционировал в следующую форму – Симулятор DS.
Добавили секции, которые были бы полезны аналитикам и специалистам, работающим с AI (осталось понять что это значит). Каждое из направлений доступно всем студентам: в рамках подписки самостоятельно решаете, какими задачами будете заниматься – можно как усилить харды в смежной области, так и отработать кейсы, напоминающие собственные задачи.
[Узнать больше]
Скидка -7% по промокоду SIMDSNEW до конца месяца
Ну наконец-то Игорь Бабушкин релизнул в опен сурс грок, LLM сделанную по заказу Маска
Читать полностью…Есть конечно вещи за которые можно не любить Computer science
Например только-только начнёшь читать одну статейку в блоге и вот ты уже вынужден качать пейпер: Progressive Partitioning for Parallelized Query Execution in Google’s Napa
Впрочем, с ML почти тоже самое
Увидел вакансию AI евангелиста, сначала обрадовался, подумал что это мне по плечу
Потом задумался - все не так однозначно.
Переодически ко мне приходят разные люди за консультациями по мл, 8/10 случаев заканчивается тем что я им говорю - нет смысла что-то делать через мл в ваших проектах.
Однажды я подрядился консультировать одну компанию на регулярной основе
Первый месяц консультировал нормально, второй уже средне, третий совсем мало
Для того проекта, где определили что мл нужен - наняли человека и в течении месяца обсудили что и как делать и даже сделали !
Заодно прочитал 4 лекции по мл дизайну сотрудникам этой конторы. Так этот чел начал делать мою работу и объяснять другим командам почему мл не нужен в их проектах.
Может быть мне стоит начать шантажировать создателей массовых мл курсов - войди в профессию за три дня без навыков, что я всех научу мл дизайну и тогда их курсы будут не нужны? Либо они будут платить мне дань и я не лишу их работы
Возможно так появится новая должность, анти AI евангелист
Пацаны из Майкрософта выпустили самую обсуждаемую статью месяца The Era of 1-bit LLMs:All Large Language Models are in 1.58 Bits
Пока остальные кряхтели и пытались отквантовать числа до 4 бит с большими потерями или до 8 бит с небольшими, челы из МС зашли с ноги: любой вес будем представлять как трит - 1.58 бита {-1; 0; 1} и покажем как это сделать не теряя перформанса! It matches the full-precision (i.e., FP16 or BF16) Transformer LLM with the same model size and training tokens in terms of both perplexity and end-task performance
Так же пишут: More profoundly, the 1.58-bit LLM defines a new scaling law and recipe for training new generations of LLMs that are both high-performance and cost-effective. Шортим Нвидию? Теперь вместо умножения - просто складываем (ведь умножение на 1, 0 или -1 это просто плюс, минус или пропуск). The new computation paradigm of BitNet b1.58 calls for actions to design new hardware optimized for 1-bit LLMs.
Что делают? Повторяют BitNet, то есть трансформер где nn.Linear заменен на BitLinear (ниже будет пост с описанием). It is trained from scratch, with 1.58-bit weights and 8-bit activations
Чтобы веса держать в диапазоне -1, 0, 1 - накидывают absmean quantization function (про нее тоже в посте ниже)
И это все
Результаты в посте ниже
Дальнейшее чтиво
/channel/hn_best_comments/21227
#ArticleReview
Какое же удовольствие читать книги по Computer Science по сравнению с Data Science. В CS сразу видно - сели чуваки решать какие-то понятные задачи и постоянно их улучшают, в DS же ощущение что какие-то академики писали много десятилетий в стол, внезапно область выстрелила и они стали это выкидывать эти академические записки в виде книг, правда не до конца понимая какие проблемы они будут решать. Эту книгу рекомендую
Читать полностью…Прикладываю список книг от СТО Aliexpress - Анатоликса
Похожий список литературы я когда-то кидал внутри компании. Там был просто список без пояснений(потому что пояснения были даны устно). Этот список маленько добавился, плюс появилось письменное объяснение, почему каждая книжка или курс туда попалиhttps://www.coursera.org/learn/synapses
Что объединяет весь список, в котором есть и книги и курсы, биографии и фантастика: это какое-то чтиво, которое на меня произвело впечатление за последние года 3-4, обычно для этого нужно как-то расширить мое понимание в какой-то области
Non-fiction
Биография Джобса
Биография Эйнштейна
Русская Модель управления
Русские писатели серебряного века спорили о загадочной русской душе, потом пришел талантливый менеджер всех выгнал и все объяснил в пределах одной книги.
Основная идея книжки, все признают, что у русских модель управления ужасная и неэффективная, при этом она регулярно достигает успехов для которых на самом деле нужна эффективная система управления, как так получается” (очень нудная книжка, но с большим количеством примеров про всякие реорганизации, и реакцию общества на них)
от ИИ до зомби
Это публикация разных эссе про рациональное мышление, которые ранее были известны как Chains на LessWrong, но они поданы с небольшими изменениями и в другом более логичном порядке.
Биология
Биология Поведения Человека, Роберт Сапольский, стендфорский курс (либо книга Биология Добра и Зла) Книжка имхо ощутимо, хуже чем курс в области подачи фундаментальных знаний, в курсе очень много информации про то как вообще работает генетика, эндокринология и нейромедиаторы, в книжке это очень упрощенное справочное пособие, т.е. книжка скорей научпоп. Но в книжке сильно больше интересных примеров.
Synapses neurons and brains
Читать полностью…
На первой лекции этого курса рассказывают о содержании курса, на второй что вот мозг состоит из нейронов, а третья начинается с дифференциального урованения. Чувак который читает курс на самом деле глава Blue Brain Project, те ребята которые эиулируют мозг мыше на уровне электросигналов. Так вот они на самом деле физики, а не медики, и терпения скрываться у них видимо хватило до 3-ей лекции
Эгоистичный Ген + Расширенный Фенотип
Вы любите мемы в интернете? А знаете что слово мем было первый раз применено в книге Эгоистичный ген в качестве сущности, которая на самом деле подвержена размножнению и эволюции, но без биологической природы (в противовес гену).
Для 1970 года когда вышла первая версия книги, огромное число вещей про эволюцию понимали не так. Например, вы когда-нибудь слышали про “групповой отбор” т.е. когда эволюция действует в интересах вида. А вы знаете что его нет? и почти все эффекты которые выглядят как групповой отбор обхъясняются по-другому. Набор на самом деле работает не в интересах вида, и не в интересах индивидуума, а в интересах конкретного гена.
Самый простой пример, чего нельзя объяснить без эгоистичности генов, это например почему мальчиков и девочек рождается примерно поровну, хотя мог бы быть один самец на 10 самок, было бы эффективней.
Идея простая, если ее знать, предположим соотношение самок к самцам 10:1. Тогда получается, что каждый ген в самце в распространенни в 10 раз успешней чем в самке. Тогда получается, что самкам в 10 раз выгодней рожать самцов, потому, что на следующей стадии распространение их генов будет в 10 рпаз эффективней, они начинают так делать и баланс выравнивается.
думай медленно решай быстро (Thinking, Fast and Slow)
Физика
Квантовая механика для чайников https://www.youtube.com/watch?v=3WTMe0R8bw0&list=PLRib7Hj2D_xC_ZDFa4yYqfwtKjUy-LtoS (оказалось, что это не я нифига не понял квантовую физику, а никто ее не понимает, просто все делают вид)