Мне платят за то, что я говорю другим людям что им делать. Автор книги https://www.manning.com/books/machine-learning-system-design https://venheads.io https://www.linkedin.com/in/venheads
Прошлая поездка в Куала-Лумпур прошла неплохо, поэтому можно и повторить, на этот раз первые 2-3 недели апреля
Попутно, помимо стандратных дата инженеров, аналитиков и мл инженеров, сейчас так-же нанимаем SAPеров в BP, вплоть до директора включительно
Ссылка здесь
Краткое описание здесь
Location: Pune/KLЧитать полностью…
Role Overview:
We are seeking experienced SAP Data Experts to join our team. The ideal candidates will have a deep understanding of SAP S4/HANA data structures, data migration, and business processes. They will play a crucial role in our ERP transformation program, ensuring data integrity, migration, and analytics.
Key Responsibilities:
Understand and manage SAP S4/HANA data models and structures.
Perform data extraction, transformation, and loading (ETL) processes.
Collaborate with business stakeholders to ensure data ownership and governance.
Cleanse and validate data to ensure accuracy and consistency.
Develop and implement data migration strategies.
Support data analytics and reporting initiatives.
Work closely with functional teams to understand business processes and data requirements.
Utilize SAP tools such as Sanity, Smart Shift, and internal SAP tooling for data management.
Core Skills and Competencies:
Expertise in SAP S4/HANA data structures and migration.
Strong understanding of business processes in areas such as finance, logistics, procurement, and asset management.
Proficiency in ETL processes and data cleansing.
Experience with SAP data management tools.
Ability to work collaboratively with business stakeholders and technical teams.
Strong analytical and problem-solving skills.
Excellent communication and documentation skills.
Preferred Qualifications:
Previous experience in large-scale ERP transformation projects.
Knowledge of AI and analytics tools within the SAP ecosystem.
Relevant certifications in SAP data management or related fields.
Заметил, что работает простая стратегия:
Покупай акции компаний, чьими продуктами ты пользуешься.
Продавай акции компаний, чьими продуктами ты не пользуешься.
Как только обнаружил, что спортивное питание от Applied Nutrition продается публичной компанией Applied Nutrition, немедленно купил их акции.
Начал читать книгу Джима Коллинза — Good to Great: Why Some Companies Make the Leap... and Others Don't.
И закончил через 40 страниц
Суть книги проста: авторы выбрали 11 компаний, которые за 15 лет до трансформации показывали средние результаты, а затем, после трансформации, ещё 15 лет опережали рынок и свою индустрию в разы. После этого они попытались выяснить, что отличает эти компании от их "двойников" — аналогичных фирм из того же сектора, которые до трансформации показывали схожие результаты, но затем либо не добились успеха, либо столкнулись с проблемами.
Почему книга кажется сомнительной
* В исследование попало всего 11 компаний, тогда как в анализе участвовало 1500+ — можно было выбрать что угодно.
* Определение трансформации размыто — авторы просто нашли точку перегиба в данных, причём для каждой компании свою. Они же в книге пишут, что никакой особенной "трансформации" не запускалось — это был естественный процесс.
* Метрика выдающейся компании — рыночная капитализация. То есть оценивают компании по цене их акций, что само по себе не всегда показатель эффективности.
Некоторые "великие" компании вскоре провалились:
* Кто-то разорился через несколько лет после выхода книги.
* Кто-то следующие 15 лет показывал результаты хуже рынка.
* Gillette, которого приводили в пример как "компанию, которая не продалась никому", через 4 года после выхода книги продался.
* Кажется никто не остался великим (вспоминаем GE 1981-2000)
Level 5 Leadership
Авторы также придумали термин "Level 5 Leadership" — якобы общий набор черт CEO всех 11 успешных компаний. Но когда этих самых CEO интервьюировали, они говорили "нам просто повезло".
В чём итог?
Напоминает книгу с OKR, где восхваляли "чудо-пиццерию", а вскоре после выхода книги она прогорела. Решил проверить, может, я один не понял сути книги — ан нет, критика в интернете такая же.
Вообще, из бизнес-литературы пока только две книги действительно понравились:
Goal
Good Strategy - Bad Strategy
Неплохо читать книги такого рода лет через 10-20 после их выхода
Ничего нового, просто еще один человек ругает Баесовскую статистику, на примере Банка Англии
In terms of where improvements could be made, the report found deficiencies within the Bank’s forecasting infrastructure, that is, the data management and other software tools, as well as the models used in the forecast process, particularly the central forecasting model, COMPASS
The Bank of England's forecasting model COMPASS is indeed a Bayesian model. The model's estimation process explicitly utilizes Bayesian methods, combining prior information with observed data to generate probabilistic forecasts. This approach aligns with the key characteristics of Bayesian forecasting models, as outlined earlier, including the sequential updating of distributions, the use of parametric models with meaningful parameterizations, and the probabilistic representation of information. The analysis confirms that COMPASS exhibits these characteristics.
Think of E-values as "frequentist-friendly Bayes factors"—they quantify evidence without requiring prior probabilities
Оказывается, первый раз мы обсуждали deepseek (мимолетно) с Игорем (кто-бы мог подумать) еще в декабре 2023 года
Читать полностью…Небольшая заметка от Рони Кохави - P-values and Bayes Factors in A/B Testing: Frequentist or Bayesian A/B
Многие критикуют A/B тесты за то, что им непонятно, что такое P-value, и вместо этого хочется видеть какую-то вероятность успеха.
Отсюда люди начинают прибегать ко всякому: гаданию, Таро, баесовским приорам.
Рони говорит: всё здорово, но почему бы просто не использовать False Positive Risk?
In this document, I show that mapping from p-values to minimum and calibrated Bayes Factors, which can then be mapped to probabilities, seem to give values close to the FPR (False Positive Risk), or the probability that a statistically significant result is a false positive. This is an important empirical confirmation that I have not seen before.
If all we are doing is providing a different mapping from four parameters (sample size of control, sample size of treatment, successes in control, successes in treatment) to probabilities using non-informative priors, then I find the Bayesian exercise losing much of the promise. Worse, the online Bayesian A/B calculators not only require fewer parameters than FPR does, but the “Chance to beat Control” seems highly exaggerated.
Пообщались с Викой Бородиной — родилась идея Мета Курса
Говорили о том, как строить карьеру (и почему это может быть скамом), оставаться в профессии и продолжать любить свою работу. А в процессе придумали концепт: какие навыки прокачивать, чтобы стать частью самых востребованных специалистов и топ 5% перформеров компании.
Приходите в комментарии и пишите, имеет ли смысл делать такой курс. Если интерес есть — превратим эту идею в реальность и покажем(попробуем), как вывести свою карьеру на уровень мечты.
В продолжение этого поста /channel/cryptovalerii/735
Сравнение двух рекламных систем
Telegram - 1 доллар на 1000 просмотров - 16000 просмотров - 22 клика - 72 цента за клик
Facebook - 5.1 доллара на 1000 просмотров - 30550 просмотров - 1393 клика - 10 центов за клик
Выводы делайте сами
Решил протестировать рекламную систему телеграма, нада же куда-то тратить звезды. Обнаружил, что реклама канала показывется подписчикам канала. Понял, что системе телеграма предстоит еще долгий путь и говорить о какой-то серьезной рекламной выручке кажется еще рано. Тем более, что ревью рекламы заняло три дня и кажется было ручным.
Для сравнения, у Меты/ФБ процесс занимает несколько минут в автоматическим режиме, со сбором всех статистик и возможностью детальной настройки.
А вот и видео со стримом, получилсь скорее от Канта до Хайдеггера, чем от завода до магазина
Читать полностью…В AI департамент X5 Group ищут СТО, который сможет возглавить разработку ключевых ML based продуктов компании. Это роль для человека, который решал сложные задачи, понимает, как работают крупные платформы, и хочет создавать действительно масштабные продукты, которые влияют на миллионы пользователей.
Основные задачи:
• Определение технологической стратегии и ее интеграция в бизнес-процессы компании.
• Развитие платформенных решений для высоконагруженных систем.
• Руководство командами разработчиков, обеспечение их эффективности и взаимодействия со смежными командами.
• Построение систем рекомендаций, аналитических платформ и масштабируемых ML/AI решений.
Идеальный кандидат:
• Опыт работы в роли СТО платформенных решений, знание процессов управления продуктами.
• Умение работать с высоконагруженными системами, масштабировать их под большие объемы данных и пользователей.
Технический стек: Kubernetes, Kafka, RabbitMQ, PyTorch/TensorFlow, SQL/NoSQL базы данных.
• Успешный опыт внедрения и эксплуатации AI/ML решений в продакшн.
• Навыки работы с data-driven подходом, agile-методологиями и DevOps инструментами.
Компенсация соответствует задачам, деньги - есть.
Резюме можно отправлять Алине Alina.Zudina@x5.ru, вопросы в личку.
Начал читать книгу Стиглица - Road to freedom, которую мне подарили после его визита в Лондон.
Стиглиц оказался леваком, какое разочарование.
Впрочем, кто знает, может как дочитаю, леваком окажусь уже я.
Жаль что ChatGPT не может справиться с простым вопросом по AWS и выдает абсолютно разные ответы, при использовании двух флагманских моделей
Читать полностью…Вышел подкаст со мной, который записали в понедельник
Читать полностью…Интересно, упал ли спрос на разработчиков потому, что он действительно снизился (с поправкой на аномальный роста во время ковида), или потому, что заметная часть разработчиков теперь имеет более одной работы?
Причём обычно это ребята выше среднего, которым легче найти работу и хорошо перформить.
Не смог удержаться. Очевидно, что Deep Seek тоже основан на работе Шмидхубера в 90-х годах, как, впрочем, и любая другая прорывная технология в рамках машинного обучения.
Как писал Салтыков-Щедрин: «Если я усну и проснусь через сто лет, и меня спросят, что сейчас происходит в МЛ, я отвечу: пьют и воруют у Шмидхубера.»
Немного удивляют комментарии вокруг DeepSeek, особенно относительно заявленной эффективности тренировки.
Как будто люди забыли, что GPT-2 сейчас можно обучить уже на ноутбуке, в то время как изначально требовался кластер GPU.
В целом в машинном обучении всегда так: сначала нужно много вычислительных ресурсов, чтобы найти правильный путь, а повторить его затем значительно проще.
На сколько инференс чат гпт подешевел за год? А за два ?
Не говоря уже про многое другое, что, конечно, не отменяет того, что китайцы - крутые пацаны
Статья в тему - The Rise of DeepSeek: What the Headlines Miss
Перезапустил рекламу (/channel/cryptovalerii/737), чтобы сравнивать яблоки с яблоками
Рекламирую свой канал - текст одинаковый (практически, в ФБ добавлена пара слов, так как в ТГ уперся в лимит)
Реклама ТГ канала в ТГ - 20 000 просмотров, 29 кликов, 2 юзера добавились в канал, потрачено 20 долларов
Реклама ТГ канала в Мете - 134 790 просмотров, 1674 клика, ~ 200 юзеров добавились в канал, потрачено 29.64 доллара
В течение длительного времени читал разные статьи, и кажется, что токенизация в моделях — это то, где сейчас большая проблема.
Это все как-то напоминает bag of words до изобретения word2vec.
С интересом смотрю в сторону работ, которые напрямую экспериментируют с байтами и их латентным представлением.
Особенно забавно и одновременно элегантно будет, если это окажется наложено поверх тритовой/байтовой логики весов.
Ссылка для ознакомления
Продолжаю читать Стиглица, Road to Freedom.
Приводит пример, что в финансовый кризис 2008 года, государство всех спасло за счет налогоплательщиков, то есть получается капиталисты говорят, что прибыль наша, а расходы общие. Сегодня случайно нактнулся в видео на следующую информацию, оказывается bailout package принес 100+ млрд прибыли государству.
В том числе помогло снижение налогов, для привлечения инвестиций. Все больше и больше разочаровываюсь в Стиглице
Вопрос для собеседования в связи с последними событиями
Ваш портфель из инвестиций включает 5% вложений в различную крипту
В связи с ростом крипты, ее доля в долларовом эквиваленте портфеля теперь составляет 50%
Ваши действия:
Ребалансировать портфель, продавая крипту
Ребалансировать портфель, докупая со временем все остальное
Продолжать аллоцирровать деньги в прежней пропорции
В субботу, в 17 по Лондону, проведем стрим с Андрюсом Румшей, магистрантом Трирского университета (Германия) по направлению Natural Language Processing. Человеком максимально готовым к AGI, ведь раньше он работал на заводе, а затем перешел в DA&AI департамент Lidl International. В свободное от работы время увлекается спортом, музыкой, философией и поэзией. Обсудим его путь от завода, до магазина продуктов
Читать полностью…Хорошая статья из Financial Times - Britain should stop pretending it wants more economic growth
На словах, вы конечно хотите роста, но не так, чтобы кому-то стало некомфортно
This week, Sir Keir Starmer set out a plan to exploit artificial intelligence to enrich the UK. The moment it was clear that he wasn’t serious was when he said he would make AI “work for everyone”. Almost no government reform that is worth a damn works for everyone. His line all but concedes that, once AI upsets an interest group, he is liable to cave.
If AI is half as transformative as the hype suggests, it implies public sector job losses: in the diagnostic phase of healthcare, for example. Unions want economic growth. But not that much. AI also has colossal energy needs. Even with existing levels of electricity usage, the government’s target to decarbonise the grid by 2030 is at the outer bounds of achievability. To accommodate the new demand from data centres, those targets might have to slip. Sensible environmentalists want growth. But not that much.
Let me come at the point from another angle. What was America’s growth strategy this past couple of decades? Under which administration was it published? Can someone send me a link? Whenever I put these questions to “strategy” mongers, the best answer I get is some vague bluffing about the role of Darpa. In the end, the most successful of all economies didn’t have a plan. What it had, besides shale and other advantages, was an extremely strong growth preference. When growth bumped up against another imperative — tax cuts against income equality, corporate expansion against antitrust concerns, fracking against local sensitivities — the American bias was for growth, at least compared with the western European average. A culture that doesn’t expect so much as statutory paid leave can make dynamic choices that Britain can’t, or won’t.
Интересная заметка Attention Is Off By One от Легендарного Evan Miller, хотя и довольно старая ( Июль 2023 года)
Если кратко, Эван говорит следующее:
1. Хочется, чтобы веса моделей были меньше, тогда их можно использовать в большем количестве приложений, мест и т.д.
2. Для этого применяются различные методы, такие как квантование и другие хитрости.
3. Этому мешают веса-аутлайеры, которые на несколько порядков больше остальных весов.
4. Избавиться от них не удаётся, так как они оказываются критически важными для производительности, что противоречит нашим ожиданиям.
5. На тот момент, лучший анализ был сделан в статье Quantizable Transformers: Removing Outliers by Helping Attention Heads Do Nothing от Qualcomm AI Research, где во всем обвинили softmax и предложили clipped Softmax
6. Эван отметил, что причина была определена, вероятно, правильно, а вот предложенное решение кажется странным (с чем трудно не согласиться).
The researchers came this close to finding the off-by-one error, like killer-in-the-closet close, but they must all be on summer vacation in Italy as none of them are responding to my email overtures, and so I must appeal to the international community of scholars the old-fashioned way.
If you read the linked paper, just ignore their proposals. Sounds harsh, but hear me out. The clipped softmax comes with a wheel-spinning zero gradient, and their gated attention proposal, while workable, introduces millions of new parameters to solve what is really just a failure to increment. There’s a simple and hindsight-obvious solution here that, from all of my reading, no one has thought to try.
Here’s the core mechanic of softmax: it forces a choice among competing alternatives, whether it’s particles picking an energy state or consumers choosing a car. That is, if a softmax mechanism doesn’t want to choose anything at all, softmax will require modification, or else we would expect the softmax to produce distortions once it encounters actual data.
8. Эван предложил, другое, более элегантное решение, но я не уверен что оно всегда будет работать. Добавить +1 в знаменатель
Bit of a let-down, eh? All I did was added one to the denominator. This lets the vector as a whole tend to zero if it wants, but otherwise just shrinks the values by a small amount, a shrinkage which will be made up for during normalization, which happens right after attention.
Жду когда Linkedin откроет параллельный бизнес по шантажу. Мы не сдадим твоему работодателю, как ты начинаешь рабочий день, если купишь премиум подписку!
Читать полностью…Ну как вы там прожили год? Нормально, сойдет? Есть план, которого придерживаетесь, чтобы все в жизни было на своих местах.
И для ответа Да, и для ответа Нет — мы записали универсально подходящий выпуск.
Если вы на пути к оптимизации всего в своей жизни, пожалуйста, вдохновляйтесь об нашего гостя. Валера Бабушкин, большая айтишная шишка в Бритиш Петролеум, прямиком из Лондона, блистает эрудицией, рассказывает умные вещи про трейдинг, большие миллиардные деньги, большую аналитику и большие корпорации.
Если у вас все разваливается — мы вам расскажем, почему вся эта оптимизация жизни и приведение всего подряд в лучшую форму — это чушь собачья, которая убивает фан и эстетику.
В общем, заходите смотрите, последний выпуск в году, хороший душевный и толковый
Youtube | VK-видео | Rutube | Аудиоверсия
Сегодня прочитал статью, описывающую архетипы принципал инженеров. Является хорошим дополнени к архетипам стафф инженеров (см /channel/cryptovalerii/120)
Если кратко, то вот роли принципал инженеров, но в целом - рекомендую прочитать оригинал.
Sponsor:
Является лидером проекта или программы, охватывающей несколько команд.
Обеспечивает принятие решений, устраняет препятствия и продвигает проект.
Фокусируется на определении продукта, организационном выравнивании и delivery проекта.
Требует значительных временных затрат, обычно ограничивая участие до 1-2 проектов одновременно.
Guide:
Эксперт в своей области, глубоко вовлечённый в архитектуру и проектирование.
Производит примеры артефактов (например, проектные документы, код) и работает через других.
Основное внимание уделяется техническому направлению проекта, а не общему delivery.
Обычно ограничен участием в 1-2 проектах из-за большой временной нагрузки.
Catalyst:
Инициирует и продвигает новые идеи или проекты, часто амбициозные или сложные.
Разрабатывает концепции, добивается согласования и организует команды для выполнения.
Это временная роль, которая заканчивается, как только проект запускается.
Ключевая роль для амбициозных проектов, требующих импульса.
Tie-Breaker:
Разрешает затруднения в принятии решений, делая чёткие и обоснованные выборы.
Включает в себя погружение в детали, понимание различных позиций и донесение логики принятия решения.
Роль временная, используемая только для критических решений, чтобы избежать блоков.
Catcher:
Возвращает проекты на правильнве рельсы в условиях жёстких сроков.
Анализирует проблемы, приоритизирует задачи и разрабатывает реалистчные планы восстановления.
Обучает лидерству в сложных ситуациях, но не должен быть использован слишком часто.
Лучше распределить эту роль между большим количеством инженеров, чтобы избежать перегрузки.
Participant:
Участвует в проекте без явных лидерских ролей, активно или пассивно.
Активное участие (например, обсуждения дизайна, задачи по коду) приветствуется.
Следует избегать чрезмерного участия в роли Participant, чтобы сосредоточиться на других ролях.