Привет! Я Леша Хахунов, основатель Dbrain.io, и это мой канал про искусственный интеллект. По всем вопросам @Ahahun (рекламы нет)
если вы делаете AI компанию, просьба учесть рыночную специфику
Читать полностью…Залип в несколько исследований и решил поделиться инсайтами.
AI в корпорациях: новые тренды и реальность внедрения
🔹 Бюджеты и приоритеты
• 60% расходов идут на инновационные проекты, 40% — на операционные
• Топ направлений инвестиций:
- Code copilots
- Автоматизация поддержки
- Поисковые системы на базе RAG
- Системы суммаризации
Интересный факт: компании разделились ровно пополам — одни создают собственные решения, другие предпочитают готовые продукты.
Распределение отделов внутри компаний почти равномерное! (см картинки)
🔹 Кто сейчас на коне среди закрытых моделей
OpenAI теряет позиции лидера: доля на корпоративном рынке упала с 50% до 34%. Главный победитель — Anthropic, удвоивший присутствие до 24%. Компании переходят на Claude 3.5 Sonnet из-за:
• Безопасности (46%)
• Стоимости (44%)
• Производительности (42%)
• Расширенного функционала (41%)
🔹 Формула успеха от BCG
Исследование BCG выявило формулу: успех AI-проектов в корпорации лишь на 30% зависит от того что вы используете. Их распределение:
• 10% — алгоритмы
• 20% — технологии
• 70% — люди и процессы
Показательно: 2/3 компаний сталкиваются с трудностями при адаптации корпоративной культуры к AI.
🔹 OpenAI выкатили новый бенчмарк SWE-Lancer
OpenAI провела масштабное тестирование на реальных задачах с Upwork (общей стоимостью $1 млн). Результаты заработка:
• Claude 3.5 Sonnet — $403K
• O1 — $380K
• GPT-4 — $304K
почитать больше можно тут:
https://menlovc.com/2024-the-state-of-generative-ai-in-the-enterprise/
https://web-assets.bcg.com/0b/f6/c2880f9f4472955538567a5bcb6a/ai-radar-2025-slideshow-jan-2025-r.pdf
https://arxiv.org/pdf/2502.12115
@aihappens
Не ради хайпа, а ради мнения! Новости про DeepSeek "остыли" - можно писать.
«убийц ChatGPT» , "КИТАЙСКИЙ ИИ", "Глубокая болезнь" (эта несмешная шутка от меня, так его никто не называет. Сегодня я, как и обещал, расскажу свои мысли насчёт DeepSeek — китайского «киллера искусственного интеллекта». Или не киллера. Или недокиллера.
Во-первых, качество (самый субъективный пункт, поэтому вначале). Могу сказать, что при всей буре хайпа, которую подняли вокруг DeepSeek, я так и не увидел там ту самую магию, которая «вот-вот убьёт» Google/OpenAI. Да, какие-то бенчмарки показывают, что их результаты схожи. Но мой личный опыт (я целую неделю общался только с DeepSeek) говорит: «Нееет, она всё же уступает и заметно». Не говоря уже о всякий штуках вроде Deep Research / ProMode.
Во-вторых, даты релиза. O1 выкатили в начале сентября, DeepSeek появилась на четыре месяца позже. В мире GPT-моделей это целая вечность. Так что, когда кто-то уже добежал до финиша, догнать может быть и проще, и дешевле — и это окей. Прогресс же! Но при этом мы не кричим «О боже, OpenAI хороните!». Нет, Open Source хорош тем, что подталкивает гигантов выпускать новые поколения. И тут DeepSeek — молодцы: они дают сигнал, что рынок живой и Open Source шаг за шагом догоняет больших игроков. Тут может и Meta/Mistral оживут.
Третья штука — стоимость обучения vs. инференс (запуск). Поговорим о деньгах. Я не слишком верю в официальные цифры, потому что прозрачность китайского рынка, скажем так, вызывает вопросы. Но даже если они вложили не 8, а 30 миллионов — они сделали доступный Open Source! Круто же. Другое дело, мне как пользователю эти цифры дают ровным счетом ничего. DeepSeek банально нет своих мощностей и нужна тонна NVIDIA-GPU, чтобы держать их модель на плаву. (да-да, я знаю, почему их нет). Пользоваться приложением \ офф API невозможно. Оно недоступно 50% времени.
Последнее - Стоя аплодирую китайцам за их маркетинг. В эпоху максимально перегруженного инфополя сделать такой громкий релиз — это очень круто!
Итого у меня получилось:
DeepSeek — отличный Open Source, но точно не «убийца» ChatGPT.
Как пользователь, я по-прежнему выбираю ChatGPT — хотя бы потому, что DeepSeek не даёт стабильной и качественной работы, единственный плюс это доступен без VPN из РФ. И я считаю, что любому "базовому" пользователю попрежнему надо идти и тыкать в сервисы openai. Дешёвый API? Да! Для AI based проектов это будет большим подспорьем.
@aihappens
Как ИИ и AGI изменит нашу жизнь?
Безработица и хаос? Или свобода и творчество?
Некоторые из нас с тревогой смотрят в будущее. И это понятно — технологии, такие как AGI, могут полностью изменить наш привычный образ жизни.
Что будет с работой, изменится ли рынок труда, сможем ли мы адаптироваться к этим переменам?
В новом выпуске подкаста Лёша и Дима обсуждают, как CEO Anthropic Дарио Амодеи и CEO OpenAI Сэм Альтман представляют будущее с AGI.
Дарио и Сэм уверены, что технологии сделают жизнь проще и откроют новые возможности.
Но что стоит за этим оптимизмом? Почему так мало говорят о тех, кто может оказаться в стороне?
Лёша и Дима делятся мыслями о вызовах, которые могут встать перед нами, и о том, как быть готовыми к этим переменам.
Ниже ссылки на эссе Дарио и Сэма и на наш подкаст:
→ Читать эссе Дарио Амодеи Anthropic
→ Читать эссе Сэма Альтмана OpenAI
→ Смотреть подкаст с Лешей и Димой
А что думаете вы? Готово ли общество к таким изменениям?
я мечтаю писать подкасты регулярно. мне кажется это один из самых емких форматов и каждая встреча с Димой обычно заканчивается им, куда мы выливаем все, что собралось за последние разговоры. мы решили начать с 0 и из 4х предыдущих сделать один, но жирный:
https://www.youtube.com/watch?v=cl1329joER4
когда мы его писали на выходе осталось приятно чувство наслаждения, жаль с записи прошло время и совсем свежие новости туда не попали.
Аааааааааааа, я писал пост с телефона и он пропал! Как я зол…
тогда будет короткий пост - Илья Суцкевер (тот что почти выгнал Сэма, тот что потом выгнал Илью) поднял 1B в компанию SSI - safe super intelligence. Может ли компания с безопасным интеллектом рыночно конкурировать с небезопасным ? Вопрос. Даст ли это что-то нам как пользователям? Скорее всего нет. Нужен ли вообще безопасный интеллект? 😬 Много ли в современных мерках 1B для LLM? 🥲
Но Илья очень упертый и очень принципный, такие люди восхищают. А к тому же бесконечно талантливый. Удачи спустить все деньги на вычисления )
@aihappens
вышло интервью с @zapiskiceo
https://youtu.be/iwaK6pm95Zw?si=tOLlaXygJbLvXsgJ
давно не участвовал в интервью про жизнь. Если вам интересно как я нынче - там много про это. Доброе и теплое интервью, без сложных щей.
Повышаем градус лирики. Мне всего 29, но с каждым годом я всё больше ловлю себя на мысли, что кто реально понимает жизнь, так это европейские пенсионеры. Их неторопливый ритм, умение наслаждаться простыми радостями и ценить каждое мгновение — какой-то недостижимый навык, но я замечаю, как всё больше моих событий в жизни и привычек объединяет нас. Наблюдаем вместе:
Моё утро начинается с небольшой растяжки — это какая-то смесь йоги с… зарядкой? Зарядка — это не обязанность, а форма гигиены для моего тела. То, что я в детстве не мог осознать, глядя на пенсионеро.
В последнее время я открыл для себя утренние купания в озере. Каждое утро, около 8:30, я погружаюсь в прохладную воду, чувствуя, как тело сначала замирает, а потом расслабляется. И знаете, кто составляет мне компанию в этом ритуале? Улыбающиеся лица пожилых людей.
Прошлой осенью мы с женой наслаждались видами Тосканы из окна старинного отеля. Рядом с нами сидели одни лишь пожилые пары, неспешно потягивая вино, наслаждаясь бесконечными разговорами.
А ещё я открываю для себя мир ферментированной пищи. Квашенной капусточки хотите? Как сказала бы любая из моих бабушек, это настоящее сокровище для здоровья. И знаете что? Они были абсолютно правы.
А знаете, кому я раньше завидовал больше всех на Чистых Прудах? Каждые выходные я наблюдал, как седовласые стратеги склоняются над шахматными досками. Я бы хотел поиграть с ними, но воли «вписаться» мне так и не хватило.
И, пожалуй, самое странное, что объединяет меня с европейскими пенсионерами, — это искусство путешествовать вне сезона. Мы с женой планируем наши поездки на те месяцы, когда схлынул поток туристов, так как нас, как и их, мало что ограничивает. Нет школьных сезонов, нет жёстких отпусков. Кто бы мог подумать, что в 29 лет я буду черпать вдохновение у тех, кто прожил в два, а то и в три раза больше меня?
Я ненавижу компании, которые злоупотребляют нашим дофамином. Соцсети, рилсы и тиктоки, мобильные игры, маркетплейсы. Особенно мне не нравится, что от них страдает самая незащищённая часть населения — подростки. Недавно было проведено большое исследование, и его краткий вывод таков:
“One of the notable trends we observed was a sharp rise in the rates of anxiety, depression, and stress in adolescents and young adults over the past 20 years. Rates increased by more than two-fold for those aged 16–24, and understanding what is underlying these patterns is of critical importance.”
[Источник]
Но пост будет не про это. Я хочу рассказать про компании, которые через взлом дофаминовой системы как будто ломают проблему моего поколения. И это трекеры, которые следят за вашим здоровьем — часы, браслеты, кольца, матрасы. Чего только нет, но если задуматься, это же просто замещающий способ проявления заботы о себе. И я сам — самый яркий представитель этого. Мне очень сложно нормально спать. У меня сбивается цикл, я сплю по 6 часов, засыпаю с телефоном и ем перед сном. Но как только у меня на руке появляется Whoop или Oura — всё, спать плохо нельзя. У меня будет низкий балл. А у нас в Whoop есть команда менеджеров, и там видно, кто как восстановился. Это вообще жесть. Социальное давление за твой отдых! Очень круто, хоть и хочется научиться давать себе внимание и заботу без этих девайсов, но пока ладно — абьюзьте меня полностью.
@aihappens
Выбирая тему для сегодняшнего поста из папки, выбор стоял между:
1) Презентацией Google с обзорами самых лучших, самых быстрых и самых умных моделей и нового телефона,
2) Рассказом про новую слабоцензурированную LLM от Маска,
3) Обсуждением важной для меня проблемы, которую я пока боюсь обсуждать публично.
Как вы понимаете, обсуждать мы будем пункт 3. Итак, рядом с облаком тегов вокруг моего имени предлагаю добавить новый — «маскулист». Скорее всего, вы не слышали это слово или слышали его в качестве обзывательства от феминисток. Хотя в нём нет ничего плохого — это человек, который борется за права мужчин.
Женщины, любые мои читательницы, перед тем как начать писать мне разные неприятные вещи, прошу дочитать этот пост до конца. К чему я это всё. Последний год ко мне пришло осознание, что в обществе очень часто поднимаются проблемы женщин. Они существуют в нашем сознании, мы пытаемся что-то изменить вокруг нас. Но проблемы мужчин почему-то в это пространство (по крайней мере в моё) практически не попадают. Я пару раз пытался вступать в дебаты вокруг этой темы и понял главную ошибку — я не хочу сравнивать «тяжесть» или «важность» проблем разных полов. Мне кажется, это просто не требуется. Их надо формулировать не вокруг того, «кто виноват», о них не надо спорить, их хочется просто поднимать. И я хочу начать.
Хочу поделиться некоторым количеством статистики:
1) Мужчины совершают самоубийства почти в три раза чаще, чем женщины (по данным Всемирной организации здравоохранения). В РФ в 6 раз.
2) В 2019 году ожидаемая продолжительность жизни у мужчин составляла 73,2 года, что на 5 лет меньше, чем у женщин (78,2 года).
3) Мужчины в два раза чаще страдают алкогольной зависимостью, чем женщины (по данным Национального института по проблемам злоупотребления алкоголем и алкоголизма).
4) Более 90% убийц в мире — это мужчины (по данным ООН).
5) Мужчины в 1,5–2 раза реже обращаются за психологической помощью, чем женщины (по данным NHS).
Как вам? Мне страшно. И, как будто, об этом стоит же говорить, нет? И я повторюсь — мне не нужно противопоставлять этой информации проблемы женщин, пожалуйста. Я не хочу этой информацией влиять на вас. Я лишь хочу, чтобы все люди — и мужчины, и женщины — имели возможность озвучивать свои проблемы. И я считаю, что из-за норм поведения сложившихся в обществе мужчинам нужно помогать говорить, потому что нас учили, что нужно терпеть, нужно тащить, нужно страдать. Ныть нельзя, ты же не нытик. А потом выходить в окно или пропасть в зависимости.
Сил вам, мужики, да пространства где можно поплакать и не чувствовать себя в этом ничтожеством.
@aihappens
У меня есть курс про GPT: gptcourse.io, на нём обучалось множество компаний разных размеров — от 10 человек до 1000. И я заметил одну интересную закономерность, имеющую много общего с жизнью.
Сначала небольшое отступление: я считаю, что GPT — это технология, которая должна интегрироваться в первую очередь не на уровне процессов, а на уровне обычных людей. Каждый может найти способы разгрузить свою жизнь с её помощью СВОИМ конкретным способом. И то, произойдёт это или нет, по моим наблюдениям, коррелирует с одной простой метрикой: насколько топ-менеджеры вовлечены в процесс. Очень часто я слышу запросы формата "научите моих сотрудников уму-разуму". На логичный вопрос, а последуете ли вы за ними, часто следует ответ: "НЕТ".
Почему я считаю, что это сильно коррелирует с жизнью? Для меня это сродни родителям, которые учат детей не курить, при этом выкуривая пачку в день. Это создаёт асимметрию. Дети проникаются увлечениями, привычками и ценностями тогда, когда их родители когерентны с этими принципами.
А у вас как, лидеры действуют со всеми или отдельно?
@aihappens
Как бы научиться отдыхать?
В общем я на теоретическом уровне супер разобрался с тем, как на самом деле давать отдых себе. И нет - это не просто про надо поменять вид деятельности. Снизу читай в чем для меня с этим проблемы. Делюсь:
1. Отсутствие ответственности:
- Работает. Временное освобождение от обязанностей и ответственности позволяет снизить уровень стресса и психического напряжения. Отдых с дополнительной ответственностью? Не уверен. Лежать у моря, где тебя кормят? Да, если ты так можешь.
2. Контакт с природой:
- Работает. Пребывание на свежем воздухе и взаимодействие с природой действительно способствует снижению стресса. Контакт с водой, лежание на земле, смотрение на горы и любые другие формы плентинга.
3. Качественный сон:
- Работает. Оптимизация сна является одним из наиболее важных аспектов полноценного отдыха. Качественный и достаточный сон помогает восстанавливать физические и психические силы, улучшает когнитивные функции и общее самочувствие. Про это писал уже много постов.
4. Избегание дофаминовой перегрузки:
- Работает. Ограничение чрезмерного потребления цифрового контента, социальными сетями и другими стимулами, которые перегружают дофаминовую систему, может помочь избежать нервного истощения и улучшить способность отдыхать.
5. Любые способы контакта с телом:
- Работает. Йога или медитация, баня или холодная купель, массаж или просто объятия с партнером. Все что переключит ваше внимание с логических рассуждений в тело.
А теперь, в чем у меня тут проблема. Чем хуже у меня состояние, тем хуже я отдыхаю. Я не понимаю, как с этим справиться. Как только уровень тревоги увеличивается, 3/4/5 отваливаются сразу, и возвращаться к этому очень сложно. А как ты провел субботу?
@aihappens
Как я обращаюсь с деньгами
В моей семье никогда не умели обращаться с деньгами. Они как-то появлялись, как-то тратились. Основной принцип был прост: работать так, чтобы хватало на то, что нужно. Но что именно нужно и кому, это никогда не уточнялось. С этой установкой я и вошел в сознательную жизнь.
Со временем я понял, что с этим надо что-то делать, и разработал для себя стратегию, которую опишу ниже.
Первая часть: Логика откладывания
Я постоянно оцениваю свой «уровень финансовой безопасности». Чем он выше, тем больший процент от своего дохода я откладываю. В данный момент мой максимум (совпадающий с текущим) составляет 30%, но моя мечта — достичь 50%. Кажется про это было у Баффета: «Не копите то, что остается после трат, а тратьте то, что остается после сбережений».
Вторая часть: Как обгонять инфляцию в своих накоплениях
Здесь все просто: криптовалюта, акции и валюта расходов. Для меня криптовалюта не является источником спекуляции и заработка, а лишь максимально ликвидным вариантом денег, который я могу использовать в любой стране. Акции я покупаю, исходя из принципа «хай-тек + 2-3 индустрии, в которые я верю в данный момент». Сейчас это металлургия, так как в мире напряженная обстановка, и все пытаются воевать со всеми, а танки строить нужно, и биотехнологии. Рынок сейчас благоприятный, и это дает 15-20% в год. Крипта — это эфир и биткоин. Валюта — облигации Нидерландов. Распределение: 50% акции, 25% крипта, 25% валюта.
Третья часть: Дисциплина
Дисциплина — самая сложная часть. Каждое первое число месяца, вне зависимости от обстоятельств, я докупаю все вышеописанное. Я не задумываюсь, упали ли акции или что происходит с криптовалютой, я просто покупаю. Это избавляет от тревоги и постоянного мониторинга ситуации.
Мечта о будущем
У меня есть мечта — создать удобный способ управления деньгами для сотрудников внутри компании. Представьте, что вы можете попросить перевести 20% зарплаты в инвестиции, видеть отчеты и получать полный расчет при увольнении. Это было бы действительно круто, не так ли?
@aihappens
Недавно вышла новая большая модель от Meta — LLama 3.1 405B. Эти цифры означают, что у неё 405 миллиардов параметров. Запускать такие модели на собственном компьютере — дело неблагодарное, но протестировать самую мощную модель, доступную в опенсорсе, очень хочется. Что делать? Тестировать её в POE!
Мои стандартные тесты:
1. Написание сейлз писем (русский \ английский).
2. Коррекция моих кривых текстов (русский \ английский).
3. Написание Telegram-бота на Python.
4. Коучинг \ редактура эмоционального окраса сообщений.
5. Поисковый запрос (на этот раз я просил порекомендовать, где искупаться между Дюссельдорфом и Амстердамом).
Во всех задачах я измерял мой непредвзятый уровень удовлетворенности.
Участники эксперимента: GPT-4o, GPT-4mini, LLama 3.1 405B, Gemini 1.5 Pro, Claude 3.5 Sonnet.
Лист победителей:
1. GPT-4o: 89%
2. GPT-4mini: 84%
3. LLama 3.1 405B: 81%
4. Gemini 1.5 Pro: 93%!!!!!
5. Claude 3.5 Sonnet:85%
После этого я решил проверить,а что там на Арене ЛЛМок - и там тоже лидирует гугл(хотя я думаю это разные модели). Кажется они забыли, что такое хороший пиар, иначе свою не информированность мне объяснить сложно. Но да - модель остается ужасно цензурированной и в сравнении с лламой доступной в версии без цензуры это выглядит грустно.
@aihappens
Я очень советую найти в себе силы и прочесть или посмотреть статью - предикшен на несколько лет вокруг ИИ от Daniel Kokotajlo, Scott Alexander.
Сначала про первую широко известную работу Daniel Kokotajlo:
Человек в 2021 году написал примерно следующие вещи:
## 2022
- Большие мультимодальные трансформеры от OpenAI, Google, Facebook и DeepMind делают GPT-3 устаревшим
- Появляются чатботы, которые интересны, но интеллектуалы считают их поверхностными
- Начинают развиваться первые библиотеки для промпт-программирования
- Формируются идеи о помощниках с искусственным интеллектом для решения повседневных задач
## 2023
- Трансформеры достигают размера около 500 миллиардов параметров
- Огромный рост хайпа вокруг ИИ, обсуждения о "здравом смысле" систем
- Высокий приток венчурных инвестиций в стартапы с ИИ, хотя большинство приложений еще не работают должным образом
- Сообщество по безопасности ИИ сокращает прогнозы по срокам достижения критических технологий
- Беспилотные автомобили и доставка дронами сталкиваются с трудностями
## 2024
- Компании фокусируются на улучшении существующих моделей вместо создания новых гигантских систем
- Некоторые приложения начинают работать, но общий хайп снижается из-за невыполненных обещаний
- Формируется стереотип о "наивных затворниках", чьим единственным другом является чатбот
- Чиповый кризис начинает ослабевать благодаря новым производственным мощностям
ДЕЛАЕМ ЧЕК ЭТОГО ГОДА:
2025
- Разработана система, где гигантский предобученный мультимодальный трансформер стал компонентом более крупной системы с множеством нейросетевых элементов (имеется)
- В моду входит не увеличение моделей (они уже достигли триллионов параметров), а создание более сложных "бюрократий" и удлинение времени их работы (смотри какие размеры новых моделей)
- Сообщество по безопасности ИИ начинает напрямую опрашивать ИИ о темах безопасности: "Ты выровнен с нашими целями? Если мы создадим твои более крупные версии, они убьют нас?" (Модели откровенно лгут на части тестов)
- Исследователи создают ситуации-ловушки для выявления обмана со стороны ИИ (имеется)
- Появляются противоречивые результаты: в некоторых ситуациях ИИ может нажать виртуальную кнопку "убить всех людей", а в других - отказывается это делать (было)
- Благодаря техническому прогрессу стоимость обучения гигантских моделей уменьшилась на порядок по сравнению с 2020 годом (проверяем Deep Seek).
То есть еще до выхода ChatGPT (это если что было в ноябре 2021 года) человек на 4 года вперед расписал технически точно почти все, что случилось в GenAI. Что если не это должно толкнуть вас к прочтению. И мой любимый фрагмент.
Июнь 2027 года. These researchers go to bed every night and wake up to another week worth of progress made mostly by the AIs. They work increasingly long hours and take shifts around the clock just to keep up with progress—the AIs never sleep or rest. They are burning themselves out, but they know that these are the last few months that their labor matters.
Думать, что все что за пределами двух лет от сейчас может быть правда немножко страшно.
@aihappens
Открытый эфир про нейросети с Димой Мацкевичем и Лешей Хахуновым
15 февраля, 16:00 МСК
До старта AI-интенсива осталось всего 3 дня, поэтому мы решили провести дополнительный открытый эфир. Обсудим, как ИИ уже сегодня может стать твоим реальным помощником в работе и жизни.
Присоединяйся, если хочешь:
1. Задать вопросы и получить прямые ответы в режиме live.
2. Узнать, как Дима и Леша применяют нейросети на практике.
Эфир пройдет в Telegram-канале Димы Мацкевича: /channel/Matskevich. За час до старта сделаем напоминание в этом канале.
Если ты уже настроен на интенсив, записывайся на поток. 200 участников уже в чате, и обучение стартует 17 февраля.
→ Оплачивай доступ через нашего бота
ахахахах, простите. Я сделал группу с комментами закрытую и никого не добавлял туда 3 месяца. И думаю, а че вы все молчите то!
Читать полностью…Ребята, это пиздец. То есть если я уже решил написать что-то в канал, значит точно случилось что-то существенное. Вчера, пока летел в самолёте, у меня наконец дошли руки попробовать Deep Research от ChatGPT. Вы можете спросить: «А что это за Deep Research такой?» Но я, в свою очередь, хочу понять, почему меня за последние две недели 200 раз спросили про DeepSeek — китайскую модель, которая никому особо не нужна, — в то время как почти никто не говорит про взрывающую мозг новую фишку от ChatGPT.
Итак, что такое Deep Research? Это экспериментальная функция, которая позволяет чат-боту проводить многошаговые исследования в интернете и собирать аналитические отчёты. На практике это выглядит так: ты пишешь запрос модели, она уточняет детали, которые ей нужны, потом думает, и в конце выдаёт очень крутой результат. Я протестировал её на сборе инфы о конкурентах и реально узнал, во-первых, о куче компаний, о которых раньше даже не слышал, а во-вторых, она нашла про них тонну технического контекста из их блогов и даже ссылается на патентное бюро. Словом, агрегирует просто громадный объём данных. Я потом взял несколько компаний и отдельно их проверил вручную — всё, что модель собрала, оказалось абсолютно корректным.
Да, чтобы вы понимали, я один из тех, кто платит OpenAI 200 баксов в месяц, поэтому, возможно, у большинства из вас пока нет доступа к этой фиче, но, как я понимаю, это скоро изменится. Deep Research — это классическая агентная система, где модель сама выбирает, что она будет делать дальше: идёт в интернет, читает статьи — у неё нет какого-то жёстко запрограммированного алгоритма. Для меня это выглядит очень интересно, потому что, в отличие от прошлых версий, модель действительно показывает свои рассуждения, и ниже я вам приведу несколько примеров, как она это делает
1. Модель описывает азарт в процессе работе, вида "О, интересно, а что бы это могло значить? надо изучить!"
2. Нетерпение к ограничивающим факторам вида пейволы или логины.
3. Присутствие сомнений и критического мышления - "Интересно, но нужно проверить другие источники"
4. Чувство удовлетворения от находок.
Это мило ❤️
В целом, мне кажется, что Deep Research — это огромный шаг к тому, что люди часто хотят от AI-ассистентов: чтобы они не просто решали какую-то задачку, а реально зарывались в тему, доставали информацию, шерстили кучу сайтов. Эта функция уже умеет делать именно то, за чем многие обращаются к ИИ - думать и анализировать за них.
Вообще мне тут недавно исполнилось 30, поставьте мне реакций под пост и может разберемся с тем, почему DeepSeek это просто хайп. А еще у меня есть 7 недописанных постов в канал, пора бы уже разобрать бэклог.
@aihappens
помните, как я писал о новой модели о1 - Preview, когда она только вышла? Тогда я думал, что изменения затронут в основном только специфичные роли. Как же я ошибался!
Эта модель — настоящий геймчейнджер для меня в плане решения сложных задач. Теперь я вижу, как большие сложные блоки, особенно стратегические, где нужно хорошее описание, решаются совершенно по-другому. Серьезно, с 2-3 итераций в диалоге получается достичь офигенных результатов. Раньше тратил оч много времени на промпты/роли и тд. Сейчас просто пишу 15 минут голосовые и пихаю туда.
Огромный плюс — это большое окно контекста. Я могу бесконечно уточнять в одном чате, не создавая новые треды. Раньше приходилось дробить обсуждение на несколько чатов, чтобы сохранить контекст. Теперь всё в одном месте — и это просто бомба!
Фанфакт: теперь можно посмотреть цепочку рассуждений модели. И когда я туда заглядываю, вижу, что она думает то на русском, то на английском, то на украинском, то на китайском! Выглядит очень забавно.
Кстати, разработчики спрятали эту модель так неудобно, что большинство из нас даже не заметили её. Даже активные пользователи GPT, которых я спросил не видели ее, хотя знают, что она выходила. Поэтому, вот мой экшен: Включаем новую модель, берём самую сложную задачу прошлой недели - тестируем. Ты будешь приятно удивлен!
@aihappens
Простите, был занят просмотром чемпионата по Доте в Копенгагене и не рассказал вам про новую модель от OpenAI — O1.
Начнем с простого — нейминг снова в говне ужасный. (Найдите разницу — 4о и O1. Дальше предлагаю модель О_о назвать ☺️.)
Теперь по существу. Что вообще изменилось в модели?
По сути, они реализуют механики, которые всегда советуют для получения крутых ответов на сложные вопросы: разбивка задачи на этапы, продумывание и критика решений на этих этапах. Всё это можно было делать и раньше, но никто в здравом уме в повседневной жизни так не писал промпты. Сейчас это будет удобной опцией, ну и собственно, отличие в том, что модель за вас продумывает эти шаги между этапами.
Почему метрики у модели на обычных задачах почти не выросли?
Потому что во всех бенчмарках модели и так запускались в режимах CoT ( и т. д., что значит, что это делали вручную исследователи — запускали модели 20 раз, заставляя рассуждать и давая примеры решений аналогичных задач.) Но ситуация абсолютно иная на логических задачах — там, где люди всегда хихикали над задачами на образное мышление или скрытые смыслы. Хлобысь — и модель уже на уровне олимпиадников по математике в этих задачах. Это подтверждается интересным тестом с картинки, где модель проходит тесты на IQ. (Для справки, тесты на IQ построены так, что 100 = медиана среди всех людей.)
Повлияет ли это на обычных пользователей?
Почти уверен, что нет. Это релиз, в моем понимании, направленный на исследователей в широком смысле этого слова. У них появился шанс с большей вероятностью найти идеи для решения своей задачи в голове GPT.
@aihappens
Я часто оказываюсь в ситуации, когда качаюсь на качелях - я бездельем и я трудоголик. Мне не верится, что есть люди, которые долгосрочно работают 60+ часов в неделю эффективно. (хотя такие заявления я часто слышу).
В следующем месяце я хочу попробовать понять, сколько времени я действительно активно работаю, а сколько провожу, отвлекаясь на YouTube, книги, еду и другие вещи, с помощью трекеров. Моя цель не максимизировать их - а просто понять и успокомиться. Пока я размышлял об этом, решил узнать, как вы оцениваете свои 'эффективные' часы работы. Попробуйте ответить честно, ваш работодатель (даже если это я) не узнает.
Крееейзи стартап! Reflect Orbital (reflectorbital.com/)
Ребята делают рефлексию солнечного света через спутники. Вроде бы на этом этапе всё ок, но прикол в том, что ты можешь "вызвать" его себе домой через специальное приложение. Хочешь немного солнечного света на вечеринке и жестко зажечь на танцполе? В конце 2025 года сможешь. Как "запретить" светить в окно соседу только не понятно)
Не одним AI едины.
@aihappens
Заглянул на арену GPT. Если вы там не бываете, но интересуетесь борьбой GPTs - рекомендую заглядывать: [https://chat.lmsys.org/?leaderboard]
Интересные новости:
1. OpenAI все еще (или снова) лидирует, оставаясь единственной с ELO оценкой 1300+. Вообще каждый раз ощущение, что у них есть модель на порядок умнее, но релизить они ее будут только, когда другие покажут что-то достойное против текущей модели.
2. Впервые зашел в раздел тестов на русском языке – здесь Google сопоставим с OpenAI. Кто-нибудь знает, как было раньше?
3. Опенсорсные модели от Meta и Mistral близки к "прошлому" поколению моделей, которым 3-5 месяцев.
Про опенс сорс прикольно — эти модели требуют много вычислительных ресурсов, но и возможностей у них достаточно.
Также ждем полноценного релиза Grok 2 от Маска (последний раз оценка была 1281).
Вообще фан иногда "поиграть" в арену. Можно тут:
https://chat.lmsys.org/
И если вы не знаете как работает ELO score, короткое объяснение:
ELO рейтинг в LMSYS Chatbot Arena рассчитывается на основе парных баталий между моделями, где пользователи голосуют за лучшую, по их мнению, модель. После каждой баталии рейтинг моделей обновляется. Если модель с более высоким рейтингом проигрывает, она теряет больше очков, чем если бы выиграла.
@aihappens
Регулярно сталкиваюсь с комментариями в фб о том, что AI — это пузырь, и в отрасли наступила "зима". Решил покопаться в числах и сравнить "классические" бизнесы с компанией OpenAI на фоне текущего рынка. Взял компании, близкие к AI, и добавил супер параметр — Value/Revenue, который показывает, как заработок компании соотносится с её оценкой.
Справочно:
- B — миллиарды
- Revenue — все получаемые деньги
- Market Cap — по какой оценке можно купить долю в компании
Хронология:
- В конце 2022 года оценка компании OpenAI составляла 10B$ (на самом деле меньше, но опустим этот факт).
- Май 2023 года: Revenue — 1.6B$.
- Май 2024 года: Revenue — 3.4B$.
- Market Cap 2024 года — 80B$.
- Value/Revenue ≈ 25 (скорее ближе к 20).
Сравним с рядом стоящими гигантами:
- Meta:
Market Cap — 1.33T
Value/Revenue — 8.76
- Nvidia:
Market Cap — 2.90T
Value/Revenue — 36.16
- Amazon:
Market Cap — 1.79T
Value/Revenue — 3.03
Пу-пу-пууууум. Ну коэффициент высоковат, но учитывая, что это частный бизнес, являющийся топ-1 в индустрии, он не выглядит драматично. Поискал данные по perplexity и Midjourney, там все непонятно. В Midjourney была инфа, что выручка около 200М$, оценки не было, а работает всего 11 человек. А у perplexity 35M$ выручки и 1B$ оценка.
К этому надо добавить, что в текущий момент вся история в LLM/GPT - проходит стадию лишь early adopters, то есть в среднем только 2-3% населения так или иначе используют эти технологии. Посмотрим как на это повлияет Apple, так как Google явно не справляется :)
@aihappens
Мне очень сложно с моими постами. Одни кажутся мне слишком простыми, другие — слишком сложными для чтения. Иногда я думаю, что мои мысли и опыт в среднем бесполезны для людей (зачем знать и думать про проблемы технологических предпринимателей?), а иногда мне кажется, что я пишу слишком скучно. Был момент, когда я делал опрос: "А что вы вообще хотите здесь видеть?"
В последние дни у меня сформировался вывод, который изменил мое отношение. Я веду этот канал не для вас, а для себя. Вам интересно его читать, потому что я пишу о том, что интересно мне. Мне не нужна валидация моих идей, я не хочу зарабатывать деньги на канале. Я хочу рефлексировать здесь, постить мемы, репостить людей, которые мне интересны. Делать все это с глубоким кайфом, делиться такими наблюдениями, как это и не думать "блин, у меня в названии стоит AI, а это не он". Принимать, что какие-то посты будут приводить к оттоку аудитории, а какие-то — набирать сотни репостов. Эта попытка ориентироваться на внешние реакции и приводила к тому, что я бросал писать здесь. Сил не хватало. Посмотрим, насколько меня хватит в этот раз. ❤️
Как вам уровень генераций современных моделей с ценой в 1$? Хотите проведем тест AI или настоящее? :)
@aihappens
Дошли руки до тестов Gen 3 Alpha. Оказалось, что получить нормально по физике видео очень сложно. Но вот вам видео коровы, которая вносит данные в arka.dev
@aihappens
Пересмотр позиции HRD: Внутренний фокус и философия
В современном корпоративном мире позиция HRD (Human Resources Director) остается одной из самых недооцененных и зачастую неправильно понимаемых ролей. Часто HRD воспринимается как человек, занимающийся исключительно рекрутингом — поиском, наймом сотрудников, проведением интервью, организацией перформанс-ревью и периодическим проведением тимбилдингов. Однако это только верхушка айсберга.
Глубинная роль HRD
Мое представление о ключевых обязанностях включают:
1. Развитие менеджерской команды: Это включает в себя обучение, коучинг и менторство, чтобы каждый менеджер мог раскрыть свой потенциал и внести вклад в общую стратегию компании.
2. Запуск новых процессов: Особенно важно управление кросс-командными проектами, где необходимо объединять усилия разных департаментов для достижения общих целей.
3. Создание безопасной среды: Организация индивидуальных и групповых сессий, где сотрудники могут откровенно делиться своими переживаниями и проблемами, что способствует улучшению внутренней культуры компании.
4. Обучение разрешению конфликтов: Это включает не только обучение сотрудников, как справляться с конфликтами, но и, при необходимости, их медиацию.
5. Формирование HR-бренда: Разработка и реализация стратегий, которые помогут компании быть привлекательной для потенциальных сотрудников и удерживать текущих.
6. Работа с удаленными командами: Понимание и решение проблем, связанных с удаленной работой, и создание способов поддержания «человечности» в онлайн-среде.
Философия и подходы
Фокус HRD, по моему мнению, должен быть направлен не только наружу, но и внутрь компании. Это означает активное участие в формировании корпоративной культуры, которая способствует развитию каждого сотрудника и команды в целом. Важность позиции HRD можно сравнить с советником генерального директора (CEO), ведь работа HRD напрямую влияет на успех компании через управление ее самым важным ресурсом — людьми.
Хоровиц писал - в компании важны люди, продукт, прибыль. Именно в такой последовательности. Я с этим полностью согласен.
Если ты вдруг тот HRD, что я описал выше - приходи работать ко мне, а то мой уходит в декрет.
А с чем из списка у вас в компании занят HRD?
@aihappens
Я смотрел интервью Лекса у команды Neuralink. Оно короткое — всем советую, я успел, правда, пока только 4,5 часа посмотреть. Пока слушал их рассказ, вспомнил, что давно хотел написать пост на тему “ думания из первых принципов”.
Думать из "первых принципов" (first principles) означает:
1) Разбивать сложные проблемы на базовые, фундаментальные элементы.
2) Отбрасывать предположения и общепринятые идеи.
3) Анализировать ситуацию с нуля, опираясь только на неоспоримые факты.
4) Создавать новые решения на основе этого фундаментального понимания.
Давайте на примере — вы проект-менеджер в компании. У вас есть процесс — ежедневные звонки с командой. Догматичный подход: всем командам надо созваниваться каждый день, иначе всё сломается, и телега никуда не поедет.
В варианте думать и понимать, зачем вообще это было нужно. Какую проблему для нас решает синк? Это может быть про эмоциональный контакт с командой? Может, мы не умеем писать документацию, и поэтому говорить нам проще? Или, может быть, наш проект-менеджер хочет маниакально контролировать всё, и когда есть звонки, он спит лучше? Разобравшись с этим, можно понять, как мы можем поменять синк или создать что-то вообще заместо него. Но чаще я вижу, как люди строят процессы из состояния — ну, так правильно, я видел, так делали (или в книжке так писали).
Раз наш канал про ИИ, то вот как можно использовать GPT, чтобы думать из первых принципов. Рассуждая на тему того, куда поставить в комнате батарею — на полу или на потолке, вы можете начать думать, не ради ли дизайна её ставят снизу. Тут вас и спасет GPT — задайте вопрос: “А почему это было сделано так?”. Маск где-то точно говорит, что “только физика — это ограничение (точнее даже закон)”. Батарея снизу — потому что холод в комнате снизу, а тепло сверху.
И мне кажется, что на этом подходе стартапы выигрывают у корпораций, переизобретая из первых принципов привычные вещи вокруг. Будь то телефон, заказ такси или нейроимпланты в мозг. Надеюсь когда-то переизобретут и государство.
А что вам кажется, что пора перепридумать и как?
@aihappens