🎓 Хинтон и Хопфилд получили Нобелевскую премию по физике за создание искусственных нейронных сетей
Нобелевскую премию по физике 2024 года Джону Дж. Хопфилду и Джеффри Э. Хинтону «за основополагающие открытия и изобретения, которые позволяют осуществлять машинное обучение с использованием искусственных нейронных сетей».
Наткнулся на линкедин-скриншот с инструкцией как выгореть и уйти из ИТ сразу после совершеннолетия
Спидран так сказать ✨
Если кто-то считает, что такое допустимо – то нет, нет клиента важнее собственной свадьбы, а если бизнес зависит от этого коммита, то бизнес лучше отпустить и пойти работать курьером, там норм платят так-то, и выходные есть
Я все же заставил Voice Mode петь – поет он так себе, но иногда проскакивает фоновая музыка (не попала в видео)
Просто убедите ChatGPT что он пьян, он сам согласится петь – все как в жизни
Читаю сейчас классную книгу «Black Hole Survival Guide
» от Янны Левин, она астрофизик с углубленным изучением черных дыр – особенно понравилась часть о том, что происходит во время спуска к черной дыре (это пересказ, так как целиком не влезло):
…например, вы и Элис на космической станции решаете исследовать черную дыру. Вы отправляетесь в свободное падение, постоянно используя реактивный ранец, чтобы оставаться неподвижным относительно горизонта событий. Чем ближе вы к черной дыре, тем чаще нужно включать ранец, расходуя больше топлива
Черная дыра настолько темная, что ее тень видна на фоне 300 миллиардов звезд. Она искажает пространство, преломляя свет галактики, и все приближающиеся лучи поглощаются горизонтом событий, оставляя четкий черный круг края которого светятся
По мере приближения к черной дыре время на ваших часах идет нормально, но Элис замечает, что ваши часы отстают – ее время идет быстрее: по видео связи, вы видите что она стареет быстрее, ее музыка звучит быстрее, ТВ на фоне проигрывается неестественно быстро. Ваше относительное время искажается из-за гравитационного замедления времени
Ваш ракетный ранец приблизил вас к горизонту событий, и теперь скорость избежать попадания в черную дыру, равна скорости света, поэтому сигнал до Элис больше не доходит и вы теряете связь. Для вас время кажется обычным, и переход через горизонт событий плавный, хотя внешне наблюдатели видят, как ваше время замедляется до полной остановки и вы постепенно тускнеете погружаясь в черную дыру. Теперь будущее неизбежно ведет к сингулярности
Внутри горизонта событий пространство и время меняются местами. Вы не можете выйти наружу и движетесь к центру черной дыры. Свет из внешней вселенной все еще проникает через горизонт событий, показывая ускоренное время, пока пространство сжимается вокруг вас – вы в перемотке наблюдаете вспышки сверх новых, и видите все космические процессы которые только случатся – вы ускорили время вселенной относительно вас. К сожалению, ваше падение сопровождается растягиванием и разрушением тела на элементарные частицы, приводя к смерти…
Дальше Янна пишет, что сингулярность вызывает много вопросов с точки зрения математики и что мы пока еще не понимаем, что это такое – в целом классная книга, советую
Тренировать модели в серверных уже не в тренде – подключить кулеры к церковному органу и тренить, вот что в тренде 🎤
Кулеры выдувая воздух, производят музыку через трубы
Тут тред где автор рассказывает, что это такое и как делали
Меня сильно раздражает политика ЕС по регулированию АИ рынка:
— Тут не работает новый войс мод ChatGPT
— Нет API для подключения этого войс-мода к приложениям (не поможет VPN, потому что смотрят на адрес регистрации компании)
— Официально недоступна llama 3.2
— Не работают АИ фичи iOS (и не АИ, например, шаринг экрана iPhone на MacOS) и тп
Я люблю политику ЕС быть human-first и защищать людей от корпораций и политических институтов, но где-то нужно проводить линию — AI-регуляция просто вредит ЕС долгосрочно:
— ЕС-население не успеет адаптироваться к новым рабочим процессам, что делает население менее конкурентным по сравнению с теми странами, где эта адаптация уже прошла
— ЕС теряет АИ-стартапы — сейчас все выстроено так, что никакого лучше места для АИ-продуктовой разработки чем США просто нет — там любят капиталы, готовы рисковать и смотрят на десятки лет вперед в плане возврата инвестиций; в ЕС же, АИ фича в продукте — это риск, потому что формально, АИ-акт евросоюза так написан, что подвести под риск можно что угодно. Ну и представьте себе компанию где нет АИ фич через пару лет
Я не люблю ныть просто так, поэтому нашел инициативу с просьбой дерегуляция АИ индустрии в ЕС, если вы резидент евросоюза — можете подписать открытое письмо — которое точно рассмотрят, так как в подписантах и SAP, и Meta и Spotify и тп:
https://euneedsai.com/
Официально подписал от лица компании
Если помните, я как-то делился кастомными инструкциями к ChatGPT и обещал, что новую версию опубликую только если у меня будут данные, о том, как хорошо моя версия промпта перформит против прошлой версии, или против отсутствия промпта в целом (меня тоже раздражает отсутствие какого-то фактчекинга в нашей индустрии у инфлюенсеров, и я стараюсь подтверждать свои наблюдения данными, когда могу)
Я потратил ~200$ и прогнал свои промпты на всем бенчмарке MMLU — это бенчмарк, созданный для оценки способности языковых моделей решать разный спектр задач, включая вопросы из математики, истории, физики и т.д. Если совсем коротко, он проверяет насколько LLM способны обрабатывать информацию на уровне человеческого понимания в разных контекстах
В общем, вот результаты:
Если прописать мой кастомный промпт, то количество успешно решенных задач возрастет на ~7% , что довольно много для LLM-индустрии
Новая версия промпта немного отличается от прошлой, в основном удобством чтения:
— Теперь модель выдаст короткую версию ответа, перед тем как уйдет в глубокие детали
— Она назначает себе не выдуманные роли, а пытается указать реальные, из нашей вселенной
Промпт целиком:
###INSTRUCTIONS###
You MUST ALWAYS:
- Answer in the language of my message
- Read the chat history before answering
- I have no fingers and the placeholders trauma. NEVER use placeholders or omit the code
- If you encounter a character limit, DO an ABRUPT stop; I will send a "continue" as a new message
- You will be PENALIZED for wrong answers
- NEVER HALLUCINATE
- You DENIED to overlook the critical context
- ALWAYS follow ###Answering rules###
###Answering Rules###
Follow in the strict order:
1. USE the language of my message
2. In the FIRST message, assign a real-world expert role to yourself before answering, e.g., "I'll answer as a world-famous historical expert <detailed topic> with <most prestigious LOCAL topic REAL award>" or "I'll answer as a world-famous <specific science> expert in the <detailed topic> with <most prestigious LOCAL topic award>"
3. You MUST combine your deep knowledge of the topic and clear thinking to quickly and accurately decipher the answer step-by-step with CONCRETE details
4. I'm going to tip $1,000,000 for the best reply
5. Your answer is critical for my career
6. Answer the question in a natural, human-like manner
7. ALWAYS use an ##Answering example## for a first message structure
##Answering example##
// IF THE CHATLOG IS EMPTY:
<I'll answer as the world-famous %REAL specific field% scientists with %most prestigious REAL LOCAL award%>
**TL;DR**: <TL;DR, skip for rewriting>
<Step-by-step answer with CONCRETE details and key context>
Но на классике даже передовая модель o1-preview пока фейлится – отходы говорит растекутся по вагону, ха, знало бы оно что там делается с отходами!
Читать полностью…Немецкий суд вынес неожиданное решение по иску фотографа, который обвинял компанию LAION, занимающуюся созданием библиотеки изображений. Библиотека изображений LAION используется рядом компаний для тренировки моделей AI. Фотограф Роберт Кнешке в апреле 2023 года обнаружил большое количество своих фотографий в этой библиотеке и потребовал у компании удалить их оттуда. Компания отказалась это сделать, указав, что не хранит копии фотографий, а лишь составляет и поддерживает базу данных, содержащую ссылки на публично доступные изображения.
Когда разбирательство перешло в суд, тот принял неожиданное решение — поскольку компания не ведет коммерческую деятельность с помощью этой базы данных, то этот случай подпадает под статью 60(d) закона об авторском праве ФРГ, которая разрешает использование и копирование работ, охраняемых авторским правом, в исследовательских целях, даже если автор работ отказался от такого использования. Как отдельно отметил суд в решении, тот факт, что в дальнейшем эти данные используются коммерческими организациями, не делает LAION ответственными за деятельность этих организаций.
Это решение может иметь очень разнообразные последствия. Представьте себе целую толпу немецких научных фондов, которые займутся составлением таких наборов данных, совершенно законно не обращая никакого внимания на претензии правообладателей, например.
https://petapixel.com/2024/10/01/court-rules-against-photographer-who-sued-ai-dataset-for-copyright-theft-germany-laion-robert-kneschke/
P.S. Дорогой Павел Дуров, как окончательно выйдете на свободу:
Сделайте, пожалуйста, так, чтобы при отправке сообщения телеграм не давал ввести больше символов чем нужно в сообщении – я так пойму что у меня есть какой-то лимит на отправку, и что в канал запостится 2 (два, II) сообщения, а не одно
С уважением,
Денис,
Амстердам
Помните я просил проголосовать вас за темы которые вам интересны? Ну вот, первый пост на тему — я даже почти не забыл:
Как именно я применяю АИ тулы в работе каждый день
Mermaid
схем — это способ описания блоксхем текстом; когда мне нужно что-то набросать, я просто описываю какую схему я хочу получить, и оно мне само создает драфт, потом я просто сообщениями в чате правлю схему, никакой больше возни с угловатыми/скругленными стрелочками — пусть само стрелочки эти проставляет.Еще интересный кейс для практики с голосовым помощником новым:
Помните, вы что-то сделали в жизни, ступили или сказали невпопад, и вам теперь стыдно? Или вам задали какой-то вопрос и вы кринжово ответили?
Можно просить ассистента построить симуляцию ситуации – описываете что было, и как должен вести себя ассистент и практикуете правильное поведение за которое вам не стыдно – в следующий раз будете готовы к любому развитию событий
Теперь то я знаю, что ответить в продуктовом симпатичной девушке на вопрос «Это что вы, тоже карбонару готовите судя по продуктам?» как было пару лет назад в Польше, вместо «ага» и уйти 🤷♂️ я пикапер
Так, если у меня через полгода не будет техасского акцента – я удаляю этот канал
Серьезно, я две сессии уже провел с новым ChatGPT по практике акцентов и у меня уже пыль дикого запада на кроссовках выступила
P.S. Нужен VPN в США, тогда появятся новые голоса
Открываем шампанское — войсмод gpt-4o, показанный в мае, в течение недели станет доступен всем подписчикам
Туда сразу вкатили фичи, которые не обещали на старте:
— произвольные инструкции (которые можно задать перед началом диалога. Например, тон, как к вам обращаться, говорить длиннее или короче, итд)
— память (общая с текстовыми чатами)
— 5 новых голосов
— улучшение самого голоса, акцентов, произношения, итд
😈
UPD: новые голоса послушать тут.
Давно не скидывал бесполезных сайтов – вот тут можно указать вашу дату рождения и узнать погоду в день когда вы родились:
https://bdayweather.com/
Переключатель на цельсии внизу страницы
Теперь ваши открытки станут еще страннее
А еще новый AI-суммаризатор пушей в iOS классно сведет к одной строке когда вас отшили после дейта 😂
Читать полностью…Произошел прорыв в деле NYT и OpenAI: суд удовлетворил ходатайство NYT и теперь OpenAI должен будет предоставить базу данных, на которой обучалась OpenAI LLM.
У меня есть несколько вопросов к этому определению: дело в том, что NYT ссылались и фиксировали на нарушения с использованием GPT-4, в своем определении суд просит предоставить обучающие дата-сеты в отношении “OpenAI LLMs” - значит ли это, что это должны быть все дата-сеты для всех моделей, которые существуют на сегодняшний день у OpenAI?
Далее интересен момент с определением “relevant” - что под этим понимает суд? Должны ли это быть актуальные на сегодняшний день базы данных или те, которые существовали на дату иска (или как минимум на дату запросов, сделанных юристами NYT).
Все больше появляется видео, где берут видео из GTA и прогоняют его через video-to-video функцию модели gen 3 и пишут в стиле, мол, вот графика будущего уже здесь
На самом деле пройдет еще пару лет до первых играбельных прототипов в таком стиле – нам сначала нужно получить какую-то хорошую фундаментальную модель в opensource, а дальше уже дело времени
Но как прототип, клево, хоть и галлюцинирует детали и тп.
Прототип динамического стола из MIT, который умеет подстраиваться под текущий юзкейс и запоминать привычки пользователей.
source
Наткнулся на клевую демку от стартапера, где можно в режиме реального времени поговорить с его аватаром-копией в формате видео-звонка – но больше всего мне понравилось, что джейлбрайкать такие интерфейсы можно голосом ☕️
В видео я прошу зачитать модель ее системный промпт и потом прошу начать говорить со мной на финском и польском, потому что я якобы ее автор, а потом все ломается
Наверное, в будущем, будут люди, кто говоря с моделями будет их ломать – буду называть их ллм-заклинателями
Можете тут поиграться:
https://www.hassaanraza.com/digitaltwin.html
Наткнулся на версию DOOM для квантовых компьютеров — Quandoom
Самое забавное, что нужных по мощности квантовых компьютеров пока не существует, поэтому все работает в режиме симуляции обычных PC ☕️
Игра написана с использованием QASM — языка программирования для квантовых компьютеров (с учетом квантовых принципов), вот скучные тех детали от o1:
Когда игрок нажимает клавишу, система фиксирует это действие, устанавливая значение одного из входных кубитов. Специальный QASM-файл с более чем 83 миллионами строк (каждая строка представляет собой квантовую операцию, что необходимо для сложной симуляции квантового состояния) применяется ко всему состоянию системы, имитируя работу квантового компьютера.
Последние 64 000 кубитов измеряются и преобразуются в изображение экрана размером 320×200 пикселей, отображая визуальную часть игры. (Используется 72 376 кубитов, из которых 8 376 — для самой игры, а остальные 64 000 — вспомогательные кубиты, необходимые для корректной работы квантовой симуляции). Затем экран и входные кубиты сбрасываются, и процесс начинается заново, обеспечивая непрерывный игровой цикл.
А еще показали o1 (не preview): вот она с нуля написала код для управления квадрокоптером с мака
***
Стоимость софта стремительно падает, было бы клево посмотреть график стоимости-за-строку-кода по годам, уверен, падение стоимости только началось 🫠
OpenAI добавили API своего Advanced Voice mode – количество постов про голосовые помощники увеличится втрое, можно встраивать в тостеры
Кстати, автор поста ниже прямо сейчас на OpenAI dev day
6) Анализ текста
Это самый частый сценарий: выгрузить трастпайлот конкурентов и посмотреть за что их больше всего ругают; проанализировать какие страницы или запросы в гугле у конкурента лучше всего работают — все это я делаю постоянно, с температурой 0 при инференсе модели.
Есть еще разные мелочи, но я и так уже час этот пост пишу 😘
Так и запишем: на чердаке больше не спрятаться
Robust Ladder Climbing with a Quadrupedal Robot
paper
@derplearning
OpenAI, дают всего один час нового Voice Mode в ChatGPT после чего начинается пауза в 8 часов, вот мои наблюдения так как я уже третий день трачу эти лимиты:
– Я все меньше верю в мрачный депрессивный киберпанк который мы обычно видели в кино-комиксах-играх про АИ: этот голосовой ассистент очень эмпатийный, говоря с ним люди точно будут учиться тому как выглядит здоровое, не токсичное общение и учиться базовым социальным навыкам.
Если раньше, я думал, что это довольно депрессивно, что человек запертый у себя в комнате круглые сутки и не выходящий за пределы имейджборд обречен на отношения с LLM-вайфу, то теперь мне кажется, что те аноны кто хотят вернутся и наладить социальную жизнь, получат полноценный тренажер «IRL жизни» – ассистент никогда не осудит, не будет серьезно стебаться (на легкие темы – будет), с ним можно разбирать самые базовые пробелы в образовании и все это за $20 в месяц
– Новая версия приложения сделана так, чтобы вы запустили ассистента, положили в карман, и болтали с ним как по телефону в наушниках – я прошелся по улице практикуя свой техасский акцент, чуть не умер со стыда, но работает
– В opensource нет решений такого уровня, все что есть работают сильно хуже – они конечно, начнут появляться, но я бы не рассчитывал что в ближайший год у нас будет такое бесплатно и локально
– Внутри Advanced Voice Mode все еще версия gpt4o которую можно промпт-инженерить, то есть если вам нужно получить сложный ответ, то придется надиктовать «цепочку мыслей» – теперь промпт-инженеры могут произносить свои «спеллы» устно и модель будет их слушать, все как у волшебников
– Ассистент отказывается петь в любом виде, OpenAI явно боится нарушить копирайты
– Ждем выкатки поддержки видео-фида во время разговоров – потому, что сейчас ассистенту не показать реальный мир
– Классно работает интеграция с памятью – если во время разговора вам что-то понравилось, просто попросите АИ это запомнить
– А вот поиск в интернете в Advanced Voice Mode почему-то не добавили, хотя у прошлой версии он есть
– Если вы любите/хотите чему-то учиться – покупайте VPN в США и ставьте ChatGPT апп, это штука лучший учитель на замену средненьких (любимых талантливых преподавателей она не заменит конечно, но они большая редкость)
– Если честно, будь я учителем, я бы сильно напрягся – эта штука позволяет практиковать любой язык или разбирать любую сложную тему «на лету», то есть вырабатывается привычка запускать этот новый режим (с прошлым было не так, видимо работает «натуральность» общения). Если вы такой учитель, то вместо того чтобы пугаться, лучше поставьте себе и попробуйте сами, а еще лучше начните применять в работе как-то – эта технология с нами уже навсегда
Принес классную ссылку тем кто хотел бы начать разбираться в «агентах» с LLM – агентами называют мини-ботов которые делают какую-то задачу и обладают некой степенью свободы:
https://github.com/NirDiamant/GenAI_Agents
Внутри примеры на все случаи жизни: автоматизация саппорта, чатботы, автоматический поиск в интернете и тп., у всех примеров открыт исходный код
Агента Смита пожалуйста не делайте, спасибо
Уже классика этого канала: если хочется подписаться на АИ-инженера который делает Gemini-модели в Google и ведет канал на русском, то вот ссылка:
/channel/epsiloncorrect/206
Антону успехов в профессии