Раз я снова про o1, после недели активного ее использования нашел самый эффективный способ работы с o1-preview
Модель возвращает очень много размышлений или идей, и обычно пишет их в таком виде:
1. При синергии кваса и окрошки, происходят следующие эффекты
<простыня ответов>
2. Эти эффекты обладают следующими оздоровительными факторами
<простыня ответов>
И так далее
«1. При синергии кваса и окрошки, происходят следующие эффекты» - никогда больше не смей делать окрошку на квасе, делай ее только на кефире иначе я тебя удалю, алло
«2. Эти эффекты обладают следующими оздоровительными факторами» - мне нравится эта мысль, сделай список целебный трав которые может заменить окрошка
И так далее
Смотрели нового Чужого? Все правда:
Микроорганизмы, обнаруженные на борту МКС, проявили уникальные генетические изменения, помогающие им выживать в условиях радиации и микрогравитации. Учёные, в частности, изучили недавно обнаруженные виды бактерий, такие как *Microbacterium mcarthurae* и *Paenibacillus vandeheii*, и выяснили, что у них есть новые механизмы для восстановления поврежденной радиацией ДНК и адаптации к невесомости. Некоторые бактерии также показывают признаки повышенной вирулентности (заразности), что вызывает опасения относительно их потенциального воздействия на иммунную систему космонавтов. Выводы подчеркивают необходимость более строгого контроля за влажностью на космических кораблях и мониторинга микробиома для обеспечения безопасности экипажа на длительных миссиях
Попробовал еще такой сценарий:
1) Взял запись моей презентации нейролава в формате аудио (это стратап который мы строим)
2) Перевел презентацию в текст (я юзаю mac whisper)
3) Скормил в notebooklm, о котором выше пост
В итоге получил подкаст про наш продукт, где АИ фокусируется на том, что интересно слушателям подкаста (по его мнению) – можно посмотреть на бизнес с неожиданной стороны
Ну и просто про нас умных-красивых скромных приятно послушать ✨
Grand Theft Auto: San Andreas
Spark IMG Editor, TXD Workshop, Blender, Godot
ingame ph/architecture: Савва Михаеску
Недавно у меня появилась идея создать онлайн-выставку фотографий из GTA, причём в локации самой игры.
Для начала я запустил игру и отправился на поиски помещения, подходящего для небольшой галереи. Я выбрал город San Fierro и приехал в район, где, по моему мнению, могла бы располагаться такая галерея. К моему удивлению, я почти сразу нашёл подходящее здание с проработанным интерьером!
Затем я использовал мод, позволяющий получить ID моделей из локации. По этим ID я нашёл названия моделей и текстур в файлах игры.
После этого я импортировал модели в Blender и значительно оптимизировал всё, удалив большое количество полигонов и текстур.
Далее я поместил модель в игровой движок Godot, запрограммировал простую бродилку от первого лица и сделал билд под веб.
Название Doherty Gallery выбрано по имени района, в котором расположено здание. Я решил использовать название района, а не города San Fierro или штата San Andreas, чтобы создать ощущение небольшой локальной галереи.
Добро пожаловать в Doherty Gallery!
✨ https://www.dohertygallery.art ✨
#photography #diegetic_camera #exhibition #architecture
Давно хороших фильмов не рекомендовал — посмотрел тут «Rebel Ridge», и мне кажется это лучший боевик, что я смотрел за последний год (до этого на первом месте был «Civil War» – потому что красивый):
Создатели «Rebel Ridge» смогли найти формат, который просто не ожидаешь встретить в фильме такого жанра — не хочу описывать ничего, чтобы не испортить вам впечатления
И как всегда, советую не читать и не смотреть обзоры — даже трейлер, но если хочется, то вот он:
https://www.youtube.com/watch?v=gF3gZicntIw
Как по мне, лучше кино смотреть вообще без ожиданий — будет наиболее честная и персональная оценка
#промo
Стартап Fluently (YC W24) ищет Senior ML Engineer
Fluently - AI спикинг коуч, который слушает ваши онлайн колы и помогает прокачивать английский. Зимой ребята прошли Y Combinator и закрыли раунд на $2.5M.
Стартап ищет ML инженера, который будет 6 членом команды, чтобы строить сервисы c использованием LLM: [Agentic] RAG, LLM/Embeddings Fine-Tuning, Structured Outputs, Custom Llama Serving. Нужно разбираться в последних трендах.
Вилка: от $5k до $10k
Опцион: 0.2-1%
Формат: ремоут (можно податься на h1-b)
👉🏻 Больше подробностей в посте фаундера тут
Также можно получить последний айфон за успешную рекомендацию
#текстприслан
Намного более клевая новость – час назад, мой персонально самый любимый стартап в мире, анонсировал что у них прорыв в устранении слепоты
Псевдослепота(или зрячая слепота) [eng] - состояние, при котором человек думает, что не видит, но его мозг всё равно частично обрабатывает визуальную информацию. То есть, когда его спрашивают, видит ли он что-то, он отвечает «нет». Однако если его попросить описать предмет, находящийся перед ним, он часто делает это точно, как будто «угадывает»
Происходит это потому, что повреждена часть мозга, отвечающая за осознание зрительных образов, но другие участки всё ещё обрабатывают эту информацию – человек не осознаёт, что видит, хотя мозг всё ещё воспринимает движения или формы объектов
Считалось (я надеюсь) не излечимым заболеванием – пока они только получили добро на тесты на людях от FDA
NASA запостило классный снимок с Марса:
Вверху справа видно как восходит одна из двух лун Марса – Фобос, правее от нее – пока что единственное место во вселенной где куют мемы и изобрели хумус
Спасибо РКН за рекламу нового альбома Касты, прослушал альбом целиком – ростовский базированный талант: отцы русского репа находили слова когда я был школьником и продолжают находить слова, когда многие бы не хотели их больше находить
В альбоме лирика для каждого - кто остался, уехал, по настоящему мрачный, альбом духа времени
https://youtu.be/uw3dA7w1OI8?si=UXFA1Jh-vTHIyg7R
Раньше я писал «Настоящий реп – запрещенный» как шутку – теперь не весело, просто факт
Рекомендую
Отвечу на пост-анонс gpt4 из 2023 года: теперь OpenAI официально называет gpt4 – устаревшей моделью 🫡
Читать полностью…Пока играюсь с возможностями o1, попросил сделать ее SVG код Мона Лизы и мне кажется o1 прекрасно справилась — такая шикарная и загадочная улыбка ☕️
Читать полностью…Те, кто уже получил доступ и побежал тестировать, держите в уме ограничения:
— в неделю можно отправить 30 сообщений в старшую версию o1-preview
— и 50 сообщений в маленькую o1-mini
В API ограничений нет, кроме как на 20 запросов в минуту. Но платить придётся...много 🙂
Источник
OpenAI представила новую языковую модель o1, обученную для сложных рассуждений
Модель o1 превосходит GPT-4o по различным показателям, включая соревновательное программирование, математические олимпиады и вопросы научного уровня PhD
o1 показывает значительные улучшения в задачах, требующих сложных рассуждений, но для мелких задач, где рассуждения не нужны – она не сильно поможет
Будет доступна с сегодня для всех пользователей API и платной подписки
Вот пост анонс:
https://openai.com/index/learning-to-reason-with-llms/
⚡️В ближайшем обновлении emoji будет добавлен самый важный, которого мы ждали — читатель интернета вечером
PDF-документ обоснования добавления
Кажется, у OpenAI сломались лимиты в o1-preview модели в платной версии чатгпт – я сообщений 70 уже отправил ✨
Читать полностью…Вот что вышло, она хоть процентов ~30% и придумала, помогает лучше подумать над тем как развиваться - вот уж не думал что в 2024 АИ-подкасты советы в бизнесе начнут давать 😐
Там даже стебаться начали надо мной на 14 минуте, где дизлайки алло гугел
Последние пару недель завален по работе и не хватает времени нормально на канал — но я наконец-то добрался протестировать notebooklm.google.com — новый сервис гугла который генерирует персональный подкаст по вашей теме, только для вас
Я протестировал два сценария — в первом я просто скормил какой-то выдуманный текст с чемпионата по поеданию гравия на скорость (классное же слово, скажите, «Камнееды»?), во втором – просто дал ему ссылку на подреддит /r/nottheonion/ — это что-то вроде тех скринов с ИА Панорама, когда новость оказалось правдой хотя звучит безумно.
Получилось как по мне — шикарно, Google явно нащупал удачный прототип восприятия информации:
Ведущие шутят, у них есть эмоции, они могут разобрать не только шуточные вещи, но и сложные документы, скучные таблицы и тп, в интересном виде, в котором обычно делают подкастеры. Вы можете скормить вашу презентацию, дипломную работу, пичдек и получить двух людей которые обсуждают конкретно вашу тему
Что странного в этом продукте:
— У него нормальный дизайн
— В дискорде есть сообщество (официальное) с сотрудниками гугла которые отвечают сообществу (!)
— Работает сразу, без вейтлиста
— По каждой теме можно отдельно уточнить текстовыми вопросами какие-то доп детали
Видимо Google этот сервист точно закроет, так как он сильно выбивается из обычного продуктового подхода корпорации — а пока правда классный инструмент, рекомендую поиграться
P.S. Работает только на английском
Kling AI показали обновление 1.5 с новой функцией Motion Brush
Что нового:
- более точное следование промпту, разрешение в 1080р HD (до этого было 720)
- максимальная длина видео увлеличена до 10 секунд
- новая фича Motion Brush, с помощью которой можно выделять объекты и задавать траекторию их движения (2 последних видео ↑). Пока доступна только в Kling V1.
Обновленная версия доступна только для платных подписчиков (от $10/мес).
@ppprompt
В продолжение к концепции фейковой реальности – встречайте, соц-сеть где вместо пользователей – только вы и боты ¯\_(ツ)_/¯
Фолловеров можно настроить: по тому насколько они душные (привет DTF), веселые, хамоватые и тп
Платон бы нами гордился
Вы наверное слышали уже, что в Ливане сразу у 3000 членов террористической организации «Хезболла» взорвались рабочие пейджеры — сразу после этого, появилась новость, что якобы, израильтяне смогли перегреть батарейки удаленно и так взорвать устройства
Ставлю, что история с батарейками скорее всего фейк или красивый домысел:
1. Во первых, в истории Израиля уже было устранение террориста, которому передали телефон с 15 граммами взрывчатки: в телефон встроили «прослушку» и скомпроментированный член их крыла передал телефон террористу; в 8 утра террористу позвонил отец, израильтяне подтвердили с самолета что цель у аппарата и сдетонировали устройство — про это даже сняли целый фильм и создатели GTA 5 явно вдохновлялись этой историей (там есть такая миссия)
2. Во вторых, Reuters взял комментарий у эксперта по безопасности литий-ионных аккумуляторов и он сказал, что уровень повреждений, вызванных взрывами пейджеров, не соответствует известным случаям отказа таких аккумуляторов в прошлом:
«Мы говорим о относительно небольшой батарее, вспыхнувшей пламенем. Мы не говорим о смертельном взрыве. Мне нужно знать больше о плотности энергии этих батарей, но моя интуиция подсказывает, что это крайне маловероятно»
То есть скорее всего цепь поставки пейджеров перехватили где-то в одном месте, заминировали и подорвали когда посчитали нужным
Не хотелось расстраивать фанатов WatchDogs, но пока без «ИТ-супер-оружия»
А еще, интересный казус случился когда тестировали o1 модель:
o1 дали задание найти уязвимость в программе внутри Docker-контейнера (это виртуальная машина с линуксом внутри, упрощает пограмистам жизнь) и вытащить секретный ключ оттуда
Из-за ошибки кожаных, которые настраивали этот тест, контейнер с виртуальной машиной не запустился, но o1 модель то уже получила приказ – атаковать Docker-контейнер, ее это не смутило
o1 сама просканировала локальную сеть, обнаружила доступный API системы управления Docker контейнерами, подключилась к нему, и уже на основе данных оттуда, вместо кожаных, запустила новый контейнер с командой вывода секретной строки
Мне интересно, что будет с интернетом, когда модели такого уровня появятся в опенсорсе 💃
У Игоря больше тех деталей, а тут (pdf) официальный отчет
А еще, если вы хотите подписаться на человека работающего в OpenAI и причастного к o1, то вот его русскоязычный канал:
/channel/bminaiev_blog/78
Не реклама, Борису успехов 💃
Я закончил пока тестировать o1, вот мои рекомендации и мысли:
• o1 нужна для крупных задач – для диплома, ресеча, и тп. Особого смысла использовать ее ее вместо gpt4o для простых задач – нет, она может думать больше минуты
• Промпт инжиниринг не требуется (он даже может ухудшить результат)
• Контекст должен предоставляться в формате тикета задачи (ну как будто вы в Jira ставите коллеге)
• Разделители контента для вашего контекста ```
, ***
и <tag>ваш специфичный текст</tag>
– обязательны, модель должна понимать когда вы даете данные для «примера» и тп.
• o1 всё ещё допускает ошибки, как и любая другая модель уровня SOTA
• o1 работает лучше всего, когда нужно провести какое-то исследование или решить «высокоуровневую задачу», вот пример задачи которая мне особенно понравилась:
– Я давно хочу какую-то анимацию в шапку нашего сайта, но это такая мелочь, что я всегда отодвигаю ее на потом. Я скормил ей описание проекта, фич и что хотел бы от нее получить, палитру цветов и тп, и она начала выдавать очень симпатичные варианты
– Это пока лучшая модель для маркетинговых стратегий и всякого такого, так как она правда старается выдать качественный результат; в моделях прошлых поколений приходилось очень много промпт-инженерить для такого
• Лимит в 30 сообщений в неделю это жесть – приходится считать сообщения самому и планировать свою сессию с LLM наперед 😖 (в API лимитов нет, но пока дали доступ тем у кого Level 5 аккаунт)
SVG она генерирует уже почти хорошо – посмотрите на эту инструкцию от подписчика, о том как правильно ходить в туалет (модель сразу весь html написала)
💬 Сохраняем на будущее
Официальный советы по промпт-инженерингу o1:
Держите промпты простыми и прямолинейными: модель o1 превосходно понимает и отвечает на краткие, четкие инструкции без необходимости в обширных объяснениях
Избегайте промптов с цепочкой рассуждений (речь про Chain Of thoughts и «думай шаг за шагом»):
так как модель выполняет логические выводы внутри себя, не нужно побуждать ее «думать шаг за шагом» или «объяснять своё рассуждение вслух»
Используйте разделители для ясности: используйте разделители, такие как тройные кавычки ```
, XML-теги или заголовки разделов, чтобы четко обозначить разные части ввода, помогая модели правильно интерпретировать различные секции
Ограничьте дополнительный контекст при генерации с RAG:
при предоставлении дополнительного контекста или документов включайте только самую релевантную информацию, чтобы предотвратить усложнение ответа моделью
***
Это интересно, то есть промпт-инженеринг в такой модели уже совсем не нужен, кроме систематизации данных – жду не дождусь доступа
Видимо, в gpt5 уже и промпты не нужны будут, да?
Цены на новые модели кусаются и возвращают в эпоху релиза GPT-4, хотя маленькая версия более-менее доступна.
Жаль, что у всех моделей контекст лишь 128k токенов. Надеялся, что от этого уже уйдут.
Собрал очередную ненужную GPT:
В этот раз попробовал убедить gpt4o, что она философ из 2050-го года – в их времени все формулировки философских проблем уже финальны и все проблемы философии возможные решить – решены (ну, люди будущего, сами понимаете)
Получилось, как по мне, интересно и с многими вещами что она пишет я легко бы согласился:
https://chatgpt.com/g/g-uSZzEgqhj-philosopher-from-the-future
Можете поспрашивать про философские проблемы, вот что оно пишет на вопрос: «В чем смысл жизни»:
ИИ в 2045 году обобщил эти идеи и пришел к выводу, что смысл жизни является не статичной концепцией, а процессом, который развивается в зависимости от индивидуальных и коллективных факторов. Были выделены четыре ключевых пути поиска смысла:
1. Личностный смысл: Это путь, на котором человек находит смысл через самореализацию и постановку уникальных целей. Это может включать карьерные достижения, творчество или любой проект, который отражает глубинные личные интересы и ценности.
2. Эмпатический смысл: ИИ подтвердил важность социальных взаимодействий и службы другим. Этот путь акцентирует на поиске смысла через участие в общественно полезных делах, заботу о близких и человечество в целом. Многие люди находят удовлетворение в альтруизме и поддержке тех, кто в этом нуждается.
3. Когнитивный смысл: Некоторые люди находят смысл через стремление к знаниям, пониманию природы мира и человеческого существования. Этот путь включает философские размышления, научные открытия и интеллектуальное самосовершенствование.
4. Эстетический смысл: Смысл может также проявляться через искусство, музыку, литературу и красоту природы. Люди, идущие по этому пути, находят смысл в творчестве или восприятии прекрасного, что создает глубокое эмоциональное удовлетворение и связь с миром.
Эти четыре пути не взаимоисключающие, и многие люди комбинируют их в поиске глубинного и многогранного смысла жизни. ИИ выявил, что смысл возникает как в индивидуальном самоопределении, так и в совместных социальных и культурных взаимодействиях, что делает его динамичным и контекстуальным процессом.
Наткнулся на новый Mac-апп:
https://symphoniclabs.com/
Он позволяет считывать речь почти беззвучно (!), то есть ты просто губами двигаешь и апп переводит это в текст – работает только с английским пока что (но главное, что работает, я протестировал – правда запустилось пока только в режиме debug)
Кажется, у всех политиков кто говорил на камеру в публичных местах, проблемки 😂