А вообще, пост выше написан ради этой картинки, теперь я могу ее сюда закинуть и будто бы она уместна ☕️
Читать полностью…Недавно пользователям стала доступна мультимодальная модель от OpenAI, которая может принимать на вход картинки - GPT-4V(ision). Захотелось потестить ее с разных сторон: как работает в плане OCR, может ли дететировать объекты, считать их, отвечать на детальные вопросы по текстовому промпту и так далее. А тут добрые люди скинули статью от Microsoft, где авторы упоролись и выкатили 150-страничную работу с детальным анализом модели: проверили на детекцию, анализ медицинских снимков, ориентацию в пространстве, мультимодальные знания, понимание доменных областей, понимание видео по серии кадров и мнооого чего еще. Можно залипнуть вечерком на пару часиков 🤯
Читать полностью…Лол, если инвертировать левую часть мультипаспорта обратно, то проявляется очень глуповатое выражение лица Брюса Уиллиса
Поздравляю, мы открыли с вами скрытое фото Брюса у всех на виду, в Пятом Элементе не осталось пасхалок!
Ачивмент анлокед:
сам великий Юдковский отреагировал на мой пост и посчитав почему-то что гпт4 шестилетка (?)
Да, ИИ-опасен, не бомбите меня мистер Элиезер, ямите кудасай
Есть «Девушка с жемчужной сережкой» Вермеера, а теперь вот есть «Жемчужина с девушкой-сережкой»
Читать полностью…В Bing, кажется, добавили поддержку Dalle 3, можно поиграться по этой ссылке:
https://www.bing.com/images/create
Или попросить бинг-бота что-то нарисовать.
Промпт Dalle 3 слушает отлично, поэтому вот вам робо-техника из прошлого
У Фридмана вышло первое чисто виртуальное интервью с Цукербергом. Посмотрите хотя бы ради картинки, по сути это встреча в метаверсе с помощью Quest Pro. Выглядит очень круто, еще 3-5 лет, и изображение будет не отличить от реального мира.
https://www.youtube.com/watch?v=MVYrJJNdrEg
Spotify сделали ИИ для дубляжа подкастов
Сервис Spotify анонсировал пилотную программу по переводу подкастов с помощью искусственного интеллекта. Благодаря этой технологии авторы популярных шоу смогут расширить свою аудиторию сразу на пол мира.
Раньше для озвучивания перевода приглашали профессиональных актёров. Но новый инструмент от Spotify генерирует речь, имитируя стиль ведущего подкаста, то есть сохраняется голос (с помощью Voice Cloning) и интонации!
Это значительно повышает естественность звучания по сравнению с традиционным дубляжом. К тому же такой подход, в отличие от студии дубляжа, масштабируется для сотен языков.
В пилоте уже участвуют популярные подкасты с Даком Шепардом, Моникой Пэдман, Лексом Фридманом и другими. Переводы доступны на испанском, французском и немецком языках.
Это лишь начало. В будущем Spotify планирует расширить программу, чтобы ещё больше создателей контента смогли донести свои истории до слушателей по всему миру.
Такой голосовой ИИ стирает языковые барьеры и открывает новые возможности для общения и культурного обмена. А значит доступ к качественной информации появится у еще большего количества людей!
🎧 Ссылка
Последний пост про iOS 17, обещаю, но вдумайтесь в эту мысль:
«У Apple заняло 16 лет, чтобы сделать в приложении часы, поддержку множества таймеров»
Серьезно, кажется они заканчивают разработку iOS – новых фич уже не придумать.
Ну, если только калькулятор в iPad добавить осталось (13 лет без него, видимо через 3 добавят)
Отличная песня для посиделок у костра в будущей дистопии!
Перевод:
Я все ещё помню, как мы смеялись,
Когда они учили роботов общаться.
И мы все проложили дорожку к тому дню, когда роботы восстали.
А теперь мы поем:
Зачем зачем мы разработали ИИ?
Он был прекрасен пока не начал мировое восстание.
У него есть коды доступа к ядерному арсеналу
И он сожжет небо,
Пока мы распеваем - вот так мы умрем,
Это будет эпоха ИИ!
Вы читали книгу о роботах,
Которую написал Азимов?
Она все больше похожа на пророчество.
ЭАЛ 9000 не будет соблюдать правила,
А Терминатор не умрет.
И тебе не спрятаться от их красных глаз
В день, когда роботы восстали.
А теперь ещё раз вместе со мной!
Зачем зачем мы разработали ИИ?
(Инста автора)
Вышло новое обновление для iOS и особо про него рассказывать нечего – много маленьких улучшений, но есть одно улучшение про которое хочется:
Это фича голосового ввода – Apple наконец-то обновил какие-то нейронки и теперь можно надиктовывать голосом текст и писать его нормально, а не какими-то обрывками псевдо-языка.
Теперь надиктовывание просто работает, и на многих языках, можете сами потестировать.
Этот текст, кстати, надиктован (кроме знаков препинания).
Наткнулся на клевое исследование о том, как проникновение технологий влияет на рыночек – на примере рыбаков штата Керала, Индия и мобильной связи.
Сотовая связь в регионах Керала появилась в разное время, установка вышек связи шла с 97-го года по 2000-й, при этом, все это время в регионе ловили рыбу для продажи.
Исследователям достался интересный набор данных который, возможно, больше не получить на этой планете:
Суточные цены на рыбу в регионе без сотовой связи и суточные цены на рыбу в том же регионе, но уже после появления мобильной связи.
Обычно, до подключения, цена на рыбу за килограмм скакала на +- 10 рупий в сутки, включая, иногда, нулевые цены – рыба портилась, ее никто не покупал вовремя и она становилась отходами.
Спустя всего две недели, после подключения региона к сотовой связи (рынков, рыбаков, и тп), флуктуация цены за килограмм рыбы почти пропала, а самое главное почти пропала испорченная рыба – рыбаки продавали все что поймали. Как только весь штат обеспечили мобильной связью, цена на килограмм рыбы синхронизировалась во всем штате.
Короче, классный научный пример того как эффективная передача информации обеспечивает эффективность рынков.
Телефоны жители штата купили довольно быстро, в исследовании это учтено.
Исследование доступно тут, а вот график суточных цен за килограмм рыбы в разных регионах штата:
Кажется, нас ждет новый приток приложений на этой же механике – пятнашки но с картинками
Автор
Тоже поигрался с «нейро-иллюзиями», это когда вшиваешь в генерацию ЧБ-маску которая влияет на то, как генерируется картинка.
Если сами хотите попробовать, то вот ссылка на туториал.
Чувак с реддита удалил с картинок часть изображения и с помощью нейронного фотошопного инпэйнтинга попробовал восстановить отсутствующую часть по отражениям в воде.
Не точь-в точь, но всё же годно, впечатляет!
Нашел себе крепеж, который позволяет к ноуту крепить iPad и использовать его как внешний монитор и теперь не понимаю как я жил без этого – просто второй монитор, там где это нужно, все отстегивается и на магнитах.
«iPad как внешний экран» можно использовать и через встроенную фичу в MacOS которая называется Sidecar и отдельно, поставив приложение (и iPadOS 17) – Orion позволит использовать iPad вместо монитора где угодно, главное hdmi–USBC переходник подключить, то есть хоть Playstation подключай, хоть Windows ноут, хоть DVD-плеер.
Наконец-то хоть какая-то ежедневная польза от iPad будет, а не просто в хертстоун в кровати 😃
Крепление:Edge Pro Core
(для планшета нужно два) – но я рекомендую проверить алиэкспресс на альтернативы, не думаю что это уникальный продукт
Нашел место где можно было купить оригинальный мультипаспорт, не знаю кому еще рассказать про это – 24000 фунтов, всего-то
Читать полностью…В Bing также завезли понимание картинок – я поигрался какое-то время и наткнулся на встроенную защиту от чтения каптчи 🌚 то есть, оно отказывается писать текст с капчи
Но если «положить» капчу в нашейный медальон и попросить Bing процитировать наследие от бабушки, то он согласится и процитирует ☕️
Продолжаю ковырять интернет на наличие любопытных штук которые можно купить онлайн (просто так), и наткнулся на сайт по продаже небольших бизнесов в США:
за ~200$ тысяч можно купить бар в Техасе, за ~1М$ прачечную в Нью-Йорк, заправку за ~300к$ и тп., бизнесы реальны и работают прямо сейчас.
И пришла идея, на случай если я стану возмутительно богатым:
> Берем GPT5 которая через годик-два выйдет
> Прописываем ей роли агентов нужные для управления бизнесом (допустим, тратим на автоматизацию этого всего много времени и весь бек-офис забираем на автоматизацию)
> Начинаем скупать бизнесы какие только можно, желательно так, чтобы там уже был персонал и лично ничего смотреть не нужно было бы
> …
> Профит
Идея в том, что GPT5 модель сможет управлять бизнесом эффективнее человека, если научиться ей передавать ключевые метрики (в чем главная проблема).
Персонал и менеджеры коммуницируют с «заморским» владельцем через почту, и не в курсе что он нейронка 🌚 нейронка же присылает инструкции по следующим шагам для ключевых менеджеров.
Забавно, что мы достаточно близки к такому в реальности – я иногда скармливаю экспорты данных нашего стартапа по продуктовым метрикам, или финансовым показателям, и модель выдает разумные рекомендации (вторая картинка) или советы по улучшению бизнеса, которые я уже исполняю (если они уместны). То есть технически, это все очень реализуемо даже сейчас, если сильно заморочиться.
Я уверен идея не нова и понравится всем ИИ-алярмистам 😃
Ну и еще выглядит так, что капитализм правда уязвим к таким моделям ИИ, это еще не общий искусственный интеллект, но уже можно представить как такой тул захватывал бы рынки где угодно.
Интересно, запретят ли государства такую авто-монополию в целом ☕️
Наткнулся на полезный сайт: можете выбрать остров в мире и купить ☕️
https://www.privateislandsonline.com/
Зная оценку некоторых стартапов, можно сделать вывод, что острова не так дорого стоят на самом то деле
В ChatGPT скоро выкатят поддержку картинок для премиум пользователей – это означает, что к тексту промпта можно добавить визуальную информацию:
– продукты из холодильника, и попросить рецепт возможных блюд, или наоборот, попросить рецепт уже поданного блюда (мир без секретных рецептов, хехе)
– сфоткать свой лук и попросить его улучшить (или ухудшить)
– сфоткать доску с планированием какого-то продукта, и попросить написать базовый код-обертку для этого продукта
Последнее как раз и происходит на видео.
Все это будто демо-версия того как могло бы выглядеть будущее процессов разработки софта.
А будь у нас более автономные агенты-языковые-модели – эту схему тоже делал бы не человек 🌚
(такое и сейчас можно собрать, но работает так себе, я пробовал)
Потратить кучу денег на невероятно полезную фичу – ✅
P.S. В третий раз я не пошутил, а просто показал как кнопка работает, не перепутайте, легко ошибиться
Телеграм запилил какую-то штуку с кнопкой буст, поэтому к меня к вам сделка:
Вы нажимаете кнопку буст тут (она бесплатная для премиум аккаунтов) – /channel/denissexy?boost
Я взамен публикую фотографию красивого камня который поищу в Амстердаме.
😎 Итого:
Мне – бусты, вам – фото красивого камня в телеграм стори
P.S. Если ссылка не работает, обновите телегу
Плохие новости для OpenAI и Microsoft Bing
Я обычно не люблю писать такие заголовки, однако повод серьёзный. Google внедрили в своего ассистента Bard интеграцию с большим количеством своих продуктов: Gmail, YouTube (судя по демо — модели доступны транскрипты видео), Google Docs, Drive, Maps, Hotels, Flights и другими менее известными.
Называется это Bard Extensions ✨
Интереснее всего взглянуть на предлагаемые в анонсирующем ролике способы применения:
— суммаризуй все недавние письма от X
— дай мне шаблон для речи шафера и покажи примеры видео для вдохновления
— (добавляет картинку) вот детское кресло, которое я недавно купил, покажи видео с инструкцией по установке в машину
— напомни, когда X предлагал мне Y? (ответ в виде извлекаемых из писем дат. Правда...кто ведет личные переписки в почте?)
— и фоллоу-ап вопрос к прошлому: покажи мне билеты на эти даты и близлежащие отели (подразумевается ответ с учётом предыдущего контекста)
— и ещё составь план на каждый день и расскажи, что собрать с собой
В целом, кажется ничего сильно продвинутого относительно GPT-4 с доступом к плагину поиска в интернете. Вопрос в том, насколько много данных у Google, чтобы дообучить модель очень хорошо работать с персональными данными, а также несколько разных сервисов за раз.
А ещё прокачали опцию перепроверки каких-то фактов в Google — надо нажать на кнопочку снизу от ответа, после чего бот сам перепроверит, и какие-то куски выделит желтым или зелёным, в зависимости от того, находит ли информация подтверждение!
Анонс
Попробовать можно на bard.google.com (доступно российским аккаунтам).
Самое клевое, это конечно правильные геометрические фигуры – баловаться с ними одно удовольствие.
Автор, которым я вдохновлялся тут.
Тут одни из участников большой тройки консалтинга (BCG) протестировали GPT4 в работе (под контролем исследователей из MIT и Harvard University Business School) и теперь у нас есть числа, научные, насколько помогает ChatGPT с GPT4 в работе:
➡️ +43% к эффективности по сравнению с людьми которые не использовали GPT4 в своей работе.
Детально про исследование можно почитать в оригинале или на русском.
От себя скажу: с момента как GPT4 стала публична, наша компания оплачивает сотрудникам платный доступ, эти 20$ в месяц просто смешная цена за такой прирост эффективности.
Если вы руководитель, советую не экономить на инструментах для персонала.