Обновилась статистика на чатбот-арене, можно посмотреть, какие LLM лидируют. Предсказуемо, на первом месте GPT4. Обещания Claude о том, что они новый лидер, не помогли, только третье место.
Как работает чатбот-арена: люди вводят свой промпт, показывается 2-3 варианта ответа от разных моделей, и пользователь выбирает, какой ответ лучше. После многих тысяч таких голосований на основании статистики строится лидерборд.
https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard
Когда в мире начался бум ChatGPT, все говорили про то, что появилась новая профессия “промпт-инженер”, т.е. человек, умеющий правильно задавать вопросы в языковые модели. Но вот в IEEE статья о том, что я и тогда уже интуитивно говорил — с задачами промпт-инжиниринга современные LLM справляются лучше, чем люди. Кажется, новая профессия умирает, не родившись [o]
https://spectrum.ieee.org/prompt-engineering-is-dead
Инженер Microsoft Шейн Джонс обратился в FTC и совет директоров Microsoft с предупреждением о том, что Copilot Designer создает жестокие и сексуальные изображения, игнорирует авторские права и многое другое.
Мне всегда было очень интересно: а вот когда изобретается, например, новая форма кухонного ножа, есть ли разработчики, которые выражают обеспокоенность тем, что этим ножом можно и пальцы порезать?
https://www.cnbc.com/2024/03/06/microsoft-ai-engineer-says-copilot-designer-creates-disturbing-images.html
Инсайды оказались верными — Еврокомиссия оштрафовала Apple на 1.8 млрд евро за препятствование конкуренции со стороны стриминговых сервисов — это дело началось с жалобы Spotify на запрет Apple информировать пользователей о наличии альтернативных способов оплаты в приложениях. Правда, Apple, конечно, будут подавать апелляцию, так что до настоящей радости еще пройдут годы. Учтите, что само разбирательство шло почти четыре года.
А вот размер штрафа обещает быть рекордным — ранее источники Financial Times сообщали, что он составит 500 млн. Впрочем, вопрос не в деньгах, по крайней мере, для Apple.
@blognot
https://www.ft.com/content/05606b16-8c4d-4535-893e-af909fcf22f0
Эппл внезапно анонсировали новые 13 и 15 дюймовые ноутбуки MacBook Air с M3 (8 или 10 ядер GPU на выбор), цена от 1099 и 1299,соответственно. Поставки начнутся уже 8го марта [o]
https://9to5mac.com/2024/03/04/apple-launches-m3-macbook-air/
Майкрософт показывают новый API для Виндоуз — называется DirectSR (речь про Super Resolution, конечно). Это единый API для разработчиков игр, позволяющий рендерить сначала игру в низком разрешении, а потом увеличивать её нейронками на видеокартах. Поддерживаются DLSS, FidelityFX и XeSS.
Дело большое, потому что потенциально мы сможем увидеть любимые игры без квадратиков в 8k. [o]
https://www.theverge.com/2024/2/29/24086443/microsoft-directsr-super-resolution-api
НОС: цена Bitcoin снова выше $60.000, курс возвращается к докризисным временам (10 ноября 21-го он в прыжке почти достиг $69100).
https://www.coingecko.com/en/coins/bitcoin
Apple сворачивает проект Project Titan, десятилетние усилия по созданию электромобиля выкинут на свалку истории. Сотрудники перейдут в подразделение Apple по искусственному интеллекту, проект признан непригодным к развитию, и слава богу.
https://www.bloomberg.com/news/articles/2024-02-27/apple-cancels-work-on-electric-car-shifts-team-to-generative-ai
Блин вышел комом. По субъективным ощущениям модель неприятно слабее GPT4 несмотря на тесты. Доступ к её чату сейчас временно ограничен, т.к. он упал :) но те, кто успели потестировать, у нас в комментариях показывают чудесный скриншот (спасибо автору).
В этом треде можно делиться смешными, хорошими или плохими скриншотами по свежему релизу мистрали.
Пятница, поэтому вот вам очень любопытный сайт: напишите любой промпт (на английском) и оцените скорость, с которой нейросеть “рисует” картинки.
https://fastsdxl.ai/
Очень интересный рассказ про то, как живут китайские стримеры на контрактах. В принципе, ничего супернового, но я все время думал, что держит стримера в «ферме», после того как его уже раскрутили. Оказывается, все просто — штраф за уход сильно больше годового дохода.
https://restofworld.org/2024/china-livestream-agencies-exploiting-influencers/
Максим Дунин, один из двух ключевых разработчиков nginx обьявил, что создает собственный форк, FreeNginx. По его утверждениям, он уже давно не работает в f5 (т.к. живет в Москве), но недавно "нетехнический менеджмент в F5 решил что лучше знает, как вести опенсорс проекты". Дальше читайте в письме.
Чтоб вы понимали, активных разработчиков у nginx оставалось всего три - Максим, Сергей и Роман. По сути это означает, что треть разработки откололась в отдельный проект. Кажется Максим может попробовать податься в YC из прошлого поста :)
Не новость, просто замечание: Nvidia временно дороже, чем Амазон и Гугл. Думаю, все понимают, что это не из-за крипты или игр, такой бурный рост — прямое следствие развития темы ИИ.
https://www.forbes.com/sites/dereksaul/2024/02/12/nvidia-is-now-more-valuable-than-amazon-and-google/?sh=77c761645542
Судя по слухам, Дисней инвестирует в Epic Games, покупая 9% по оценке 22.5 миллиарда. Это на треть ниже, чем оценка компании в 2022, до окончания судебных разбирательств с Эппл. https://www.theinformation.com/articles/disneys-epic-deal-values-fortnite-maker-at-22-5-billion-a-sharp-cut
Читать полностью…НОС: разработчики Midjourney обвиняют разработчиков Stability AI в том, что последние массово скачивали пары “картинка + промпт” из Midjourney, чем почти положили сервис. https://twitter.com/nickfloats/status/1765471291300045255
Читать полностью…#battleroyale Эпик говорит, что Эппл удалил их разработческий аккаунт, без него они не могут сделать ни одной программы для Mac или iOS. И как следствие не смогут запустить свой стор https://www.theverge.com/2024/3/6/24092158/epic-apple-developer-account-terminated-digital-markets-act-alternative-ios-app-store
Epic получили от эппла письмо, где говорится что СЕО Эпика в Твиттере публично ругает Эппл. Поэтому аккаунт отозван, и вообще эпик участвует в «глобальных усилиях по подрыву» правил Эппл https://9to5mac.com/2024/03/06/epic-games-dev-account-dead/
Да, вам не кажется, Facebook лежит у всех, недоступны сервисы логина, большие куски инстаграмма и вотсапа. Держимся. https://metastatus.com/
Читать полностью…Anthropic анонсирует Claude 3, в трех вариантах — Opus, Sonnet и Haiku. При этом Opus и Sonnet доступны уже сейчас, а Haiku — в ближайшие недели. Очень быстро все бегут вперед, ждем GPT4.5 в ближайшее время [o]
https://www.anthropic.com/news/claude-3-family
Довольно часто в мире опенсорса встречается история, когда малозначимая библиотека оказывается содержащей вредоносный код, с помощью которого как-то эксплуатируются компьютеры. Эта история наконец докатилась до мира ИИ — JFrog утверждают, что обнаружили около сотни вредоносных ML-моделей на Hugging Face. Некоторые из этих моделей создают банальные бэкдоры на железе пользователей. [o]
https://www.bleepingcomputer.com/news/security/malicious-ai-models-on-hugging-face-backdoor-users-machines/
Компания Adobe представила Project Music GenAI Control — платформу, которая может генерировать аудио на основе текстовых описаний или эталонной мелодии и позволяет пользователям настраивать результаты.
Мне кажется, это самый большой тренд на следующие три года — инструменты для креаторов, позволяющие создавать видео, аудио, тексты, картинки без специальных навыков, чисто из текстового описания и постоянной корректировки работы ИИ. Очень нравится, хотя вот это решение от Adobe далеко от идеала [o]
https://techcrunch.com/2024/02/28/adobe-reveals-a-genai-tool-for-music/
Судя по всему, сотрудники Тумблера и Вордпресса собираются передать большой датасет из текстовых и картиночных данных на обучение в OpenAI [O].
Кажется, мы все скоро будем просто источниками данных и средством для производства электроэнергии.
https://www.404media.co/tumblr-and-wordpress-to-sell-users-data-to-train-ai-tools/
Судя по вот этому слуху, Мета собирается осенью показать свои первые настоящие очки дополненной реальности. Именно в формате очков, а не хедсета, закрывающего пол головы. Очки ходят под названием “проект Орион” и слухи о нем мы слышали еще с прошлого года, однако сейчас давление от Зака и Эндрю стало велико, релиз обещает быть интересным. Правда купить эти очки никому не дадут, пока покажут как исследовательский прототип.
Напомню, главное на что пушит Эппл в своих гарнитурах - это дополненная реальность, т.е. ты не отключен от внешнего мира внутри какой-то виртуальной вселенной. Цукерберг давит на ту же точку, в результате это выглядит как активная борьба на рынок, которого фактически еще не существует. 👁️👁️ https://www.businessinsider.com/meta-reveal-first-ar-glasses-fall-connect-conference-2024-2
Mistral выложили свою новую, самую большую их модель, Mistral Large. Модель, которая по своим характеристикам находится между игроком #1 (GPT-4) и #3 (Claude 2) пока не доступна в виде весов и исходников, а только в виде API на платформе La Plateforme и беты ассистента le Chat.
👁️👁️ https://mistral.ai/news/mistral-large/
Компания Stability AI выпустила предварительную версию Stable Diffusion 3.0, своей следующей флагманской модели text2image. Как обычно, улучшенно качество изображений, более высокую производительность. Без тестов ничего не понять, публикации, исходных текстов, весов - ничего пока нет, только анонс что “все очень круто”. https://stability.ai/news/stable-diffusion-3
Читать полностью…Эппл расказывают как с помощью нового криптографического протокола PQ3 улучшают безопасность месседжинга. Главное улучшение — почти гарантированная устойчивость от вычислений с помощью квантовых компьютеров. Любопытно, что в качестве механизма инкапсуляции ключа у pq3 и у мессенжера Signal используется одно и то же решение, Kyber.
Я не специалист по безопасности, но есть ощущение, что рановато мы начали готовиться к пост-квантовому миру, пока этих вычислителей мы как-то не наблюдаем.
https://security.apple.com/blog/imessage-pq3/
В слитых из Google документах подробно описывается Goose, языковая нейронка на базе Gemini, предназначенная для внутреннего использования. Судя по всему, сделана она в первую очередь чтобы сотрудники не пользовались Github Copilot и в отличие от последнего она натренирована исключительно на хорошем коде написаном внутри гугла. Ну, что сказать, оптимизм гугла по поводу качества их кода мне нравится.
В первом комментарии будет выжимка статьи из моей нейронки. Нажмите пожалуйста лайк или чтонибудь, чтобы я понял, нужно ли вам прикреплять такие выжимки автоматически https://www.businessinsider.com/google-goose-ai-model-language-ai-coding-2024-2
YC обновили список типов стартапов, которые акселератор хочет видеть у себя. Давайте я его для вас прямо тут напишу, чтобы вы оценили, насколько радикально изменился запрос. Часть пунктов (я их выделил италиком) особенно любопытные.
- ML в робототехнике
- Использование ML для моделирования физического мира
- Новые оборонные технологии
- Производство в Америке
- Космические компании
- Климатические технологии
- Коммерческие опенсорс компании
- Пространственные решения (речь идет об AR/VR)
- Новые типы ERP
- Инструменты для разработчиков, созданные на основе существующих внутренних инструментов
- Объясняемый ИИ (средства для обьяснения почему ИИ принимает те или иные решения)
- LLM для автоматизации ручных процессов в энтерпрайзе
- ИИ для создания корпоративного ПО
- Новые стейблкоины и решения вокруг них
- Способы покончить с раком
- ИИ модели для биологических систем
- Софт для новых подходов и организации процессов в здравоохранении
- Устранение посредников в здравоохранении (речь о страховых в первую очередь)
- Лучший корпоративный клей
- Небольшие тонко настроенные модели как альтернатива гигантским гиганским моделям
Судя по этому списку, YC все еще самые глубоко понимающие игроки на рынке акселераторов.
Статья в the Verge, где журналисты заметили, что черные методы SEO все еще используются. В данном случае, в сети огромное количество страниц с некрологами, написанными с помощью ИИ. Понятное дело, что имена-фамилии там почти случайные, нужно это исключительно для сбора трафика.
Такое делали когда-то еще на марковских цепях, боюсь представить какой степени достоверности может быть дорвей, написанный даже с GPT3.5 https://www.theverge.com/24065145/ai-obituary-spam-generative-clickbait
Google запустили наконец свою самую большую LLM - Gemini Ultra. Бард тоже переименован в Gemini. Цена в 22 доллара скрашена большим гуглдрайвом и подключением гемини в почту и другие системы гугла. Посмотрим стоит ли оно того. https://www.theverge.com/2024/2/8/24065553/google-gemini-ios-android-app-duet-bard
Читать полностью…