Хотел ничего не писать недельку, но тут внезапно (на самом деле очень ожидаемо) Meta выложили продолжение своей самой популярной большой текстовой модели - Llama 2-Chat. Эта модель примерно в 2 раза больше предыдущей LLaMA во всем (включая контекст) содержит разметку на базе позовательской оценки диалогов, и самое главное - судя по всему Мета собираются продавать право на использование этой модели в своих коммерческих проектах.
На деле и старую LLaMA и построенные на ее базе открытые решения активно использовали в коммерческих проектах по всему миру. Так что тут появилась возможность легализации. Llama 2 пока выглядит чуть слабее, чем собственные решения гугла и OpenAI, однако для опенсорсного решения это нормально - зато вы сможете улучшать и изменять свою модель так, как хотите https://github.com/facebookresearch/llama
Roblox появится в шлемах Meta Quest VR уже в ближайшие недели. Мы встроили виртуальный мир в твой виртуальный мир. Чтобы ты мог быть в виртуальности, когда ты в виртуальности.
https://www.theverge.com/2023/7/12/23792594/roblox-meta-quest-2-3-pro-vr-headsets
Интел собирается убить свою линейку мини-компьютеров Intel NUC. По сути компания говорит, что ей это больше не интересно, пусть минипк выпускают другие компании.
Очень жаль, когда-то это был прорыв - вместо большого офисного системника можно было прикрепить коробку, размером с пачку сигарет к задней стороне монитора. Но конечно они правы, коммерческого успеха этот проект так и не нашел https://www.pcworld.com/article/1989175
В TheVerge большое интервью с Демисом Хассабисом, генеральным директором Google DeepMind. О рекструктуризации компании, скором появлении полного искусственного интеллекта, регуляции применения ИИ, Google Bard и всём таком. По сути вся статья о том, что не надо замыкаться на лингвистических моделях и ChatGPT, в других областях ИИ тоже есть большие прорывы.
Очень уж не вовремя вышло интервью. Сегодня утекли подробности архитектуры и масштабов обучения GPT-4 - везде обсуждают именно их https://www.theverge.com/23778745/demis-hassabis-google-deepmind-ai-alphafold-risks
Готовьтесь, сегодня будет много новостей про Threads. Но это пройдет за день-два.
Пока у новой сети два крупных недостатка: 1. полностью алгоритмическая лента сообщений, как у фейсбука. И более того, в этой ленте не только те, на кого вы подписались, но и “другие, возможно интересные вам сообщения”. У меня лента пока состоит исключительно из этих “других”. 2. Вы не сможете удалить аккаунт в Threads, если его уже завели. Согласно пользовательскому соглашению, “профиль Threads может быть удален только через полное удаление вашей учетной записи Instagram”.
Думаю, большинство людей это не пугает. Но время покажет.
https://techcrunch.com/2023/07/06/threads-delete-profile-instagram-meta/
Клон Твиттера от Меты, Threads запускается уже совсем скоро. Видимо в процессе подготовки к запуску разработчики случайно запустили раньше времени сайт сервиса с обратным отсчетом к запуску (сайт уже закрыли), и на этом сайте было выложено приложение Threads для андроид. Разумеется его уже скачали и разобрали энтузиасты :)
Судя по всему это действительно клон Твиттера с легкой интеграцией с Instagram. Фейсбук и раньше запускал разные клоны конкурентов, но threads запускается идеально вовремя https://9to5google.com/2023/07/03/threads-instagram-app-countdown-plus-details/
Cудя по всему хакеры уже 3 дня не дают работать “сети защишенной фиксированной спутниковой связи Дозор-Телепорт”. По сути директ-телепорт это iDirect связь, которую использует Газпром, ГазпромНефть, Росатом. Но основное использование этой сети - это некоторые части российской армии и ФСБ. Группировка которая взяла на себя ответственность за эту атаку утверждает, что действует в интересах беларусской ЧГК Вагнер.
Конечно история про Вагнер может оказаться фейком. Ну и сам Дозор-Телепорт это совсем небольшая сеть, с очень ограниченным использованием. Однако сам факт интересен https://therecord.media/hackers-take-down-russian-satellite-provider
Часто говорят, что сейчас сильно перспективны компании, помогающие отличать сгенерированные ИИ изображения от “настоящих”. И я все время говорю, что отличить эти изображения крайне сложно, потому что как только появляются новые техники детектирования отличий — сразу же появляются и новые генераторы изображений. Но вот в статье NYT протестировали 5 готовых инструментов для обнаружения подделок, и все они по сути толком не работают, так что это уже не моё личное мнение.
https://www.nytimes.com/interactive/2023/06/28/technology/ai-detection-midjourney-stable-diffusion-dalle.html
В WSJ большая статья о том, как рутинное употребление препаратов, относимых к наркотикам, перетекло из личного развлечения в корпоративную культуру. По сути многие компании, во многом благодаря личному опыту их генеральных и технических руководителей, зависят в своих инновациях и регулярной работе от психоделиков. Это легальный допинг, средство для улучшения концетрации, креативности, работоспособности и т.п.
Статья понятно о чем, но шум там в целом зря. Все эти люди, от Маска до Брина, используют психоделики, они менее вредны для организма и окружающих, чем, например, алкоголь, имеют встроенный механизм от привыкания и вообще не выглядят как что-то для ежедневного использования. Давайте лучше обсудим, как много алкоголиков в айти-сообществе, а людей, использующих кетамин и лсд для экспериментов над собой, оставим пока в покое, тем более что в “корпоративную культуру” айти-компаний проник микродозинг, т.е. употребление психоделиков в дозировках, не дающих никаких психоделических эффектов.
https://www.wsj.com/articles/silicon-valley-microdosing-ketamine-lsd-magic-mushrooms-d381e214
Более 100 тысяч аккаунтов от ChatGPT продаются в даркнете прямо сейчас. Большая часть из них собрана через популярные стиллеры вроде Raccoon, т.е. сама компания OpenAI, конечно, ни при чем, обошлось без всяких взломов.
Все еще считаю, что стиллеры — самая недооцененная проблема в современной безопасности. Чудовищное количество данных собирается с компьютеров пользователей, там и документы, и пароли, и ключи, и картинки. И все это так или иначе теперь свободно продается в даркнете.
https://thehackernews.com/2023/06/over-100000-stolen-chatgpt-account.html
Помните как Эппл и другие компании активно хотели следить за вашими фотками в телефоне, чтобы ловить педофилов? Так вот, эксперты в этой области предупреждают - педофилы хитрее чем корпорации, они уже начали генерировать картинки с помощью нейронных сетей. В даркнете буквально тысячи псевдофотографий, которые произведены подобным образом. И теперь возникает отдельный вопрос - насколько легально распространение и владение подобными изображениями. Ведь доподлинно известно, что при их изготовлении ни один ребенок не пострадал.
Сначала я подумал, что для обучения таких нейронных сетей потребовались бы фотографии детского насилия. Но кажется нет, достаточно просто неотцензуренного датасета со взрослыми и побольше картинок детей в невинной обстановке. Внутренне я от этой идеи содрогаюсь, но может быть такие нейронки просто необходимое человечеству зло https://www.washingtonpost.com/technology/2023/06/19/artificial-intelligence-child-sex-abuse-images/
В конце февраля Snap запустили в своем приложении My AI — такого простого бота для общения со слоганом “виртуальный друг внутри Snapchat”. И я все думал, зачем же они это сделали и где там польза. Сегодня блумберг рассказал зачем — оказывается, 150 млн пользователей написали 10 миллиардов сообщений к My AI, и эти данные будут использоваться… для персонализации рекламы.
Между прочим, не такое уж плохое решение. Особенно с учетом похожести пользователей, даже пользователю, который ничего не писал боту, можно рекомендовать те посты или товары, которые заинтересовали похожего пользователя, написавшего боту.
https://www.bloomberg.com/news/articles/2023-06-15/snap-uses-10-billion-messages-to-my-ai-chatbot-to-better-target-ads
Часто так бывает, когда куча стартапов пытаются сделать прорывной продукт, но получается не очень. Потом приходит гигант типа эппла или гугла и выкатывает свою реализацию. И уже неважно, кто был первый, потому что при масштабах гугла, эппла, амазона объем аудитории — это карта, которую не побить.
Гугл только что запустил "виртуальную примерночную" в своем супермаркете Google Shopping. Теперь нужный вам элемент одежды можно посмотреть не только так, как его сфоткали в магазине, но и на другой модели, например, с не слишком идеальным телом. Правда, есть неожиданный твист — примерить одежду на свою фигуру нельзя, т.к. всё это просто обычный диффьюжн, где берется фотография модели и стилизуется новой одеждой. Судя по публикации, в большинстве случаев стиль — это цвет и текстура ткани. Поэтому я думаю, что стартапы еще повоюют, тема “виртуальной примерочной не закрыта”.
https://blog.google/products/shopping/virtual-try-on-google-generative-ai/
Ютуб решил понизить барьер популярности, начиная с которого можно включить программу монетизации видео. Раньше требовалось 1000 подписчиков на канале, теперь достаточно 500. Может быть, мне тоже ютуб-канал завести и стримы пилить? Нынешние требования к каналу для монетизации: 500 подписчиков, 3 залитых видео за последние 90 дней, 3000 часов просмотренных видео за последний год. Выглядит более чем демократично и не сложно.
На самом деле ничего не мешало ютубу сделать монетизацию для любого канала. Но налоги, обработка, бухгалтерия — все это требует много хлопот, так что ограничения тут не для заработка, а чтобы не так много накладных расходов создавать.
https://techcrunch.com/2023/06/13/youtube-is-lowering-the-barrier-to-be-eligible-for-its-monetization-program/
Блумбер со слухами: Правительство Нидерландов работает над законодательством, запрещающим китайским студентам посещать университетские программы, посвященные разработке чипов и военным технологиям. При этом само министерство говорит правильную вещь, они работают над улучшением скрининга студентов вне зависимости от страны происхождения. Надеюсь, что слова не разойдутся с делом.
Вообще очень тяжело видеть, как растет уровень того, что я называю “комфортным национализмом”, в мире. Безусловно, основная причина этого — война, и пока она не закончится, бороться с национализмом сложно.
https://www.bloomberg.com/news/articles/2023-06-12/dutch-seek-to-bar-chinese-students-from-tech-courses-in-chip-war
То, что Threads не доступен пользователям из Европы - это понятно, компания решила не возиться с GDPR. Но сейчас выяснилось, что компания предприняла еще дополнительные усилия, чтобы европейцы не заходили в Threads через VPN.
Я не понимаю зачем, откуда такое внимание, но будет очень обидно, если это станет мейнстримом и общей практикой для всех американских компаний. https://techcrunch.com/2023/07/14/meta-is-blocking-eu-based-users-from-accessing-threads-via-vpn/
Илон Маск и сотоварищи запустили наконец обещанную компанию xAI. Это их ответ OpenAI и конкурентам, построенный на сотрудниках, вышедших как раз из OpenAI, Microsoft, Google, DeepMind и тп. Иконостас ученых почетный, хотя и несколько странный. Так же в списках есть много людей, которые известны в кругах, где обсуждаются вопросы этики и безопасности ИИ. Но в целом, это очень сильная команда, способная сделать что-то интересное.
Отдельно отмечено, что xAI никак не связан с X Corp, т.е. твиттером. Но это обман, потому что даже на первой странице все ссылки ведут на твиттеры участников, а не на их какие-то другие страницы. Вот такой он, Маск https://x.ai
Оказалось что многие упустили. Оригинальную статью с предполагаемыми деталями GPT-4 удалили, но вот тут есть сборник твитов с обзором. Да, судя по всему оценка в 1.8 триллионов параметров на 120 слоях оказалась правдивой, как и работа в режиме группы экспертов.
Напоминаю, это не официальный, но довольно достоверный обзор. Опираться на него нельзя, но обсуждать можно https://threadreaderapp.com/thread/1678545170508267522.html
Пока в одной стране делают софт по сбору максимума данных о пользователе мобильного, в другой (в данном случае в Массачусетсе) готовят законопроекты, запрещающие покупку или продажу данных о местоположении мобильных телефонов потребителей. Для Штатов это большое событие, ну и многим крупным игрокам на этом рынке сейчас тревожно.
Обратите внимание, речь идет о покупке и продаже геолокации любым способом. Тут и триангуляция по базовым станциям, и GPS.
https://www.wsj.com/articles/first-u-s-ban-on-sale-of-cellphone-location-data-might-be-coming-fbe47e53?mod=djemalertNEWS
Скорость регистрации в прямом конкуренте Твиттера Threads составляет примерно 1м пользователей в час. Чудовищная цифра, любой технарь вам расскажет, насколько сложно создать и обслуживать такой сервис.
Но самое главное для меня — обещание создателей Threads поддерживать ActivityPub. Это значит, что возможно кросс-взаимодействие с Mastodon и другими свежими конкурентами Твиттера. Было бы очень хорошо бороться с гигантом сообща.
https://techcrunch.com/2023/07/05/threads-passes-2-million-downloads-in-2-hours/
Гугл обновил свою политику конфиденциальности. Теперь там будет прямо указано, что компания будет использовать «общедоступную информацию» для обучения своих моделей ИИ в продуктах, в том числе в переводчике и Барде.
Очень интересно будет следить за первым судом по этому новому соглашению. Редкий случай когда я на стороне гугла https://gizmodo.com/google-says-itll-scrape-everything-you-post-online-for-1850601486
Первый большой коллективный иск против OpenAI подан в северокалифорнийском суде. Истец утверждает, что OpenAI нарушила права миллионов пользователей в интернете, воспользовавшись их публично доступными данными. Думаю, что такой фокус не пройдет, обвинить компанию в нарушении правил честного использования, при том что фактически ничего не нарушено — просто попытка вынудить OpenAI что-то заплатить, чтобы не заниматься постоянными разборками в суде.
https://www.washingtonpost.com/technology/2023/06/28/openai-chatgpt-lawsuit-class-action/
Исследование компаний, которые принудительно вывели сотрудников в офис, показало: почти половина (42%) компаний, которые обязали возвращать офисы, столкнулись с более высоким уровнем оттока сотрудников, чем они ожидали. И почти треть (29%) компаний, принуждающих людей возвращать офисы, испытывают трудности с набором персонала… Они знали, что это приведет к некоторой убыли, но не были готовы к серьезным проблемам, которые могут возникнуть в результате.
Довольно неплохая статья с предсказуемым финалом — люди распробовали работу из дома, и теперь для них выход обратно в офисы — это серьезный даунгрейд в качестве жизни. Чем дольше я про это думаю, тем больше мне это кажется очевидным, человечество сделало круг и вернулось к истокам — жить там, где работаешь, работать там, где живешь. Да, возможно, было бы круто, если бы прям в офисах были квартиры для сотрудников, тогда исчезло бы понятие “вернуться в офис”. Но в целом 21 век позволяет людям производить работу из любой точки мира.
https://www.entrepreneur.com/growing-a-business/the-damaging-results-of-the-mandated-return-to-office-is/454043
Самая забавная новость утра: Марк Цукерберг и Илон Маск почти договорились о бое в клетке по правилам ММА. Ну, точнее, оба они подтвердили что готовы к бою в клетке, Маск даже предложил конкретное место. Конечно бой вряд ли состоится, Марк много лет занимается ММА, Илон честно признался что единственный его спорт - подкидывать вверх своих детей. А жаль, собрали бы много денег. И Джо Рогана в качестве комментатора бы позвали, я уверен https://www.theverge.com/2023/6/21/23769263/mark-zuckerberg-elon-musk-fight-cage-match-worldstar
Читать полностью…Roblox подтвердили, что будут разрешать на своей платформе "взрослый контент", правда для его доступа нужен будет аккаунт подтвержденный с помощью удостоверения личности. Ну и понятно это все для пользователей старше 17 лет.
Довольно смелый шаг, потому что вы же знаете как дети профессионально обходят возрастные ограничения. Посмотрим как это будет реализовано https://www.cnbc.com/2023/06/20/mature-content-comes-to-roblox-for-users-aged-17-and-up.html
WSJ рассказывают о том, как селебрити и спортсмены все чаще отдают своих дипфейк-двойников в управление компаниям и брендам. Это решает сразу две проблемы: можно ничего не делать и да еще и не стареть, т.к. сгенерированные двойники не портятся со временем.
Кажется фраза "торговать лицом" в 2023 обретает новый смысл https://www.wsj.com/articles/ai-deepfakes-celebrity-marketing-brands-81381aa6
Meta рассказали про свою новую модель для генерации голоса, называется Voicebox. Они говорят, что пытаются сделать "как ChatGPT только для аудио", но имеется ввиду что система пытается продолжить предыдущее аудио с использованием текста как контекста. Обучение делалось всего лишь на 50 тысячах часов аудиозаписей на разных языках, в том числе аудиокниг. Интересен подход к тестированию: ребята обучали на синтезированных фразах систему распознавания речи, и она показала очень незначительное ухудшение качества распознавания. На самом деле пробегитесь глазами сами, потенциально это очень большой прорыв в качестве синтеза речи и работы со звуком.
При этом не ждите прорыва прямо сейчас. Мета отказывается показывать исходные тексты или готовые программы - говорит "есть потенциальные риски очень неправильного использования" таких решений. Пока можете просто их видео и тп посмотреть, и поверить на слово https://about.fb.com/news/2023/06/introducing-voicebox-ai-for-speech-generation/
Еще одна большая статья о том, как ByteDance за 2022 превратил Douyin (это внутрикитайская версия TikTok) в суперапп. В западном мире супераппы не так чтобы удались, хотя есть очень удачные примеры в некоторых нишах. А тикток в Китае, включив в себя не только просмотр видео, но и мессенджер, миниигры, екомерс, доставку еды, бронирование отелей увеличил свой нерекламный доход более чем в 7 раз.
Последние 10 лет я говорю одно и то же - смотрите что получается у китайских игроков. Через 2 года это начнут копировать западные компании, еще через 2 это выйдет на рынок и станет популярным. https://www.bloomberg.com/news/articles/2023-06-14/bytedance-s-douyin-challenges-wechat-to-become-china-s-next-everything-app
Вот уже два часа штормит Reddit, главная страница часто не отвечает вообще, логин и комментарии тоже почти не живут. И все это в день, когда 7 тысяч сабреддитов решили отключиться чтобы высказать свой протест введению заградительных цен на API (про забастовку лучше всех Лихачев написал)
Читать полностью…Я про это не писал, но тут в Reddit, крупнейшем форуме в интернете разгорелся скандал. Разработчики Reddit обьявили приватно разработчикам сторонних приложений, что будут брать деньги за доступ к API. Часть форумов даже закрылись, чтоб выразить протест по этому поводу.
Только что разработчик Apollo, самого популярного альтернативного клиента для Reddit написал, что приложение закрывается 30 июня. Причина - действия создателей Reddit и невозможность платить эти бешенные миллионы (я не шучу) долларов. Очень жаль, Apollo многие годы был лучшим способом сидеть на реддите, я не уверен что теперь буду приходить туда так часто https://www.reddit.com/r/apolloapp/comments/144f6xm/apollo_will_close_down_on_june_30th_reddits/