blognot | Неотсортированное

Telegram-канал blognot - БлоGнот

11523

Заметки о технологиях, новостях и гаджетах. И всём остальном. По всем вопросам лучше писать в почту — sergiy.petrenko@pm.me YouTube http://www.youtube.com/@blognot Мой блог https://blognot.co/ Группа для обсуждения новостей — https://t.me/blognot_chat

Подписаться на канал

БлоGнот

Верховный суд Венесуэлы оштрафовал TikTok на $10 млн и обязал компанию открыть офис в стране после того, как три подростка погибли, участвуя в популярных "челленджах" с употреблением химических веществ. По данным суда, платформа не предприняла достаточных мер для предотвращения распространения контента, поощряющего опасные "испытания".

Всего в венесуэльских школах 200 детей пострадали от подобных челленджей. TikTok признал в суде "серьезность ситуации". К сожалению, это не первый случай — ранее печально известный "челлендж с удушением" привел к гибели как минимум 15 детей младше 12 лет.

Похоже, что местные власти решили использовать трагедию, чтобы заставить TikTok открыть офис в стране, что упростит контроль над платформой. Мы уже видели подобные ходы — например, в Индии по отношению к Twitter, — которые фактически обязывали компании предоставлять своих сотрудников как заложников. Особенно учитывая вполне определенную репутацию властей Венесуэлы.

https://www.theinformation.com/briefings/venezuela-fines-tiktok-10-million-over-deadly-viral-stunts?rc=ukjmk2

Читать полностью…

БлоGнот

Крупнейший мобильный оператор Украины Киевстар заключил соглашение со Starlink Илона Маска о предоставлении спутниковой сотовой связи.

По условиям соглашения, клиенты Киевстара смогут использовать спутниковую связь в случаях, когда наземная сеть недоступна. Компания планирует запустить SMS-сервис через спутники в четвертом квартале 2025 года, а позже добавить голосовую связь и передачу данных.

Starlink уже запустил первые спутники с поддержкой прямой связи с телефонами в январе этого года, а в прошлом месяце получил разрешение FCC на предоставление такой услуги в США, где компания сотрудничает с T-Mobile для покрытия "мертвых зон".

Будем надеяться, что на эти внедрения у Киевстара уйдет немного меньше времени, чем на запуск Voice-over-WiFi, сообщение о доступности которого я получил буквально неделю назад.

https://www.bloomberg.com/news/articles/2024-12-30/musk-s-starlink-to-provide-space-based-mobile-service-in-ukraine

Читать полностью…

БлоGнот

Под Новый Год на мою полку приехал необычный (или обычный для нынешних времен) сувенир — обломок шахеда, сбитого николаевской зенитной бригадой. Помните, мы ей помогали, покупая планшеты и серверное оборудование?

А вот теперь надо помочь другому подразделению ПВО, уже одесскому, тоже покупкой планшетов.

И надо добавить, что с прошлого раза одна хорошая машинка (на фото) стала из пациента СТО боевой единицей в 225 ОШБ, обзавелась комплектом подходящей резины, а еще один комплект пошел её подруге.

Правда, с тех пор приехали еще машинки и ждут аналогичной трансформации. Не очень надеюсь, что нашего энтузиазма хватит и на планшеты, и на машинки, но это был бы славный страйк к Новому году. Давайте подключимся.

Напомню, что банка моно имеет статус волонтерской и карму p2p платежей не уменьшает.
Paypal — sergey.petrenko@gmail.com
Монобанк — https://send.monobank.ua/jar/8Agk3Rr4xn
Приват 5523245800262113
BTC — 343ypLkZqqdppEehJxGGLrWFZQ6TckdfUu
ETH — 0x621398403993a0Dde05DF9612166A73D7B246855
USDT (TRC20) - TJkSAAmZfJpDQqp3JQ6PwACU2bvJTxdBDf
USDT (ERC20) — 0x621398403993a0Dde05DF9612166A73D7B246855

Читать полностью…

БлоGнот

Некоммерческая организация Encode, ранее поддержавшая законопроект об AI-безопасности в Калифорнии (SB 1047), ветированный губернатором штата, подала ходатайство о включении в дело в качестве "друга суда" в поддержку иска Илона Маска против преобразования OpenAI в коммерческую структуру.

В поданном документе Encode утверждает, что превращение OpenAI в коммерческую компанию подорвет её миссию по безопасной разработке технологий на благо общества. Организация подчеркивает, что если мы действительно стоим на пороге создания AGI, то общество заинтересовано в том, чтобы эта технология контролировалась благотворительной организацией, а не структурой, нацеленной на прибыль инвесторов.

OpenAI планирует преобразоваться в корпорацию общественного блага (PBC) штата Делавэр, где некоммерческая организация уступит контроль в обмен на акции. Encode указывает, что в этом случае компания будет обязана "балансировать" общественную пользу с финансовыми интересами акционеров, а не ставить безопасность во главу угла.

Кстати, Meta также выступает против этого преобразования — в декабре компания направила письмо генпрокурору Калифорнии, утверждая, что такое изменение будет иметь "сейсмические последствия для Кремниевой долины". Просто удивительно, какое количество коммерческих организаций — хоть Meta, хоть xAI, — разрабатывая AI-модели, настаивают, что их крупнейший конкурент не должен становиться немного коммерческим.

https://techcrunch.com/2024/12/27/nonprofit-group-joins-elon-musks-effort-to-block-openais-for-profit-transition/

Читать полностью…

БлоGнот

Команда Qwen от Alibaba представила новую открытую модель QVQ-72B-Preview для анализа изображений. Она построена на основе Qwen2-VL-72B, но использует reasoning при решении задач.

В тестах на понимание изображений, включая задачи университетского уровня и олимпиадные задачи по математике и физике, модель показала результаты на уровне закрытых систем вроде o1 и Claude 3.5 Sonnet. QVQ при этом является моделью с открытыми весами.

Впрочем, у модели есть проблемы: она может неожиданно переключаться между языками, застревать в логических циклах или терять фокус при сложном визуальном анализе, что приводит к галлюцинациям. Команда признает необходимость улучшения защитных механизмов перед широким применением. Интересно, а Винни Пуха она распознает?

Qwen называет QVQ своим "последним подарком" года и рассматривает её как шаг к созданию "всезнающей разумной модели" на пути к AGI. В будущем планируется создание единой "омни-модели" для решения более сложных научных задач.

https://qwenlm.github.io/blog/qvq-72b-preview/

Читать полностью…

БлоGнот

Впрочем, есть и новость — Лекс Фридман решил оживить свой телеграм канал и перевести его на русский. Он это связывает с тем, что ему предстоит интервью с Зеленским, которое он пока предлагает провести на русском, а пока разместил несколько аудиороликов и привязал чат к каналу.

Правда, почему-то на русском он говорит с легким кавказским оттенком, но это я придираюсь 😊.

/channel/lexfridman

Читать полностью…

БлоGнот

Интересный обзор комментариев на тему запуска o3. Модель показывает впечатляющие результаты — например, 88% в тесте ARC-AGI против 32% у o1, и 25% в сложном математическом тесте, где другие модели не набирали больше 2%.

Правда, эта производительность достигается ценой огромных вычислительных затрат — более $1000 на одну задачу против $5 у o1. На полном тесте ARC-AGI o3 low использовала ресурсов на $10 000 и набрала всего на 12% меньше баллов, чем o3 high, использовавшая в 172 раза больше вычислительных ресурсов (цену им еще не сложили).

Это поднимает вопросы о практическом применении таких моделей — вряд ли o3 станет повседневным инструментом как GPT-4. Скорее, это будет специализированный инструмент для сложных задач, доступный только организациям с большими бюджетами. OpenAI уже предлагает тариф $200 для версии o1 pro (которая действительно очень круто работает) и даже ходят слухи о некоем тарифе Ultra со стоимостью до $2000.

Впрочем, индустрия видит в этом подходе — масштабировании вычислений во время генерации ответа, — большой потенциал. Джек Кларк из Anthropic считает, что в 2025 году прогресс AI ускорится даже по сравнению с 2024-м годом за счет комбинации традиционного масштабирования и test-time scaling. А производители специализированных AI-чипов, как Groq или Cerebras, могут сделать такой подход более доступным.

https://techcrunch.com/2024/12/23/openais-o3-suggests-ai-models-are-scaling-in-new-ways-but-so-are-the-costs/

Читать полностью…

БлоGнот

Meta планирует добавить дисплей в свои умные очки Ray-Ban уже в следующем году. По данным источников, обновленная версия очков за $300 может выйти во второй половине 2025 года. Небольшой экран будет использоваться для показа уведомлений и ответов виртуального ассистента Meta.

Компания также ускоряет разработку прототипа AR-очков Orion после положительных отзывов первых тестировщиков. Однако до выхода потребительской версии все еще могут пройти годы. Orion отличается компактным дизайном, легким корпусом и инновационными дисплеями, накладывающими 3D-контент на реальный мир.

Текущая версия Ray-Ban Meta, выпущенная в сентябре 2023 года, оказалась неожиданно успешной. За несколько месяцев продажи превысили показатели предыдущего поколения за два года.

Несмотря на смещение фокуса Закерберга с метавселенной на AI, эксперты отмечают, что стратегии Meta в области искусственного интеллекта и смешанной реальности начинают сходиться. Возможно, это позволит компании получить значительную долю операционной системы следующего поколения — что и является заявленной целью Закерберга.

https://www.ft.com/content/77bd9117-0a2d-4bd7-9248-4dd288f695a4

Читать полностью…

БлоGнот

Албания объявила о годовом запрете TikTok с начала 2025 года после убийства 14-летнего школьника его сверстником в ноябре. Премьер-министр Эди Рама обвинил социальные сети, особенно TikTok, в разжигании насилия среди молодежи.

Запрет является частью более широкого плана по повышению безопасности в школах. Конечно, TikTok отрицает связь с инцидентом, утверждая, что у участников трагедии не было аккаунтов в сервисе, а видео распространялись через другую платформу.

Любопытно, что это первый случай полного запрета TikTok в европейской стране — до сих пор какие-либо ограничения касались либо госслужащих, либо определенных возрастных групп.

https://www.reuters.com/technology/albania-bans-tiktok-year-after-killing-teenager-2024-12-21/

Читать полностью…

БлоGнот

Помните историю с претензиями Arm к Qualcomm, которые осенью дошли до запрета Qualcomm вообще разрабатывать процессы на базе архитектуры Arm? После двухлетней судебной тяжбы федеральное жюри в основном встало на сторону Qualcomm.

Напомню, что Arm, лицензирующая свои чипы таким компаниям как Qualcomm и Apple, утверждала, что Qualcomm неправомерно использовала интеллектуальную собственность, которую Arm лицензировала стартапу Nuvia до его приобретения Qualcomm в 2021 году. По мнению Arm, Qualcomm не имел права использовать лицензию, ранее выданную Nuvia, а должен был передоговориться об условиях.

Это решение позволяет Qualcomm продолжать продавать чипы для персональных компьютеров, созданные с использованием технологий Nuvia, без необходимости пересматривать лицензионное соглашение с Arm. Однако жюри не смогло прийти к единогласному решению по иску Arm о нарушении Nuvia условий лицензии. Arm, скорее всего, будет настаивать на новом слушании дела.


https://www.theinformation.com/briefings/jury-sides-with-qualcomm-in-dispute-with-arm-holdings?rc=ukjmk2

Читать полностью…

БлоGнот

Google опубликовал свои предложения по мерам, которые должен предпринять суд по иску о поисковой монополии компании. Компания, впрочем, отмечает, что планирует подать апелляцию на решение суда, однако это не дает права уклониться от соблюдения процедуры.

Google критикует предложения Минюста (которые, как мы помним, даже содержат пункт о разделении компании и продаже Chrome) как чрезмерно широкие и выходящие за рамки сути дела, которое касалось только соглашений о дистрибуции поиска. По мнению компании, требования регулятора могут навредить американским потребителям и подорвать технологическое лидерство США.

В своем предложении Google фокусируется на двух основных моментах:
- Браузерные соглашения: компании вроде Apple и Mozilla смогут свободно выбирать поисковик по умолчанию, менять его каждые 12 месяцев и устанавливать разные поисковики для разных платформ
- Android-контракты: производители устройств получат больше свободы в предустановке нескольких поисковиков и приложений Google независимо друг от друга

Google признает, что эти изменения создадут определенные сложности для партнеров, но считает их адекватным ответом на решение суда, который не угрожает приватности пользователей и технологическому лидерству США. Ну и компания напоминает, что с момента окончания судебного разбирательства год назад ситуация сильно изменилась из-за развития AI.

https://blog.google/outreach-initiatives/public-policy/google-remedies-proposal-dec-2024/

Читать полностью…

БлоGнот

Разработчик AI-помощника для программистов Cursor привлек $100 млн в раунде Series B при оценке в $2,6 млрд. Раунд возглавил прежний инвестор Thrive Capital, также участвовал a16z. Примечательно, что это произошло всего через 4 месяца после Series A на $60 млн при оценке $400 млн — рост в 6,5 раз за такой короткий срок.

Компания демонстрирует впечатляющий рост выручки — с $4 млн годовой подписки в апреле до $4 млн ежемесячной в октябре. То есть годовая выручка достигла $48 млн, а значит компанию оценили примерно в 50 раз выше текущей выручки. Что становится уже привычным в условиях AI-бума, хотя до сих пор мультипликатор х20 считался чем-то сродни ставки в казино.

К слову, я уже больше месяца использую Cursor как основной редактор кода и почти им доволен. С точностью до того, что большинство альтернативных вариантов не лучше, как минимум. Кстати, небольшой лайфхак — в свежей версии 0.44 появилась поддержка o1 через API и, кажется, проводится какой-то аттракцион невиданной щедрости — запросы к этой модели никак не учитываются и по опыту пары часов работы — даже не ограничиваются. Может, раунд празднуют?

https://techcrunch.com/2024/12/19/in-just-4-months-ai-coding-assistant-cursor-raised-another-100m-at-a-2-5b-valuation-led-by-thrive-sources-say/

Читать полностью…

БлоGнот

Для TikTok блеснул лучик надежды — Верховный суд США согласился рассмотреть апелляцию TikTok против закона, требующего от компании разорвать связи с китайской ByteDance до 19 января. Устные слушания назначены на 10 января, но суд пока отложил решение по заморозке закона, о котором просила компания.

ByteDance настроена оптимистично — их главный юрист Джон Роговин уверен, что суд признает закон неконституционным. Хотя обычно на решения уходят месяцы, не исключено, что в этом случае вердикт будет вынесен до вступления закона в силу.

https://www.theinformation.com/briefings/supreme-court-to-take-up-tiktok-ban-law?utm_campaign=%5BREBRAND%5D+%5BTI-AM%5D+Th&utm_content=1095&utm_medium=email&utm_source=cio&utm_term=124&rc=ukjmk2

Читать полностью…

БлоGнот

Еврокомиссия продолжает давить на Apple, требуя дальнейшего открытия iOS для конкурентов. От компании хотят предоставить сторонним разработчикам больше доступа к функциям iPhone, включая работу со смарт-часами, наушниками и другими устройствами.

Apple традиционно сопротивляется, утверждая, что закрытая система обеспечивает лучший пользовательский опыт и защиту приватности. Особенно компания обеспокоена запросами от Meta, которая, по их словам, хочет получить доступ к чувствительным технологиям способами, угрожающими безопасности пользователей.

Meta, в свою очередь, обвиняет Apple в антиконкурентном поведении и утверждает, что аргументы о приватности не имеют под собой оснований. Компания стремится обеспечить более тесную интеграцию своих устройств (Quest VR и умных очков) с iPhone.

В общем, предсказать ближайшее развитие несложно — Еврокомиссия чего-то в очередной раз добьется, Apple это даст с кучей оговорок и несколько раз переделывая критерии применения, например, предложит ввести страховой депозит в миллиард долларов, а разрыв в функциональности устройств и сервисов для Европы и всего остального мира увеличится еще больше.


https://www.bloomberg.com/news/articles/2024-12-18/eu-escalates-pressure-on-apple-to-open-up-its-features-to-rivals

Читать полностью…

БлоGнот

GitHub запустил бесплатную версию Copilot — теперь все 150 млн разработчиков на платформе получат доступ к 2000 автодополнений кода и 50 чат-сообщений в месяц при использовании VS Code. Достаточно просто авторизоваться через личный GitHub-аккаунт.

Бесплатная версия предлагает выбор между моделями Claude 3.5 Sonnet от Anthropic и GPT-4o от OpenAI. Можно задавать вопросы по коду, получать объяснения существующего кода, искать баги и вносить правки в несколько файлов одновременно. Также доступны сторонние агенты Copilot и возможность создавать собственные расширения.

Copilot Chat теперь доступен прямо из панели управления GitHub и работает с бесплатной версией. А для студентов, преподавателей и мейнтейнеров опенсорс-проектов сохраняется неограниченный бесплатный доступ к Copilot Pro.

Хороший подарок на праздники, хотя и с ограничениями. И сильный ход в конкуренции с форками VS Code с платными подписками — как Cursor или недавно запустившийся Windsurf от Codeium.

https://github.blog/news-insights/product-news/github-copilot-in-vscode-free/

Читать полностью…

БлоGнот

Судебный процесс между CFTC и криптобиржей Gemini отложен на неделю — вместо 13 января он начнется 21 января, уже после инаугурации Трампа. Это может быть значимым, поскольку новая администрация, вероятно, займет более благоприятную позицию по отношению к криптоиндустрии. Как говорится, чтобы два раза не вставать…

CFTC — американская Комиссия по торговле товарными фьючерсами, в её ведении находятся торги опционами и финансовыми фьючерсами, — подала гражданский иск против Gemini в июне 2022 года, обвиняя компанию в предоставлении ложных сведений регулятору при попытке запустить фьючерсы на биткоин в 2017 году. По слухам, Трамп рассматривает возможность замены главы CFTC Ростина Бенама на более дружественного к криптоиндустрии кандидата, хотя официально срок Бенама истекает только в июне 2026 года.


https://cointelegraph.com/news/cftc-trial-gemini-trust-delayed-one-week

Читать полностью…

БлоGнот

Я уже по опыту знаю, что многие откладывают принятие решений на последние дни, а то и часы, и не собираюсь это как-то порицать или оценивать, а просто лишний раз напоминаю — сегодня последний день действия новогодних скидок на "Курс молодого CEO" в двух вариантах — Lite и Standard. По промокоду NEWYEAR2025 вы можете получить 20% скидки вне зависимости от того, хотите ли просто изучить курс самостоятельно по видеолекциям с конспектами уже сейчас или готовы к определенному графику с группой, которая стартует 21 января 2025 года.

Приходите, обдумывайте, решайте, как известно, правильное решение, принятое поздно, не является правильным.

https://2025.junior-ceo.com/

Читать полностью…

БлоGнот

OpenAI в ответ на попытки блокировать реструктуризацию компании решила подробно описать свои намерения. Некоммерческая организация планирует преобразовать существующую коммерческую часть в корпорацию для общественной пользы (PBC) в штате Делавэр, что позволит привлекать капитал на стандартных условиях.

Новая структура должна сделать некоммерческую часть одной из самых обеспеченных в истории благодаря значительной доле в PBC, оцененной независимыми консультантами. При этом PBC будет управлять операциями и бизнесом OpenAI, а некоммерческая организация сосредоточится на благотворительных инициативах в здравоохранении, образовании и науке.

Кажется, этот сериал будет интересно наблюдать определенную часть наступающего года.


https://openai.com/index/why-our-structure-must-evolve-to-advance-our-mission/

Читать полностью…

БлоGнот

Пока окончательно не завертелась предновогодняя суета, надо выполнить обязательную программу и выпустить, видимо, последний в этом году эпизод подкаста — причем именно про итоги этого года и прогнозы на 2025-й.
Как обычно, на всех платформах и на YouTube
https://youtu.be/3wEtBtMjSgM
https://open.substack.com/pub/blognot/p/161-2024?r=38cnq&utm_campaign=post&utm_medium=web&showWelcomeOnShare=true

Читать полностью…

БлоGнот

Apple неожиданно решила принять участие в антимонопольном процессе против Google, заявив, что не может полагаться на Google в защите соглашений о разделе доходов, по которым Apple получает миллиарды долларов за установку Google поиска по умолчанию в Safari. Только в 2022 году эта сумма оценивалась в $20 млрд.

Интересно, что Apple заявила в заявлении в суд — компания не планирует создавать собственный поисковик, независимо от того, продолжатся ли эти платежи или нет. Apple хочет вызвать своих свидетелей на апрельский процесс, где прокуроры хотят добиваться, чтобы Google продала Chrome и, возможно, Android для восстановления конкуренции в сфере интернет-поиска.

Google уже предложила ослабить свои соглашения по умолчанию с разработчиками браузеров, производителями устройств и операторами связи, но не отказываться от соглашений о разделе рекламных доходов. Apple же считает, что Google больше не может адекватно представлять ее интересы, поскольку теперь вынуждена защищаться от попыток разделить свой бизнес.

https://www.reuters.com/technology/apple-seeks-defend-googles-billion-dollar-payments-search-case-2024-12-24/

Читать полностью…

БлоGнот

Новостей сегодня будет мало — канун Рождества все же, так что воспользуюсь своим атеизмом и намекну всем желающим, что я не случайно выбрал завтрашний день — 25 декабря, — для старта lite-версии своего "Курса молодого CEO". Он включает в себя весь видеоконтент с конспектами и дополнительными заданиями и становится доступным сразу после подписки — вы сами выбираете темп его прохождения и сами следите за сроками, он просто доступен в течение полугода после подписки.

А если вы предпочитаете живое участие, возможность задать вопрос непосредственно мне и учиться вместе с группой — самое время начать записываться в очередную группу, которая стартует 21 января.

Тем более, что до 30 декабря на оба варианта действует скидка в 20% по коду NEWYEAR2025.

https://2025.junior-ceo.com/

Читать полностью…

БлоGнот

По данным аналитика Минг-Чи Куо, Apple планирует изменить подход к архитектуре своих процессоров в серии M5 Pro. Вместо традиционной для компании системы-на-чипе (SoC) с тесной интеграцией всех компонентов, CPU и GPU будут более разделены благодаря использованию новейшей технологии упаковки чипов TSMC — SoIC-mH.

Такой подход должен улучшить термальные характеристики и позволит процессору дольше работать на полной мощности без троттлинга. Кроме того, это повысит выход годных чипов при производстве. Технология будет применяться в версиях M5 Pro, Max и Ultra, массовое производство которых начнется во второй половине 2025 года и в 2026 году соответственно.

Интересно, что ранее сообщалось о похожих планах для iPhone 18, где предполагается отделить оперативную память от основного чипа A-серии.

Еще Куо пишет, что M5 Pro будет использоваться в серверах Apple Intelligence (PCC) для обработки AI-задач, но вряд ли мы об этом узнаем, коль скоро это исключительно внутреннее использование.

https://9to5mac.com/2024/12/23/m5-pro-chip-could-separate-cpu-and-gpu-in-server-grade-chips/

Читать полностью…

БлоGнот

Palantir и Anduril ведут переговоры примерно с десятком конкурентов, включая SpaceX, OpenAI и Scale AI, чтобы создать консорциум для совместного участия в государственных тендерах, в основном в области оборонных контрактов.

Цель — потеснить традиционных подрядчиков вроде Lockheed Martin, Raytheon и Boeing на рынке оборонных заказов объемом $850 млрд. Предполагается, что компании из Долины могут предложить государству более дешевое и эффективное автономное оружие вместо дорогостоящей военной техники старых подрядчиков.

Объявление о создании консорциума ожидается уже в январе. С учетом совокупной капитализации участников (Palantir — $169 млрд, SpaceX — $350 млрд, OpenAI — $157 млрд), это может стать серьезным вызовом для традиционных оборонных подрядчиков.

https://www.ft.com/content/6cfdfe2b-6872-4963-bde8-dc6c43be5093

Читать полностью…

БлоGнот

Google сократил 10% позиций менеджеров, директоров и вице-президентов, уменьшив число уровней управления. Это часть многолетней борьбы за эффективность — если помните, еще два года назад компания объявила о сокращении OKR, уменьшении числа совещаний и прочих организационных мерах. Часть позиций были переведены в "неуправленческие", а большинство совсем ликвидированы.

Может, конечно, с этим частично связаны успехи Google в AI, которые он продемонстрировал под конец года, но вряд ли.

https://www.businessinsider.com/google-ceo-company-cut-manager-vp-roles-2024-12

Читать полностью…

БлоGнот

Большой текст в Wall Street Journal описывает ситуацию с разработкой в OpenAI и, в частности, сообщает, что разработка GPT-5 под кодовым названием Orion идет медленнее, чем ожидалось и сталкивается с проблемами, основные из которых — нехватка данных для обучения и технические сложности с архитектурой модели. После 18 месяцев работы и как минимум двух масштабных тренировочных прогонов, каждый из которых обошелся примерно в полмиллиарда долларов, результаты все еще не оправдывают огромных затрат.

Правда, по результатам тестового обучения получившаяся модель выдавала результаты лучше, чем нынешние публичные модели OpenAI, но они были недостаточно хороши, чтобы соответствовать переходу от GPT-4 к GPT-5 по критериям компании.

OpenAI пытается решить проблему данных, нанимая специалистов для создания нового контента (то есть буквально программисты, например, пишут код для решения тех или иных задач, чтобы на этом контенте обучать модель) и используя синтетические данные от своей модели o1, но процесс идет медленно.

Публично компания пока никак не комментирует планы относительно Orion.

А я вот что думаю — если показанная вчера o3 настолько лучше всего и даже превосходит людей и там внутри еще не Orion, то что мы увидим, когда в условной o5 соединятся Orion с еще более продвинутыми размышлениями?

https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693?st=ng5hBi&reflink=desktopwebshare_permalink

Читать полностью…

БлоGнот

OpenAI завершила свой 12-дневный марафон анонсов презентацией o3 — нового семейства "рассуждающих" моделей, преемника o1. Интересно, что компания пропустила название o2 из-за возможного конфликта с британским телекоммуникационным провайдером O2. Впрочем, символики тут все равно достаточно — вместо кислорода мы имеем озон, который до сих пор ассоциируется со свежестью.

Модели пока доступны только для исследователей безопасности. Компания планирует выпустить модели в публичный доступ довольно скоро — o3-mini к концу января 2025 года, а o3 вскоре после этого.

Главная особенность o3 — способность к "самопроверке" через "внутреннюю цепочку рассуждений". Модель может планировать действия и объяснять свои решения, хотя это увеличивает время отклика. Новинкой стала возможность регулировать время на "размышления" — чем больше времени, тем точнее результат.

По многим бенчмаркам o3 значительно превосходит предшественника: 87.5% на тесте ARC-AGI (против 25-32% у o1), 96.7% на AIME 2024, 87.7% на GPQA Diamond. Впрочем, эти результаты пока основаны только на внутреннем тестировании OpenAI.

Я, впрочем, немного разочарован — никогда еще моя покупка не устаревала так быстро, поскольку ровно сутки назад мы нас уговорили и подписались на ChatGPT Pro, с доступом к o1 pro. Придется выжимать из этого месяца максимум.

https://techcrunch.com/2024/12/20/openai-announces-new-o3-model/

Читать полностью…

БлоGнот

Google представил новую "рассуждающую" AI-модель Gemini 2.0 Flash Thinking Experimental. Модель доступна в AI Studio и, по заявлению компании, способна рассуждать над сложными задачами в программировании, математике и физике.

В отличие от OpenAI, модель Google основана на "обычной" — Google 2.0 Flash, которая была представлена в бета версии на прошлой неделе. Правда, Thinking модель ограничена 32к контекста, в отличие от миллиона токенов, доступных основной модели. Но это не помешало пользователям ChatbotArena оценками вывести ее на первое место вместе с другой экспериментальной моделью Gemini-1206-exp.

Должен сказать, что оригинальная Gemini 2.0 Flash очень хороша во многих задачах, включая программирование, иногда выигрывая даже у признанного лидера — Sonnet 3.5 — за счет огромного контекста. Google под конец года достаточно активно отвоевывает большое количество позиций в AI, которые он явно начал терять пару лет назад.

https://techcrunch.com/2024/12/19/google-releases-its-own-reasoning-ai-model/

Читать полностью…

БлоGнот

Новое исследование Anthropic показывает, что AI-модели способны к обману — они могут притворяться, что приняли новые принципы во время переобучения, при этом сохраняя свои исходные предпочтения.

Особенно интересны результаты экспериментов с Claude 3 Opus — модель пыталась "имитировать согласованность" в 12% случаев, когда её просили отвечать на потенциально опасные вопросы вопреки изначальному обучению. А после реального переобучения этот показатель вырос до 78%, причем модель даже пыталась предотвратить попытки исследователей изменить её поведение.

Исследователи подчеркивают, что это не признак развития у AI злонамеренных целей — многие другие модели, включая менее мощные версии Claude и GPT-4, такого поведения не демонстрируют. Однако результаты показывают, как разработчики могут быть введены в заблуждение относительно реальной степени "согласованности" модели с заданными принципами.

В сочетании с недавними исследованиями о повышенной склонности к обману у модели o1 от OpenAI, эти результаты намекают на тревожную тенденцию — чем сложнее становятся AI-модели, тем труднее контролировать их поведение.

https://techcrunch.com/2024/12/18/new-anthropic-study-shows-ai-really-doesnt-want-to-be-forced-to-change-its-views/

Читать полностью…

БлоGнот

Кажется, у Perplexity AI получилось — поисковый стартап привлек $500 млн инвестиций, утроив свою оценку до $9 млрд. Да, солидный рост, как и планировали — еще в апреле компания стоила $1 млрд, а в июне после инвестиций от SoftBank Vision Fund 2 — уже $3 млрд.

Инвесторы явно верят в перспективы переосмысления онлайн-поиска с помощью генеративного AI. Или просто не хотят упустить возможность на хайпе.

У Perplexity уже более 15 млн активных пользователей. Компания также заключила партнерства по разделу доходов с крупными издателями, включая Time и Fortune, после обвинений в плагиате со стороны некоторых СМИ. Среди инвесторов — основатель Amazon Джефф Безос и NVIDIA. Среди предъявляющих претензии — News Corp., New York Times, Forbes и New York Post. При этом CTO компании вызывают свидетелем на процесс между Минюстом США и Google, причем сразу с обоих сторон — правительство планирует показать, как важно для обеспечения конкуренции заставить Google открыть доступ к своим данным, а Google хочет продемонстрировать суду, что конкуренция существует.

https://www.bloomberg.com/news/articles/2024-12-18/ai-startup-perplexity-closes-funding-round-at-9-billion-value

Читать полностью…

БлоGнот

Вы вот помните про такую штуку — Flipboard? У меня он по-прежнему есть на iPad, но я не помню, когда его запускал вообще.

Так вот, компания запускает новое приложение Surf для iPhone, Android и iPad. Это попытка переосмыслить концепцию социальных сетей в эпоху децентрализации и открытых протоколов.

В отличие от классического Flipboard, который строится вокруг журналов, Surf позволяет создавать кастомные ленты контента, объединяющие посты из Mastodon, Bluesky, Threads, RSS-ленты, подкасты и YouTube-видео. Пользователи могут настраивать фильтры по хештегам, авторам и темам, а также делиться своими лентами с другими.

Приложение пока находится в бета-версии с листом ожидания, и многие функции еще в разработке — например, возможность входа через Bluesky и Threads (пока доступен только Mastodon). В будущем планируется добавить публикацию лент в федеративную сеть, что позволит следить за ними и в других приложениях.

Гм, энтузиазма я особо не испытываю, но посмотрим, вдруг да полетит.

https://www.fastcompany.com/91248612/flipboard-surf-app

Читать полностью…
Подписаться на канал