گیک آلرتس، جایی برای گیکها نوشتهها از هوش مصنوعی، فناوریهای روز، مقالات علمی، رویدادها، تغییرات و دگرگونیهای جهانی و ... است. اکس: https://x.com/Geek_Alerts ارتباط: soroushahmadi@duck.com
مدل تولید ویدیو Veo 3 گوگل به شکل رسمی معرفی شد
جدیدترین مدل گوگل برای ساخت ویدیو، یعنی Veo 3 میتونه همزمان با ساخت ویدیو، براش موسیقی متن، افکتهای صوتی و حتی دیالوگ هم تولید کنه، میتونید به Veo 3 یه دستور بدید که شخصیتها و محیط رو توصیف کنه و حتی دیالوگها رو با توضیحی درباره اینکه چطور باید به نظر برسن، پیشنهاد بدید.
برای کاهش خطر دیپفیک دیپمایند از تکنولوژی واترمارکینگ اختصاصی خودش به اسم SynthID استفاده میکنه تا نشانگرهای نامرئی رو تو فریمهایی که Veo 3 تولید میکنه، جاسازی کنه.
#GoogleIO
🔗 techcrunch
🤓 @geekalerts
جمنای لایو (Gemini Live) برای همه کاربران اندروید و iOS رایگان شد، همون ویژگی هست که با دوربین گوشیتون محیط اطراف رو به جمنای نشون میدید و بعد ازش سوال میکنید. نقطه قوتش اینه که میتونه با چیزایی که روی صفحه گوشیتون هم هست تعامل داشته باشه.
گوگل گفته در هفتههای آینده، جمنای لایو بیشتر با زندگی روزمره ترکیب میشه. مثلا میتونه رویداد به تقویم گوگل اضافه کنه، به گوگل مپس دسترسی داشته باشه و با بقیه بخشهای اکوسیستم گوگل تعامل کنه.
#GoogleIO
🔗 theverge
🤓 @geekalerts
شرکت Xreal داره روی یه عینک واقعیت توسعهیافته (XR) مبتنی بر اندروید کار میکنه که اسم رمز پروژه هم آئورا هست. این عینک با همکاری ایکسریل، گوگل و کوالکام ساخته میشه.
پروژه آئورا که یه دستگاه XR با قابلیت دیدن محیط اطراف (OST) هست، قراره با استفاده از چیپست کوالکام، تخصص ایکسریل در سیستمهای بصری و اندروید XR گوگل، ایکسریل رو به رقباش نزدیکتر کنه و یه دستگاه محاسبات فضایی کاملتر از قبل ارائه بده. از روی تصاویر میشه دید که دوربین داخلی داره، به نظر میرسه از همون تکنولوژی نمایشگر دوچشمی عینکهای دیگه ایکسریل بهره میبره.
با اینکه جزئیات زیادی از آئورا مثل قیمت و تاریخ عرضه هنوز اعلام نشده ولی میتونه بازار این تکنولوژی رو تغییر بده، توی نمایشگاه AWE در ژوئن هم اطلاعات بیشتری ازش میاد.
#GoogleIO
🔗 techradar
🤓 @geekalerts
گوگل یه تکنولوژی جدید به اسم گوگل بیم (Google Beam) معرفی کرده که با هوش مصنوعی، تماسهای تصویری رو به تجربهای سهبعدی و واقعی تبدیل میکنه، از مجموعه ۶ دوربین برای تصویربرداری از زوایای مختلف استفاده میکنه. هوش مصنوعی این تصاویر رو در لحظه ترکیب و یک مدل سهبعدی زنده از فرد میسازه.
ردیابی حرکات سر با دقت میلیمتری و ویدیو با سرعت ۶۰ فریم بر ثانیه ارائه میشه. نکته مهمش اینه که برای دیدن این تصویر سهبعدی، نیازی به عینک یا تجهیزات خاصی نیست، چون از نمایشگر مخصوص میدان نوری (light field display) استفاده میکنه.
هدفش اینه که حس و حالی شبیه سیستمهای ارتباطی هولوگرافیک ایجاد کنه، اما در اندازه واقعی و کاملاً طبیعی. اچپی جزئیات بیشتری از این پلتفرم رو تو نمایشگاه InfoComm در ماه ژوئن ارائه میده. گوگل با شرکتهای دیگری مثل زوم هم همکاری میکند. اولین دستگاههای بیم اواخر سال ۲۰۲۵ برای کاربران در دسترس قرار میگیره.
#GoogleIO
🔗 cnet
🤓 @geekalerts
مایکروسافت Windows AI Foundry رو معرفی کرده، یه پلتفرم یکپارچه برای توسعهدهندهها تا اپلیکیشنهای هوش مصنوعی که روی خود دستگاه اجرا میشن رو راحتتر بسازن. [L]
مایکروسافت زیرسیستم ویندوز برای لینوکس (WSL) رو اوپنسورس کرده و کدش رو روی گیتهاب گذاشته. به کاربرای ویندوز اجازه میده توزیعهای لینوکس رو مستقیم اجرا کنن. [L]
گوگل یه قابلیت جدید به اسم Stream Realtime به AI Studio اضافه کرده که به مدلهای Gemini اجازه پردازش همزمان تصویر، ویدیو و صدا رو میده، یعنی gemini دیگه میتونه دنیای واقعی رو به صورت لحظهای درک کنه، احتمالا اخبار بیشتر ازش توی Google I/O بیاد. [L]
مایکروسافت پروژه متنباز NLWeb رو معرفی کرده که به توسعهدهندهها اجازه میده با چند خط کد، رابط چت و جستجوی مبتنی بر هوش مصنوعی رو به وبسایتشون اضافه کنن. این سیستم از دادههای خود سایت و مدل AI دلخواه استفاده میکنه. [L]
انویدیا و مایکروسافت دارن با همکاری هم روی کامپیوترهای RTX AI، استفاده از هوش مصنوعی روی ویندوز ۱۱ رو سادهتر میکنن. انویدیا کتابخونه TensorRT for RTX رو بازطراحی کرده که با Windows ML هماهنگ شده و عملکرد AI روی این کامپیوترها رو بیش از ۵۰ درصد سریعتر کرده. [L]
استارتاپ ژاپنی ساکانا اِیآی یه مدل جدید به اسم CTM معرفی کرده که مثل مغز انسان هست، یعنی پردازش اطلاعات رو بر اساس زمان انجام میده و به تاریخچه فعالیت نورونهاش توجه میکنه. اوپنسورس و قابل استفاده هست. [L]
مایکروسافت اج الان میتونه ترجمه کامل فایلهای PDF با یک کلیک به بیش از ۷۰ زبان رو انجام بده، کوپایلوت چت هم میتونه فایلهای آفیس آنلاین رو خلاصه و تحلیل کنه. [L]
مایکروسافت پلتفرم Discovery رو برای تحقیقات علمی معرفی کرده. این نتیجه همکاریهای جدیدش با انویدیا هست. [L]
مایکروسافت چندایجنت (multi-agent) رو معرفی کرده که به ایجنتهای مختلف اجازه میده با هم همکاری کنن و کارهای پیچیده انجام بدن. [L]
گیتهاب کوپایلوت حالا یه ایجنت داره که میتونه به صورت ناهمزمان کدها رو تست، مشکلات رو پیدا و اصلاح کنه و حتی پول ریکوئست باز کنه. این ایجنت تو مخزن کد شما میچرخه و مراحل کارش رو هم بهروز میکنه. از MCP هم پشتیبانی میکنه. [L]
گوگل دیپمایند از AlphaEvolve، هوش مصنوعی که خودش الگوریتمهای کامپیوتری جدید ابداع و در زیرساخت گوگل پیادهسازی میکنه، رونمایی کرد. این AlphaEvolve تونسته ۰.۷٪ از منابع محاسباتی جهانی گوگل رو آزاد کنه و حتی رکورد ۵۶ ساله ضرب ماتریس رو شکسته. [L]
ربات برنامهنویسی jules گوگل، که با مدل جمنای ۲.۵ پرو کار میکنه، از تست خصوصی خارج شده و به صورت جهانی در نسخه بتا با ۵ کار رایگان روزانه برای هر کاربر با اکانت گوگل در دسترسه. میتونه کارهایی مثل بهروزرسانی کتابخانهها، بازنویسی کد و حل مشکلات پروژه رو با تحلیل ساختار فایلها و تاریخچه پروژه انجام بده و تغییرات رو به شکل پول ریکوئست در گیتهاب ارائه کنه. [L]
اپل روی یه نسخه از Siri کار کرده که میگن خروجی در حد ChatGPT داره و مدیرهای داخلی اپل دارن تلاش میکنن امکان دسترسی به جستجوی وب رو بهش اضافه کنه و جایگزین سیری فعلی بشه. [L]
تا امروز حدود ۱۰۰ نفر تو دنیا از ایمپلنتهای مغزی برای ارتباط با کامپیوتر استفاده میکنن، مثل نیورالینک و انتظار میره این عدد تو ۱۲ ماه آینده دو برابر بشه و به حدود ۲۰۰ نفر برسه. [L]
مایکروسافت داره پشتیبانی از پروتکل Model Context Protocol یا MCP (که توسط Anthropic ساخته شده) رو به ویندوز ۱۱ اضافه میکنه. [L]
گیتهاب یه ایجنت کدنویسی برای کوپایلوت معرفی کرده که میتونه باگها رو رفع کنه، قابلیت جدید به کد اضافه کنه و مستندات رو بهبود بده. این ایجنت تو یه ماشین مجازی کار میکنه و تغییراتش رو برای بازبینی ارائه میده. همچنین گیتهاب، نسخه VS Code کوپایلوت رو اوپنسورس کرده. [L]
🤓 @geekalerts
بالاخره قابلیت جستجو توی چتهای Gemini اضافه شد، این گزینه کمک میکنه خیلی سادهتر توی چتهایی که قبلا با جمنای داشتید جستجو کنید، کاربران نسخه وب با کلیک روی آیکون ذرهبین و کاربران موبایل از طریق پنل کناری میتونن به این قابلیت دسترسی پیدا کنن.
🔗 9to5google
🤓 @geekalerts
اتحادیه اروپا داره به اپل فشار میاره تا به کاربران آیفون اجازه بده دستیار صوتی پیشفرض دیگهای غیر از سیری انتخاب کنن. [L]
مایکروسافت رمزنگاری ضدکوانتومی (PQC) رو به نسخههای آزمایشی ویندوز (Insider Build ۲۷۸۵۲ به بالا) اضافه کرده. منتظرش توی آپدیتهای بعدی ویندوز ۱۱ باشید. [L]
گوگل ترنسلیت حالا میتونه به عنوان اپلیکیشن پیشفرض ترجمه در آیفون و آیپد تنظیم بشه. [L]
وال استریت ژورنال میگه اروپا تو رقابت فناوری از آمریکا و چین عقب افتاده. از ۵۰ شرکت برتر فناوری دنیا، فقط ۴ تاشون اروپایی هستن و از ۱۰ شرکت برتر کوانتومی هم هیچکدوم اروپایی نیستن. [L]
ابزار جدیدی به اسم Defendnot کشف شده که به هکرها اجازه میده آنتیویروس پیشفرض ویندوز (ویندوز دیفندر) رو خاموش کنن. مایکروسافت توی آپدیتهای جدید ویندوز این مشکل رو برطرف کرده، پس حتما ویندوز رو آپدیت کنید. [L]
ترامپ قانون Take It Down Act رو امضا کرده که انتشار تصاویر خصوصی بدون رضایت (از جمله دیپفیک و پورن) رو جرم کیفری میدونه و مجازات تا سه سال حبس و جریمه نقدی داره. پلتفرمهای آنلاین هم موظفن این محتواها رو ظرف ۴۸ ساعت حذف کنن. [L]
شیائومی از اولین تراشه اختصاصیش به اسم XRING 01 رونمایی کرد، اواخر همین ماه (۲۲ می) میاد. فناوری ۳ نانومتری نسل دوم TSMC داره و احتمالا از هستههای Cortex-X۹۲۵ ARM استفاده میکنه. [L]
کاربرا میگن ویندوز ۸.۱ آخرین نسخه مدرن ویندوزه که روی سیستمهای قدیمی با هارد دیسک (HDD) سرعت خوبی داره و ویندوز ۱۰ و ۱۱ وابستگی زیادی به سرعت بالای ورودی/خروجی دارن، تا حدی که شایعه شده بود مایکروسافت میخواد SSD رو حداقل نیاز سیستمی ویندوز ۱۱ کنه. [L]
تایوان آخرین راکتور هستهای فعالش رو هم تعطیل کرد. نگران بودن فاجعهای مثل فوکوشیما پیش بیاد، دارن میرن سمت انرژیهای خورشیدی و … [L]
دفتر هواشناسی بریتانیا با همکاری گوگل دیپمایند، انویدیا، مایکروسافت داره از هوش مصنوعی برای پیشبینی دقیق آب و هوا استفاده میکنه، هدفشون اینه که تاریخهای دورتر رو بتونن پیشبینی کنن. [L]
چین با دو پروژه ماهوارهای به اسم گوانگ و چیانفان میخواد ۲۸ هزار ماهواره در مدار پایینی زمین قرار بده. گوانگ برای مصارف داخلی و امنیتیه و چیانفان برای شرکتهای مخابراتی خارجی. هدفش رقابت با استارلینک هست ولی چالشهایی نظارت شدید چین روی شبکه ممکنه باعث بشه هیچ زمانی مشتری خارجی نداشته باشه. [L]
مایکروسافت از ویرایشگر متن جدید خط فرمان به اسم Edit on Windows رونمایی کرده که اوپن سورس هست و کمتر از ۲۵۰ کیلوبایت حجمشه، به توسعهدهندهها اجازه میده فایلها رو مستقیم در Command Prompt یا ترمینال ویندوز ویرایش کنن. امکاناتی مثل باز کردن چند فایل، جستجو و جایگزینی و پشتیبانی از عبارات باقاعده هم داره. [L]
فنلاند اعلام کرده سیستم خط آهن خودش رو از مقیاس روسی (۱۵۲۴ میلیمتر) به مقیاس استاندارد اروپایی (۱۴۳۵ میلیمتر) تغییر میده. این پروژه که از شمال کشور شروع میشه و میلیاردها یورو هزینه و دههها زمان میبره، برای هماهنگی بیشتر با اتحادیه اروپا انجام میشه. [L]
🤓 @geekalerts
نیورالینک اعلام کرد که قراره با همکاری وزارت بهداشت ابوظبی و کلینیک کلیولند یه کارآزمایی بالینی به اسم UAE-PRIME رو تو ابوظبی انجام بده. این اولین کارآزمایی بالینی خارج از آمریکاست. هدف این آزمایش اینه که ببینن چطور افرادی که مشکلات حرکتی و گفتاری دارن، میتونن با استفاده از فکرشون دستگاهها رو کنترل کنن و با محیط اطرافشون ارتباط برقرار کنن.
سالهاست که شرکتهای ایلان ماسک از صندوقهای اماراتی پول جمع کردن. مثلاً شرکت وی کپیتال که تو دبی مستقره، حداقل از پنج تا از بیزینسهای ایلان ماسک حمایت مالی کرده. اسپیسایکس هم خدمات پرتاب برای بعضی از ماهوارههای اماراتی ارائه میده. شرکت تونلزنی بورینگ کمپانی هم تو فوریه با سازمان حمل و نقل دبی یه قرارداد بسته بود تا یه سیستم حمل و نقل زیرزمینی تو شهر بسازه. ایلان ماسک هفته پیش تو ریاض گفته بود دوست داره بورینگ با عربستان هم همکاری کنه.
ارول ماسک، پدر ایلان، هم گفته که داره با یه شرکت اماراتی برای ساختن برج ماسک تو دبی مذاکره میکنه، نکته عجیب و سمی هم اینه که ارول ماسک هیچ ارتباطی با پسرش ایلان نداره و این پروژه رو خودش داره جلو میبره.
🔗 venturebeat
🤓 @geekalerts
رویداد گوگل I/O ۲۰۲۵ امشب ساعت ۸.۳۰ هست که در کانال گیکالرتس به صورت کامل پوشش میدیم.
این رویداد که در آمفیتئاتر Shoreline در مانتین ویو کالیفرنیا، نزدیک مقر اصلی گوگل، برگزار میشه قرار هست با دو موضوع اصلی اندروید ۱۶ و معرفی ویژگیهای جدید هوشمصنوعی و البته پیشرفتهای Gemini باشه.
شایعاتی هم در مورد احتمال معرفی یک رقیب برای Pinterest توسط گوگل وجود داره که بر پایه نتایج جستجوی تصویر گوگل کار میکنه و به کاربران اجازه میده مجموعههایی از تصاویر رو بسازن و به اشتراک بذارن.
🔗 techradar
🤓 @geekalerts
خب نسخه موبایل NotebookLM به طور رسمی عرضه شد و از اپاستور یا گوگلپلی میتونید در لیست استفاده از برنامه شرکت کنید تا ۲۴ ساعت اینده برنامه قابل استفاده هست.
🤓 hadi @geekalerts
اداره غذا و داروی آمریکا (FDA) اولین آزمایش خون برای تشخیص آلزایمر رو تایید کرده. این تست برای افراد ۵۵ سال به بالا با علائم اولیه قابل استفاده است و ماده بتا-آمیلوئید رو در خون تشخیص میده. قبلاً تنها راههای تایید شده، آزمایش تهاجمی مایع نخاعی یا اسکنهای گرانقیمت PET بودن. [L]
ارتش آمریکا تصمیم گرفته به قانون «حق تعمیر» بپیونده تا خودش بتونه تجهیزاتش رو تعمیر کنه و کمتر به پیمانکاران وابسته باشه. وزیر ارتش گفته از این به بعد بندهای «حق تعمیر» تو همه قراردادها میاد. [L]
ژاپن با تصویب قانون «پدافند سایبری فعال» حالا فقط دفاع نمیکنن، بلکه میتونن در برابر تهدیدات سایبری، به جای انتظار، با عملیات تهاجمی پیشگیرانه با مهاجمان احتمالی مقابله کنن. [L]
آمریکا داره به پروازهای تجاری مافوق صوت مجوز میده، اگه تصویب بشه شرکتی مثل «بوم سوپرسونیک» که تونسته با جت آزمایشی XB-۱ دیوار صوتی رو بدون صدای بلند بشکنه خدمات تجاری خودش رو شروع کنه. [L]
ایلان ماسک میگه اسپیسایکس میتونه تا ۲۰۲۹ انسان رو به مریخ بفرسته، در حالی که ناسا رسیدن به این هدف تا ۲۰۴۰ رو هم بلندپروازانه میدونه. چینیها هم برنامه دارن تا ۲۰۳۸ ایستگاه تحقیقاتی روی مریخ بسازن. [L]
🤓 @geekalerts
اروپا برای اپل قانونی گذاشت که باید به برنامهها اجازه بده سیستم پرداخت خارجی داشته باشن، اپل هم مجبور شد این رو اجرا کنه ولی به معنی تلافی نکردن نیست، الان هر برنامهای که سیستم پرداخت خارجی اضافه کرده باشه اپل یه هشدار با آیکن قرمز تو صفحه نصبش نمایش میده که این برنامه امن نیست یا حریمخصوصی نداره. این هشدار رو هم جوری نمایش میده که شما احساس کنید اون بازی یا برنامه رو نباید نصب کنید.
🔗 mjtsai
🤓 @geekalerts
آنتروپیک میخواد یه نسل جدید از مدلهاشو معرفی کنه که توانایی پیدا کردن اشتباهاتون خودشون و اصلاحش رو دارن، این قابلیت تو برنامهنویسی هم خیلی کاربردیه و کد تولید شده رو خودکار تست و اصلاح میکنه. [L]
آقای جفری هینتون، یکی از پدرخواندههای هوش مصنوعی، که سال ۲۰۱۶ گفته بود AI تا ۵ سال دیگه رادیولوژیستها رو بیکار میکنه، حالا اعتراف کرده که تحلیلش اشتباه بوده. [L]
متا دو مدل برای تحقیقات مولکولی معرفی کرده، OMol۲۵، بزرگترین دیتاست باز شیمی محاسباتی با بیش از ۱۰۰ میلیون محاسبه مولکولی، و UMA، مدلی که خواص شیمیایی مولکولها رو با سرعت بالا پیشبینی میکنه. این ابزارها که رایگان هستن، برای کشف دارو و مواد جدید خیلی کاربرد دارن. [L]
شرکت سایت ساز ویکس از Wixel رونمایی کرد، یه ابزار AI هست که یه نسخه رایگان هم داره برای ویرایش عکس و متن همراه با قالبهای آماده، نمونه فعلیش کانوا هست. [L]
شرکت OpenAI میخواد یه دیتاسنتر ۵ گیگاواتی تو ابوظبی بسازه، مساحتش حدود ۲۶ کیلومتر مربع (بزرگتر از موناکو) و مصرف برقش معادل ۵ راکتور هستهایه، انویدیا هم قراره سختافزارهای پیشرفته مثل Blackwell GB۳۰۰ رو برای این دیتاسنتر تامین کنه. [L]
اپل داره مشکل لهجه انگلیسی مدلهای AI در زبانهای دیگه رو حل میکنه. این مدلها اغلب با محوریت انگلیسی طراحی شدن و وقتی به زبانهای دیگه صحبت میکنن، مثلا وقتی به فارسی حرف میزنن اما لهجه انگلیسی دارن. [L]
شرکت ویندسرف مدل SWE-۱ رو معرفی کرده که برای استفاده مستقیم روی خود گوشی طراحی شده. ساختارش بر پایه ترنسفورمره و میتونه ورودیهای متنی و تصویری رو همزمان پردازش کنه، سرعت پردازشش روی گوشیهای پرچمدار حدود ۲۵ توکن در ثانیه هست. [L]
بهزودی به Grok قابلیتی اضافه میشه که میتونید باهاش نقاشی بکشید یا متنی رو بنویسید و بهش بدید، ویژگی Sketchpad میتونه برای گوشیها و تبلتها که نوشتن و کشیدن راحتتره مفید باشه. [L]
تیم OpenAI داره روی GPT-۵ کار میکنه و هدف اصلیش اینه که ابزارهای مختلفش مثل Codex، Operator و سیستم حافظه رو تو یه محیط واحد بیاره تا کاربرا هی بینشون سوئیچ نکنن. [L]
ساندکلاود بعد از اعتراض کاربرها به خاطر اینکه در قوانینش نوشته بود از دیتاها برای AI استفاده میکنه حالا مجدد قوانینش رو آپدیت کرده و نوشته از دیتاها برای ساخت صدا استفاده نمیکنه و صرفا برای پیشنهاد موسیقی هست. [L]
🤓 @geekalerts
شرکت OpenAI از Codex، دستیار مهندسی نرمافزار خودش رونمایی کرد.
این دستیار که از یک مدل جدید به اسم codex-1 برپایه مدل o3 استفاده میکنه، میتونه به مخزن گیتهاب شما وصل بشه و مطابق اون و با در اختیار داشتن ترمینال و ابزارهای لازم وظایفی که بهش محول میکنید رو به طور خودکار انجام بده، درنهایت هم تغییرات روی پروژهتون اعمال کنه. توی بنچمارکها عملکرد خیلی خوبی رو نشون داده و فعلا برای کاربران اشتراکی در تب Codex توی چتجیپیتی در دسترس قرار گرفته.
https://openai.com/index/introducing-codex/
hadi @geekalerts
یه تحقیق جدید میگه گفتگوی طولانی با مدلهای AI باعث افت عملکردشون میشه، میگه بهتره تو همون چت اول هرچیزی که میخواید رو بهش بگید. [L]
تو اندروید ۱۶ حتی اگه گوشی دزدیده بشه و سارق به روشی بتونه گوشی رو فکتوری ریست کنه به کمک Factory Reset Protection گوشی باز هم برای استفاده نیاز به اجازه صاحب اصلی داره. [L]
یوتیوب داره از Gemini برای ویژگی به اسم «پیک پوینتز» (Peak Points) استفاده میکنه. این سیستم لحظههای حساس و مهم ویدیوها رو تشخیص میده و تبلیغات رو درست بعد از این لحظات حساس پخش میکنه. نتیجش درآمد بیشتر از تبلیغات و البته افزایش درآمد یوتیوبرها هست. [L]
مایکروسافت گفته APIهای جستجوی بینگ رو که به توسعهدهندهها و موتورهای جستجوی کوچیک اجازه میداد به نتایج جستجو دسترسی داشته باشن، در تاریخ ۱۱ آگوست ۲۰۲۵ تعطیل میکنه. جایگزین مستقیمی هم معرفی نکرده. البته گفته شده بزرگترین مشتریها مثل داکداکگو تحت تأثیر قرار نمیگیرن. [L]
اپل مپس قراره اطلاعات و امتیاز رستورانها و هتلها رو از منابعی مثل میشلن و اینفچوئیشن نشون بده. فعلا از آمریکا شروع شده و بهزودی میتونید مستقیم از خود نقشه، هتل یا رستوران رزرو کنید. [L]
اپل موزیک امکان ایمپورت کردن پلیلیستهای موسیقی از سرویسهای دیگه مثل اسپاتیفای رو داره اضافه میکنه. [L]
🤓 @geekalerts
گوگل یه پلن اشتراک به اسم Google AI Ultra معرفی کرده که هزینش سالی ۳۰۰۰ دلار هست. این پلن مثل یه بلیط VIP برای هوش مصنوعی گوگل هست و برای کاربرای حرفهای مثل محققها، توسعهدهندهها و تولیدکنندههای محتوا طراحی شده که به حداکثر عملکرد و جدیدترین ویژگیها نیاز دارن.
در کنار بالاترین سقف استفاده از ابزارهای گوگل، سرعت دسترسی سریعتر، مشترکانش اولین گروهی هستن که ویژگیهای جدید رو دریافت میکنن، دسترسی زودهنگام به مدل Veo 3 و همچنین مدل جدید Deep Think 2.5 Pro رو داره. چیزهای دیگه مثل ۳۰ ترابایت فضای ذخیره سازی و اشتراک یوتیوب پریمیوم رو هم داره، کاربرای جدید هم برای ۳ ماهه اول ۵۰ درصد تخفیف میگیرن.
پلن قبلی یعنی AI Premium هم اسمش به Google AI Pro تغییر کرده و یه سری مزایای اضافه هم پیدا میکنه. مثل دسترسی زودهنگام به Flow با Veo 2 و Gemini در کروم.
#GoogleIO
🔗 androidauthority
🤓 @geekalerts
گوگل میخواد به Gemini ویژگی Agent Mode اضافه کنه. با این قابلیت، شما میتونید یه کاری رو به Gemini بسپارید اون به نمایندگی از شما میره و انجامش میده. پیچای تو یه مثال میگه، مثلا دو نفر دنبال آپارتمان تو تگزاس میگردن. این ایجنت میتونه از سایتهایی مثل Zillow آگهی پیدا کنه و در صورت نیاز از پروژه مارینر برای تنظیم فیلترهای خاص استفاده کنه. یه نسخه آزمایشی ازش هم بهزودی برای مشترکان فعال میشه.
همزمان پروژه مارینر که یه جور دستیار هوش مصنوعیه و میتونه به جای شما تو وب جستجو کنه، حالا تا ۱۰ تا کار رو همزمان مدیریت میکنه. یه قابلیت جدید هم بهش اضافه شده به اسم یاد بده و تکرار کن (Teach and Repeat). یعنی شما یه بار یه کاری رو بهش نشون میدی، و اون یاد میگیره که چطور کارهای مشابه رو در آینده انجام بده. پیچای گفته پروژه مارینر تابستون امسال به طور گستردهتری در دسترس قرار میگیره.
#GoogleIO
🔗 theverge
🤓 @geekalerts
گوگل میت داره ترجمه همزمان مکالمه رو میگیره، یعنی مثلا شما فارسی حرف میزنید ولی طرف مقابل به زبون خودش (مثلا انگلیسی) میشنوه، این فرایند در لحظه انجام میشه. برای ترجمه هم از Gemini استفاده میکنه و حتی سعی میکنه لحن و حالت بیانتون رو هم مثل خودتون انجام بده.
گوگل یه دمو هم نشون داده که یه نفر انگلیسی صحبت میکنه و همکارش اسپانیایی. به محض اینکه قابلیت ترجمه Gemini فعال میشه، گوگل میت صحبتهای هر کدوم رو با همون حس و حال و لحن خودش، برای اون یکی به زبان خودش دوبله میکنه.
فعلا این قابلیت میتونه بین انگلیسی و اسپانیایی ترجمه کنه، ولی گوگل گفته به زودی (در هفتههای آینده) زبانهای ایتالیایی، آلمانی و پرتغالی هم بهش اضافه میشن. این ویژگی همین الان داره برای مشترکین فعال میشه و اواخر امسال هم برای کسبوکارها و شرکتها میاد.
#GoogleIO
🔗 theverge
🤓 @geekalerts
قابلیت «پاسخهای هوشمند» جیمیل به کمک Gemini دیگه فقط از همون ایمیلی که بازه اطلاعات نمیگیره، بلکه میتونه از کل ایمیلهای تو اینباکس و حتی فایلهای گوگل درایوتون اطلاعات رو استخراج کنه تا جوابهای کاملتر و مرتبطتری پیشنهاد بده. این پاسخها میتونن لحن و سبک شما رو هم تشخیص بدن، مثلا اگه به مدیرتون ایمیل میزنید، رسمیتر جواب میده و اگه به دوستتون، خودمونیتر.
این پاسخها اول به زبان انگلیسی تو ماه جولای به صورت آلفا داخل Google Labs میان و انتظار میره تو سهماهه سوم امسال عمومی بشن. این نسخه پولی خواهد بود و جزو پلنهای Workspace و Google One AI Premium ارائه میشه، ولی شاید در آینده برای کاربرای رایگان هم فعال بشه.
جمنای قراره تو مدیریت اینباکس جیمیل هم کمک کنه، مثلا با قابلیت «پاکسازی اینباکس» میتونید ازش بخواید ایمیلهای نخونده از یه فرستنده خاص رو حذف کنه. یا وقتی میخواید جلسه بذارید، جمنای زمانهای خالی تقویمتون رو برای پیشنهاد دادن نشون میده. چیزای دیگه مثل ترجمه همزمان مکالمه تو گوگل میت، آواتارهای هوش مصنوعی تو Google Vids، و اینکه جمنای موقع کمک به نوشتن تو گوگل داکس بتونه از اسناد لینکشده هم اطلاعات بگیره.
#GoogleIO
🔗 theverge
🤓 @geekalerts
مایکروسافت AI Actions رو به فایل اکسپلورر ویندوز ۱۱ میاره، اجازه میده کارهایی مثل حذف پسزمینه، تار کردن، جستجوی بصری و پاک کردن اشیاء رو مستقیما از فایل اکسپلورر انجام بدید و قراره در آینده از فایلهای آفیس هم پشتیبانی کنه.
🔗 neowin
🤓 @geekalerts
تو استرالیا و نیوزلند گوگل دیسکاور در نسخه وب و دسکتاپ به گوگل اضافه شده، یعنی وارد google.com بشید دیگه فقط یه صفحه ساده با نوار سرچ معروف نیست، یه فید از مطالب و اخبار ترند روزهای اخیر نشون داده میشه که بهش میگن گوگل دیسکاور. اگه خواستید تست کنید میتونید به گوگل نیوزلند برید.
یه بخش به اسم At a glance (در یک نگاه) هم کنارش ظاهر میشه که با کلیک روی سه نقطه عمودی کنارش، میتونید اون رو شخصیسازی کنید و سه گزینه برای انتخاب دارید، امور مالی (Finance)، ورزش (Sports)، و آب و هوا (Weather) که در صورت انتخاب، باکس اون بخش داخل صفحهاصلی گوگل نمایش داده میشه.
🔗 androidauthority
🤓 @geekalerts
یه کارمند مایکروسافت به اسم جو لوپز که مهندس بخش آژور هست دیروز تو کنفرانس سالانه توسعهدهندهها بلند شد و فریاد زد «ساتیا، چطوره نشون بدی مایکروسافت چطور داره فلسطینیها رو میکشه؟ چطوره نشون بدی جنایات جنگی اسرائیل با آژور قدرت گرفته؟» و «فلسطین آزاد!» «به عنوان یه کارمند مایکروسافت، من از همدستی تو این نسلکشی امتناع میکنم.»
نیروهای امنیتی هم اون رو از سالن کنفرانس بیرون بردن. نادلا هم به سخنرانیش ادامه داد و به معترضان توجهی نکرد. بعد از این ماجرا، لوپز یه ایمیل برای هزاران کارمند مایکروسافت فرستاد و اونجا بیشتر در مورد همکاری مایکروسافت با اسرائیل نوشت، مدارکی که توی این اعتراض نشون داده شد گزارشهای رسانهها مثل گاردین بود.
مایکروسافت هفته گذشته اعلام کرد که رابطه تجاریش با وزارت دفاع اسرائیل (IMOD) «به عنوان یه رابطه تجاری استاندارد ساختار یافته» هست و هیچ مدرکی پیدا نکرده که فناوریهای آژور و هوش مصنوعی مایکروسافت، یا هر نرمافزار دیگهای از این شرکت، برای آسیب رسوندن به مردم استفاده شده باشه.
🔗 theguardian
🤓 @geekalerts
مدل GPT-4.1 mini به صورت رایگان داخل ChatGPT در دسترس قرار گرفت، این نسخه جایگزین 4o Mini شده و از این پس مدل پیشفرض هست.
مدل GPT-4.1 هم برای تمام کاربران پلاس الان در دسترس هست، این مدل یه مدل «غیر استنتاجی» (non-reasoning) هست که سعی کرده تعادلی بین عملکرد بالا و هزینه کمتر برقرار کنه. اول قرار بود فقط از طریق API در دسترس باشه، اما بهخاطر بازخوردهای مثبت به ChatGPT هم اضافه شد.
🔗 venturebeat
🤓 @geekalerts
مایکروسافت قراره مدلهای Grok از xAI (متعلق به ایلان ماسک) رو روی پلتفرم خودش یعنی Azure AI Foundry میزبانی کنه. میشه یکی از اولین شرکتهای بزرگ ابری که دسترسی به Grok رو فراهم میکنه.
بحثها زیاد هست چون شریک اصلی مایکروسافت OpenAI میشه و این همکاریش با xAI بدون اختلاف نظر نیست، ولی سیاست مایکروسافت تو این مورد مشتری بیشتره، قبلا هم سر ترند شدن مدل DeepSeek R1 ساتیا نادلا دستور داده بود که تیم فنی حتی اضافهکار بمونن ولی این مدل رو فوری اضافه کنن و توی این مورد هم به خاطر تلاش ساتیا گراک اضافه شده.
مدلهای Grok 3 و Grok 3 mini که تو Azure AI Foundry ارائه میشن، کنترلشدهتر و محدودتر از مدلهای Grok روی X هستن.
🔗 techcrunch
🤓 @geekalerts
آیکنهای جدید مجموعه مایکروسافت آفیس منتشر شدن و بهزودی جایگزین میشن.
🔗 jbgski
🤓 @geekalerts
کوپایلوت توی ویندوز ۱۱ قرا هست کلید میانبر اختصاصی خودش یعنی Win+C رو بگیره، همچنین قابلیت صحبت با کوپایلوت با نگه داشتن کلید هم اضافه میشه. [L]
تردز حالا اجازه میده تا پنج لینک رو تو بیو پروفایلتون بذارید، همچنین گفته بهزودی آمار کلیک روی لینکها و خلاصه هفتگی عملکرد پروفایل رو هم اضافه میکنه. [L]
یوتیوب یه جدول هفتگی برای ۱۰۰ پادکست برتر آمریکا منتشر کرده که هر چهارشنبه بر اساس میزان تماشا بهروز میشه. تو اولین جدول، پادکست «جو روگن اکسپرینس» اول شده. یوتیوب گفته این جدول رو تو کشورهای بیشتری فعال میکنه. [L]
مطالعه جدید نشون امواج ۵G اونقدر عمیق وارد پوست نمیشن که بتونن به DNA آسیب بزنن. [L]
پروژه تور یه ابزار جدید به اسم Oniux برای لینوکس معرفی کرده که تمام برنامهها رو مجبور میکنه ترافیکشون رو از شبکه تور رد کنن. این کار در سطح هسته سیستمعامل انجام میشه و حریم خصوصی رو خیلی بیشتر حفظ میکنه و جلوی شنود اطلاعات رو میگیره. فعلا آزمایشیه. [L]
بلاخره curl بعد از ۸ سال استاندارد RFC ۷۶۸۶ رو پیادهسازی کرد تا جلوی نشت اطلاعات DNS رو بگیره. [L]
اپل برای چهارمین سال متوالی باارزشترین برند جهانی شد. طبق گزارش جدید کانتار، ارزش برند اپل به ۱.۲۹ تریلیون دلار رسیده که ۲۸ درصد رشد نسبت به سال قبل داشته و ۱۲ درصد کل ارزش ۱۰۰ برند برتر رو تشکیل میده. [L]
قرار هست یه پنل Phone Link تو منوی استارت ویندوز ۱۱ بیاد میاد که امکان دسترسی سریع به پیامها، تماسها و عکسها و هم چنین انتقال فایل بین گوشیهای اندرویدی و ویندوز رو راحتتر کنه. [L]
متا میخواد یه استیبل کوین بسازه، هدفشون ساخت یه ارز دیجیتال با قیمت ثابته که برای پرداخت به تولیدکنندههای محتوا تو اینستاگرام و بقیه پلتفرمهاشون استفاده بشه. اینجوری دیگه محدودیتهای مالی و بانکی رو ندارن و میتونن با بیشتر تولید کنندههای محتوا توی دنیا کار کنن. [L]
🤓 @geekalerts
مقاله عدم توجه مدلهای AI به کلمات منفی
فرض کنید یه رادیولوژیست داره عکس قفسه سینه یه بیمار رو بررسی میکنه. میبینه بیمار ورم بافت داره اما قلبش بزرگ نیست. برای اینکه سریعتر به تشخیص برسه، ممکنه از یه مدل هوش مصنوعی بینایی-زبان (vision-language) کمک بگیره تا گزارشهای بیماران مشابه رو پیدا کنه. حالا اگه این مدل، کلمهی «نیست» رو درست نفهمه و گزارشهایی رو بیاره که هم ورم بافت دارن و هم بزرگی قلب، تشخیص کاملا عوض میشه، چون بزرگی قلب با ورم بافت معمولا نشونهی مشکل قلبیه.
محققان MIT (از جمله کمیل آل محمود و مرضیه قاسمی) توی یه مطالعه جدید متوجه شدن که این مدلهای VLM، به شدت مستعد اینجور اشتباهات هستن چون کلمات منفی مثل «نه»، «نیست»، «بدون» و کلا مفهوم «نفی» (negation) رو درست درک نمیکنن. یعنی نمیفهمن که چیزی وجود نداره یا غایبه.
چرا این اتفاق میفته؟
این مدلها با حجم عظیمی از عکس و کپشنهای مربوط بهشون آموزش میبینن. اما این کپشنها معمولا چیزهایی که توی عکس هستن رو توصیف میکنن، نه چیزهایی که نیستن. مثلا کسی برای عکس سگی که از روی حصار میپره، نمینویسه «سگی در حال پریدن از روی حصار، بدون هلیکوپتر در تصویر» چون دیتای آموزشی مثالهایی از نفی نداره، مدل هم یادش نمیگیره.
این مدلها یه جورایی کلمات منفی رو نادیده میگیرن و فقط روی اشیاء و مفاهیمی که در جمله ذکر شده، تمرکز میکنن، انگار که اون کلمه منفی اصلا وجود خارجی نداره.
این مسئله مهمه، مثلا جاهایی که تصمیمات حیاتی گرفته میشه مثل پزشکی (تشخیص بیماری، تجویز دارو) یا کنترل کیفیت در صنعت. اگه مدلی به این سادگی مفهوم «نه» رو نفهمه، نمیشه صد درصد بهش استناد کرد.
🔗 sciencedaily
🤓 @geekalerts
گوگل قراره تو رویداد I/O ۲۰۲۵ که ۲۰ و ۲۱ می (۳۰ اردیبهشت) برگزار میشه، از مدل آپدیت شده Gemini Ultra، پروژه آسترا و ایجنت AI پروژه مارینر رونمایی کنه. [L]
مرورگر کروم حالا PDFهای اسکن شده رو با OCR میخونه (متنش رو استخراج میکنه). [L]
کروم قراره بهصورت پیشفرض بدون اختیارات کامل ادمین اجرا بشه، این کمک میکنه اگه سایت یا اکستنشنی آلوده باشه دسترسی مهمی به سیستم شما نداشته باشه. [L]
نسخه کروم اندروید بهزودی میتونه کدهای تایید پیامکی (OTP) رو به طور خودکار پر کنه. این قابلیت که الان تو خیلی از اپهای اندرویدی هست، قراره به وبسایتها هم بیاد. [L]
گوگل تو ثبت پتنتهای AI تو آمریکا برای اولین بار از IBM جلو افتاده و الان اول هست. [L]
گوگل وان اول فقط برای فضای ذخیرهسازی بود ولی گوگل بعدا AI رو هم بهش اضافه کرد، به همین دلیل امسال مشترکانش از ۱۰۰ میلیون به ۱۵۰ میلیون نفر رسیدن. این سرویس جدید اضافه شده به گوگل وان اسمش AI Premium هست. [L]
گوگل داره روی قابلیت آزمایشی «Discussions» تو صفحه جستجو کار میکنه که احتمالا هدفشون ساختن چیزی شبیه به ردیت داخل گوگل هست. [L]
یه نسخه از Gemini داره به آیفونهای چینی میاد، اونجا OpenAI کار نمیکنه و بعضیها نگرانن که این کار ممکنه حریمخصوصی افراد رو به خطر بندازه. [L]
🤓 @geekalerts
هفته گذشته خبر اومد که عربستان سعودی و قطر میخوان بدهیهای پرداخت نشده سوریه به بانک جهانی که حدود ۱۵ میلیون دلاره رو پرداخت کنن تا سوریه بتونه از کمکهای بلاعوض بانک جهانی برای بازسازی دولتش استفاده کنه.
حتی تو نشست جدید ریاض با وجود عدم علاقه ترامپ ولی راضیش کردن با رهبر سوریه دیدار داشته باشه، این تلاشهای عربستان و قطر برای از انزوا خارج کردن سوریه اما داره اولین نتایج خودش رو نشون میده، برای مثال برخی از شرکتهای مالی جهانی مثل پیپل خدمات خودشون توی سوریه رو شروع کردن.
اهمیت سرویسهای مالی جهانی مثل پیپل از این جهت هست که مردم امکان تجارت و تبادلات جهانی رو دارن و دیگه به کشور خودشون محدود نیستن.
🔗 gulfbusiness
🤓 @geekalerts
قراره به ویندوز «هِی، کوپایلت» بیاد، دستیار اختصاصی ویندوز که الان آزمایشی و با زبان انگلیسی کار میکنه و با گفتن این عبارت فعال میشه، از اونجایی که قدرت گرفته از محصولات OpenAI هست پس منتظر یه دستیار زبان فارسی توی ویندوز ۱۱ باشید.
🔗 theverge
🤓 @geekalerts