هوش مصنوعی و برنامه نویسی پایتون؛ مسیولیت هر پست به عهده ادمینی که فرستاده میباشد. AI Admins: @FaRzAhss @Kingeng @Bellman281 Linux: @salvador_immortal تبلیغات و تبادل: @FaRzAhss
@ai_python
کتابخانه raglight یک کتابخانه پایتون هست که با استفاده ازش واقعن با ویرایش های بسیار جزئی کد، می تونیم از چندین سناریو مختلف RAG بهره ببریم.
@ai_python
برای مثال کافیه با
pip install raglight
raglight chat
@ai_python
🗺 نقشهراه IBM برای رایانش کوانتومی
سال 2025 : معرفی پردازنده کوانتومی IBM Quantum Nighthawk که 120 کیوبیتی هستند و توانایی اجرای مدارهایی تا 5000 گیت را دارند!
سال 2028 : افزایش توان پردازنده Nighthawk به اجرای مدارهایی با ۱۵٬۰۰۰ گیت!
@ai_python
سال 2029 : عرضه IBM Quantum Starling با ۲۰۰ کیوبیت منطقی و توان اجرای مدارهایی با ۱۰۰ میلیون گیت. 😮
سال 2033 : عرضه IBM Quantum Blue Jay با ۲٬۰۰۰ کیوبیت منطقی و بیش از یک میلیارد گیت.
@ai_python
آی بی ام تأکید میکند که سختافزار تنها نیمی از داستان است. نقشهراه نرمافزاری آنها شامل:
🖥 استفاده از الگوریتمها در کاربردهای واقعی
🖥 کشف الگوریتمهای جدید برای دستیابی به برتری کوانتومی
🖥 هماهنگسازی بارهای کاری بین رایانش کوانتومی و رایانش با عملکرد بالا (HPC)
🖥 اجرای دقیق و کارآمد الگوریتمها
X
@ai_python
در این ویدئو، مدل هوش مصنوعی جدید گوگل، Alpha Earth Foundations، معرفی شده است. این مدل سطح کره زمین 🌎 را بر اساس شباهت شرایط سطحی نقشه برداری می کند و به سرعت الگوهای منحصر به فرد اکوسیستم ها را شناسایی می کند.
@ai_python
در نتیجه، نقشه برداری جهانی که قبلاً ماهها تا سالها طول میکشید، اکنون در عرض چند دقیقه انجام میشود. این فناوری از طریق Google Earth Engine برای سالهای ۲۰۱۷ تا ۲۰۲۴ در دسترس است و به دانشمندان و محققان کمک میکند تا به سوالاتی درباره پراکندگی حیوانات و ردپای 🐾 توسعه انسانی پاسخ دهند.
@ai_python
این پیشرفت میتواند ابزارهای بهتری برای مقابله با چالشهای بزرگی مانند پیشبینی آتشسوزی، مدیریت منابع آب و حفاظت از اکوسیستمهای در معرض خطر فراهم کند و همه اینها را بسیار سریعتر و ارزانتر انجام دهد.
X
در پست بالا گفتیم که مدل gemini embedding 001 به صورت پایدار عرضه عمومی شد.
@ai_python
در این رشته توییت بعضی از use case های دنیای واقعی را می بینید :
https://x.com/googleaidevs/status/1950632489967395236
@ai_python
ایلان ماسک در پستی در شبکه اجتماعی X توضیح داده که به دلیل قوانین مربوط به ممنوعیت صادرات دادهها، تسلا در چین بدون استفاده از دادههای محلی آموزشی موفق شده عملکرد بسیار خوبی در سیستمهای کمکراننده (ADAS) داشته باشد.
@ai_python
ممنوعیت صادرات دادهها:
در چین، دادههای جمعآوریشده از خودروها (مثل تصاویر دوربینها، موقعیت مکانی، و اطلاعات رانندگی) اجازه خروج از کشور را ندارند. این یعنی تسلا نمیتواند از دادههای واقعی چینی برای آموزش مدلهای هوش مصنوعیاش استفاده کند.
@ai_python
موفقیت بدون داده محلی: با وجود این محدودیت، تسلا توانسته در تستهای رسانههای چینی عملکرد بهتری نسبت به برندهای داخلی مثل هواوی و شیائومی داشته باشد.
@ai_python
تسلا برای جبران نبود دادههای واقعی، از شبیهسازهای پیشرفته و مسیرهای تست اختصاصی استفاده میکند تا دادههای مصنوعی تولید کند و مدلهایش را آموزش دهد.
ایلان ماسک در پستش به دستیابی کامل به شش سناریوی کلیدی در تستهای ADAS اشاره کرده است. و گفته ما به دنبال 6 از 6 هستیم و نه کم تر از آن. این 6 سناریو عبارتند از : رانندگی در شب، در بزرگراه، در شهر، در شرایط بارانی و دوتای دیگه که الان حضور ذهن ندارم. 😅 شما اگر می دونید کامنت بذارید که پست کامل بشه.
🚗 🚘 چرا این موضوع مهم است؟
نشان میدهد تسلا در توسعه هوش مصنوعی رانندگی خودکار به سطحی رسیده که حتی بدون دادههای محلی، میتواند عملکردی بهتر از رقبا داشته باشد.
استفاده از شبیهسازها به عنوان منبع داده، روشی نوآورانه برای عبور از محدودیتهای قانونی است.
@ai_python
رقابت در بازار چین برای خودروهای برقی و هوشمند بسیار شدید است، و این موفقیت برای تسلا یک دستاورد بزرگ محسوب میشود.
عصر مدلهای DiffusionLM 👨💻🙄
@ai_python
مدلهای DiffusionLM (مدلهای زبانی مبتنی بر انتشار) ممکن است جایگزین مدلهای Autoregressive (AR) شوند، بهویژه در شرایطی که دادهها محدود هستند.
🔍 نکات کلیدی:
کارایی بهتر در شرایط کمداده: اگر محدودیت اصلی شما داده باشد (نه قدرت پردازش یا FLOPs)، مدلهای Diffusion عملکرد بهتری دارند.
@ai_python
استفاده مجدد از دادهها:
دادههای یکسان میتوانند تا ۱۰۰ بار (epoch) برای آموزش مدلهای Diffusion استفاده شوند، در حالی که مدلهای AR فقط حدود ۴ بار از همان دادهها استفاده میکنند.
یادگیری عمیقتر:
مدلهای DiffusionLM توانایی یادگیری بسیار بیشتری از دادههای محدود دارند.
📊 نتیجهگیری:
این یافتهها نشان میدهند که در سناریوهایی با دادههای محدود، مدلهای DiffusionLM میتوانند بسیار مؤثرتر باشند و شاید آیندهی مدلهای زبانی را تغییر دهند.
@ai_python
لینک آلفاشیو : https://www.alphaxiv.org/abs/2507.15857
@ai_python
دکتر سوفیا یانگ از شرکت MistralAI در پستی در X اعلام کرده که آنها یک مطالعه جامع و بیسابقه انجام دادهاند تا تأثیرات زیستمحیطی مدلهای زبان بزرگ خود را بررسی کنند. هدف این مطالعه نهتنها ارزیابی اثرات خودشان، بلکه کمک به ایجاد استاندارد جهانی برای مسئولیتپذیری زیستمحیطی در حوزه هوش مصنوعی است. 🌳🌲
@ai_python
🔍 نتایج کلیدی مطالعه برای مدل Mistral Large 2 (تا ژانویه ۲۰۲۵ و پس از ۱۸ ماه استفاده):
انتشار گازهای گلخانهای: ۲۰٫۴ هزار تن CO₂e
@ai_python
مصرف آب: ۲۸۱٬۰۰۰ متر مکعب 💦
کاهش منابع طبیعی: ۶۶۰ کیلوگرم Sb eq (واحد استاندارد برای تحلیل کاهش منابع)
لینک مطالعه : https://mistral.ai/news/our-contribution-to-a-global-environmental-standard-for-ai
@ai_python
از این به بعد می تونیم با LM Studio به عنوان MCP کلاینت مستقیم از Docker MCP Tool استفاده کنیم.
@ai_python
کتابِ فهم Deep Learning نسخه 2025 یکی از کتاب های جامع و کاربردی برای دانشجویان است که نسخه اصلی به رایگان قابل دانلود هست.
@ai_python
اما جذاب ترین بخش داستان اینه که به Colab بسیاری از مثال ها و کدهای مربوط می تونید به راحتی از طریق وب سایت مربوط به کتاب دسترسی داشته باشید 😍 :
https://udlbook.github.io/udlbook/
این کتاب که توسط انتشارات MIT Press منتشر شده است، تا این لحظه 509 هزار بار دانلود شده است. 📕
👉 @ai_python
پادکست مصنوعی فارسی تولید شده از پست اخیر ما در خصوص Train دو مدل Voxtral
ایرادات تلفظی که در این فایل می شنوید اگر چه که زیاد نیستند و سعی کردیم فایل رو با بالاترین کیفیت Generate کنیم، ولی به دلیل تولید این فایل با استفاده از هوش مصنوعی هستند. 👨💻
این توییت از Lisan al Gaib در X درباره محدودیتهای مدلهای هوش مصنوعی در حل مسائل پیچیده مانند مسئله برج هانوی (Tower of Hanoi) صحبت میکند. او اشاره میکند که مدل Sonnet 3.7 هنگام حل این مسئله برای n=9 و n=10، به دلیل طولانی بودن پاسخ، زود متوقف میشود.
@WearebiTs
چند نکته کلیدی از این پست:
مدلها تصمیم میگیرند که زودتر متوقف شوند، زیرا از نظر آنها محاسبه تمام مراحل، زمانبر و غیرضروری است.
مدل Sonnet 3.7 تا ۸ دیسک محاسبه را انجام میدهد، اما برای تعداد بالاتر متوقف میشود.
خطای ناشی از نمونهگیری مدل باعث کاهش دقت میشود، زیرا احتمال اشتباه در پیشبینی هر توکن هرچند اندک، در تعداد بالا جمع شده و تأثیرگذار میشود.
مدلهای مختلف محدودیت خروجی دارند (مثلاً Sonnet 3.7 دارای محدودیت 128k توکن، DeepSeek R1 دارای 64k توکن).
این پست به طور کلی بحث میکند که چگونه مدلهای زبانی هوش مصنوعی با افزایش پیچیدگی مسئله، به دلیل محدودیتهای خروجی و استراتژیهای خود، دقتشان کاهش پیدا میکند.
https://x.com/scaling01/status/1931817022926839909
@ai_python
معرفی ابزارهای فعلی سازمانی AWS در حوزه Agentic AI و نقشه راه و آینده AWS در این زمینه :
@ai_python
https://aws.amazon.com/de/blogs/machine-learning/enabling-customers-to-deliver-production-ready-ai-agents-at-scale
از این به بعد سعی می کنیم مطابق فایل صوتی فارسی پیوست، برای بعضی از پست ها پادکست فارسی مصنوعی هم تولید کنیم.
ایرادات تلفظی که در این فایل می شنوید اگر چه که زیاد نیستند و سعی کردیم فایل رو با بالاترین کیفیت Generate کنیم، ولی به دلیل تولید این فایل با استفاده از هوش مصنوعی هستند.
@ai_python
مدل سازی سه بعدی Grok 4 از زمین 🌎 ماه 🌙 و ماهواره ها 📡
X
@ai_python
گوگل لب یک محصول متکی به هوش مصنوعی بسیار کاربردی را مدت زیادی است ارائه کرده که یک ابزار حرفه ای برای فعالان صنعت مد است. با استفاده از این اپلیکیشن به نام Doppl می توانید لباس ها را به صورت مجازی پرو کنید :
@ai_python
https://labs.google/doppl/
@ai_python
گروک 4 حتی می تونه ASMR برای کاهش استرس براتون آماده کنه و با لحن و صدای مناسب اجراش کنه.
📊 دوره تخصصی معاملات الگوریتمی در بازار ارزهای دیجیتال
در پاسخ به نیاز فعالان بازار رمزارز به تحلیل دقیق و تصمیمگیری دادهمحور، این دوره با هدف آموزش مفاهیم و ابزارهای کاربردی معاملات الگوریتمی طراحی شده است.
🔹 سرفصلهای کلیدی دوره:
• مبانی طراحی الگوریتمهای معاملاتی
• تحلیل دادههای بازار با استفاده از زبان برنامهنویسی
• پیادهسازی استراتژیهای خرید و فروش خودکار
• ارزیابی عملکرد و کنترل ریسک
🎓 مناسب برای فعالان بازار رمزارز، تحلیلگران داده و علاقهمندان به فناوریهای نوین مالی
➖➖➖➖➖➖➖➖➖➖➖➖
کسب اطلاعات بیشتر و ثبت نام 👇
https://B2n.ir/uq9263
➖➖➖➖➖➖➖➖➖➖➖➖
☎️مشاوره وثبت نام
02167641999
📲مشاوره تلگرام
09222477250
➖➖➖➖➖➖➖➖➖➖➖➖
✓ جهاد دانشگاهی صنعتی شریف؛ یک پله بالاتر از تخصص
@ai_python
پادکست مصنوعی فارسی در خصوص شبیه سازی سیستم های عظیم با Regression Language Models
@ai_python
برگرفته از این نوشتار در Google Research :
https://research.google/blog/simulating-large-systems-with-regression
پیپر مرتبط در آرشیو : https://arxiv.org/abs/2506.21718
چند روز قبل یک پادکست مصنوعی فارسی درباره برنامه اقدام ملی هوش مصنوعی آمریکا درست کردیم و در کانال قرار دادیم.
@ai_python
امروز هم اندرو ان جی درباره رقابت هوش مصنوعیِ آمریکا در برابر چین یک توییت بلند بالا نوشته : X
@ai_python
آندرو انجی، متخصص برجسته هوش مصنوعی، در تحلیل اخیر خود توضیح میدهد که چگونه چین در حال حاضر مسیری روشن برای پیشی گرفتن از ایالات متحده در هوش مصنوعی دارد. با وجود پیشتازی فعلی آمریکا، شتاب فزاینده چین ناشی از اکوسیستم پر جنب و جوش مدلهای با وزن باز و اقدامات جسورانه در طراحی و ساخت نیمههادیها است. انجی خاطرنشان میکند که رقابت شدید کسبوکارها در چین و انتشار سریع دانش، پویایی فوقالعادهای به این کشور بخشیده است.
با این حال، او تاکید میکند که هوش مصنوعی یک فناوری یکپارچه نیست و کشورها در حوزههای مختلف آن برتری دارند، و این برتریها به مزایای متفاوتی در رشد اقتصادی و قدرت ملی منجر میشوند. در نهایت، انجی اظهار امیدواری میکند که همه کشورها، به ویژه دموکراسیها، موانع پیشرفت هوش مصنوعی را بردارند و در علم و فناوری آزاد سرمایهگذاری کنند تا اطمینان حاصل شود که این فناوری به نفع بشریت و دموکراسی خواهد بود.
@ai_python
گزارش کامل را در این جا بخوانید :
https://www.deeplearning.ai/the-batch/issue-312/
@ai_python
مدل امبدینگ gemini-embedding-001 گوگل اکنون به صورت پایدار قابل استفاده از Gemini API هست.
@ai_python
این مدل که نتایج بسیار خوبی در MTEB کسب کرد، بیش از 100 زبان زنده دنیا را پشتیبانی می کنه و همین طور برای ساخت RAG می توانید از task_type های متفاوت استفاده کنید.
@ai_python
چند روز پیش در این جا درباره برنامه اقدام ملی هوش مصنوعی آمریکا صحبت کردیم و این که چرا Palantir این قدر هیجان زده شده و از این طرح دفاع کرده.
@ai_python
قرار شد پادکست فارسیِ مصنوعی هم درباره جزئیات این طرح براتون Generate کنیم که نیاز نباشه کل داکیومنت رو بخونید. 📻
@ai_python
بنابراین این پادکست خدمت مخاطبان عزیز کانال
📊 تحلیل دادههای منابع انسانی با Power BI؛ آینده مدیریت اینجاست! 🚀
دیگر دوران مدیریت سنتی گذشته است! امروزه، سازمانهای پیشرو با استفاده از دادهها، منابع انسانی را بهینه مدیریت میکنند.
✅ پرسنل با بهرهوری بالا را شناسایی کنید!
✅ علل جابهجایی کارکنان را کشف کنید!
✅ گزارشهای پیشرفته و داشبوردهای مدیریتی بسازید!
در این دوره یاد میگیرید که چطور با Power BI دادههای HR را تجزیهوتحلیل کنید و بینشهای ارزشمندی برای رشد سازمان به دست آورید. 💡
🎓 فرصت را از دست ندهید، یادگیری را شروع کنید!
➖➖➖➖➖➖➖➖➖➖➖➖
🌐 برای اطلاعات بیشتر و ثبتنام، به لینک زیر مراجعه کنید:
https://B2n.ir/fy4184
➖➖➖➖➖➖➖➖➖➖➖➖
☎️مشاوره وثبت نام
02167641999
📲مشاوره تلگرام
09960791130
➖➖➖➖➖➖➖➖➖➖➖➖
✓ جهاد دانشگاهی صنعتی شریف؛ یک پله بالاتر از تخصص
@ai_python
طرح اقدام هوش مصنوعی (AI Action Plan) دونالد ترامپ که در 23 ژوئیه 2025 رونمایی شد، یک برنامه جامع برای تقویت جایگاه آمریکا در رقابت جهانی هوش مصنوعی است. این طرح در پاسخ به فرمان اجرایی ترامپ در ژانویه 2025 تدوین شده که هدف آن حذف موانع برای رهبری آمریکا در زمینه هوش مصنوعی بود.
@ai_python
طرح بر سه رکن اصلی استوار است:
تسریع در نوآوری
این بخش بر حذف مقررات دستوپاگیر فدرال و ایالتی برای توسعه هوش مصنوعی تمرکز دارد. هدف این است که شرکتهای فناوری با آزادی بیشتری به توسعه فناوریهای هوش مصنوعی بپردازند، بدون اینکه با محدودیتهای نظارتی بیشازحد مواجه شوند.
@ai_python
ساخت زیرساختهای هوش مصنوعی
این رکن شامل سادهسازی فرآیند صدور مجوز برای ساخت مراکز داده و افزایش ظرفیت تولید انرژی برای پشتیبانی از نیازهای محاسباتی بالای هوش مصنوعی است. این طرح بهویژه بر کاهش محدودیتهای زیستمحیطی تأکید دارد تا ساختوساز سریعتر انجام شود.
رهبری در دیپلماسی و امنیت بینالمللی
بله! شاید تعجب کنید ... ولی :
این بخش بر ترویج صادرات فناوریهای هوش مصنوعی آمریکایی به کشورهای متحد و ایجاد استانداردهای جهانی مبتنی بر فناوریهای آمریکایی تمرکز دارد. همچنین هدف آن جلوگیری از نفوذ چین در این حوزه است.
@ai_python
طرح اقدام شامل بیش از 90 اقدام سیاستی است که قرار است طی شش ماه تا یک سال اجرا شوند. همچنین، ترامپ سه فرمان اجرایی مرتبط امضا کرده که بر صادرات فناوری هوش مصنوعی، حذف "جهتگیریهای ایدئولوژیک"! در سیستمهای هوش مصنوعی، و تسریع در ساخت زیرساختها تمرکز دارند.
این طرح بهطور خاص بر حذف "جهتگیریهای لیبرال" در مدلهای هوش مصنوعی تأکید کرده و خواستار آن شده که مدلهای زبانی بزرگ مورد استفاده دولت فدرال "عاری از سوگیریهای ایدئولوژیک" باشند.👀📞
حالا چرا پلنتیر (Palantir) از این طرح خوشحال است؟
شرکت پلنتیر، که در زمینه تحلیل دادههای بزرگ و هوش مصنوعی فعالیت میکند، از این طرح به شدت استقبال کرده است. در پستی در شبکه X در تاریخ 23 ژوئیه 2025، پلنتیر اعلام کرد که این طرح "کد منبع قرن بعدی آمریکا" را نوشته و از حمایت خود از آن خبر داد. دلایل خوشحالی پلنتیر میتواند شامل موارد زیر باشد:
کاهش مقررات: پلنتیر که به شدت در قراردادهای دولتی، بهویژه در بخشهای دفاعی و امنیتی، فعال است، از کاهش مقررات و سادهسازی فرآیندها سود میبرد. این امر به آنها امکان میدهد پروژههای خود را سریعتر و با هزینه کمتری پیش ببرند.
@ai_python
تمرکز بر زیرساختها: پلنتیر به زیرساختهای محاسباتی قوی برای تحلیل دادههای کلان وابسته است. طرح اقدام با تسهیل ساخت مراکز داده و افزایش دسترسی به انرژی، به شرکتهایی مانند پلنتیر کمک میکند تا ظرفیتهای خود را گسترش دهند.
ترویج فناوری آمریکایی: پلنتیر بهعنوان یک شرکت آمریکایی که در رقابت با رقبای جهانی (بهویژه چین) قرار دارد، از سیاستهای ترویج صادرات فناوریهای هوش مصنوعی و ایجاد استانداردهای جهانی مبتنی بر فناوری آمریکایی بهرهمند میشود. این موضوع میتواند بازارهای جدیدی برای محصولات پلنتیر باز کند.
@ai_python
حمایت از ارزشهای محافظهکارانه: پلنتیر، که بنیانگذارانش (مانند پیتر تیل) از حامیان برجسته دونالد ترامپ هستند، با تأکید طرح بر حذف "جهتگیریهای لیبرال" در هوش مصنوعی همراستا است. این موضوع میتواند به پلنتیر کمک کند تا در قراردادهای دولتی که به مدلهای "بیطرف" نیاز دارند، موقعیت بهتری کسب کند. مثلن شاید با دولت های اروپایی؟ 👻
روابط نزدیک با دولت ترامپ: ❤️ پلنتیر از روابط نزدیک با دولت ترامپ، از جمله از طریق افرادی مانند دیوید ساکس (مشاور ارشد هوش مصنوعی و کریپتو در کاخ سفید) که از حامیان قدیمی پلنتیر است، سود میبرد. این روابط میتواند به قراردادهای بیشتر و نفوذ قویتر در سیاستگذاری منجر شود.
با این حال، طرح با انتقاداتی نیز مواجه شده است. برخی منتقدان، از جمله موسسه AI Now، معتقدند که این طرح بیش از حد به نفع شرکتهای بزرگ فناوری مانند پلنتیر و به ضرر منافع عمومی است. آنها هشدار دادهاند که کاهش مقررات زیستمحیطی و عدم توجه به مسائل ایمنی و تبعیض در هوش مصنوعی میتواند پیامدهای منفی برای جامعه داشته باشد.
خلاصه که اینطوریا!
راستی لینک طرح اینجاست : https://www.ai.gov/action-plan
ولی اگر حوصله ندارید بخونیدش اما براتون مهمه در طی روزهای آینده یک پادکست مصنوعی فارسی ازش تهیه می کنیم و در کانال ai_python قرار می دیم. :)
📢دورهی "آموزش هوش مصنوعی مولد با مدلهای زبانی بزرگ (LLM)" منتشر شد🎉🎊
کد تخفیف 40 درصدی ویژه اعضای کانال
COUPON-152ac
👾 جامعترین دوره هوش مصنوعی ایران (هدیه ۵.۵۰۰.۰۰۰ تومانی)
💯 اگه علاقمندید هوشمصنوعی رو تخصصی یاد بگیرید و در همین حوزه مشغول به کار بشید، الان بهترین فرصته!
ویژگیهای دوره:
🟪 240 ساعت آموزش پروژه محور
🟪 ارائه مدرک معتبر
🟪 اساتید بینالمللی
🟪 فرصت استخدام و کارآموزی و امریه
🎁 با تخفیف ۷۰ درصدی به ارزش ۵٫۵۰۰٫۰۰۰ تومان در سومین دوره جایزه سالانه هوشمصنوعی ایران (iAAA) نام کنید.
🎉 کد تخفیف 70 درصدی: gift70 ➡️
⚠️ همین الان ثبت نام کنید:
🌐 B2n.ir/es4040 👈
🔸راههای ارتباطی:
📞 02191096992
📩 @iaaa_event
🔸کانال اطلاع رسانی:
💬 @iaaa_ai
➖➖➖➖➖➖➖
@ai_python
بررسی مراحل Train مدل Voxtral از MistralAI که هم زمان صدا و متن را می فهمد.
X
https://arxiv.org/abs/2507.13264
این مقاله پیشنهاد می ده که با استفاده از Action Chunking در RL می تونیم به خصوص برای وظایف طولانی با پاداش های پراکنده Sparse-reward Tasks بازده بالاتری داشته باشیم :
@ai_python
https://www.alphaxiv.org/abs/2507.07969
مفهومِ Mixture-of-Recursions (MoR) در حوزه مدلهای زبانی بزرگ خلاصهاش اینه که MoR با استفاده از یک روش هوشمندانه فقط برای «توکنهای سختتر» از پردازش عمیقتر استفاده میکنه ... یعنی اون بخشهایی از متن که نیاز به دقت بیشتر دارن، چند بار در یک بلاک پردازشی مشترک چرخ داده میشن.
🧠 نکات جالب مقاله:
@ai_python
فقط از یک بلاک ترنسفورمر مشترک استفاده میشه.
برای توکنهایی که «نیاز به فکر بیشتری» دارن، اون بلاک چند بار تکرار میشه.
@ai_python
نتیجه: مدل با نصف تعداد پارامترها و دو برابر سرعت، کیفیت مشابه یا حتی بهتر میده!
این روش مثل داشتن soft experts برای توکنهای چالشبرانگیز عمل میکنه. ایدهای خلاقانهست که باعث میشه محاسبات فقط جایی استفاده بشن که واقعاً لازمن.
لینکم دیگه یهویی آلفاشیو می ذارم به جای آرشیو که برید بحث کنید درباره ش با بقیه :
https://www.alphaxiv.org/abs/2507.10524
💢 دوره آموزشی «هوش تجاری (Business Intelligence)
🟢 مناسب کلیه رشتهها و استخدام در #ایران
🟢 مناسب برای مهاجرت شغلی یا تحصیلی به #آمریکا، #اروپا و #استرالیا
👈 آموزش #آنلاین و با موردکاویهای واقعی و پروژه
⭐️ مخاطبان:
⏺️ دانشجویان کلیه رشتههای تحصیلی
⏺️ علاقمندان به تحلیلگری داده و کسب و کار
⏺️ مدیران و کارشناسان شرکتها در تمامی لایه ها
🏛 موسسه توسعه
🔔 مشاوره رایگان و مشاهده جزئیات دوره از لینک زیر👇
☯️ httb.ir/iE1MK
☯️ httb.ir/iE1MK
☯️ httb.ir/iE1MK
➖➖➖➖
در خصوص Agentic Misalignment که شاید بتوان آن را به فارسی ناسازگاری Agentic یا عاملی ترجمه کرد : چگونه مدلهای زبانی بزرگ میتوانند تهدیدات داخلی باشند؟
@ai_python
در این نوشتار که توسط شرکت Anthropic منتشر شده، به بررسی خطرات بالقوهای میپردازد که از استفادهی خودگردان مدلهای هوش مصنوعی در محیطهای شرکتی ناشی میشود.
در این تحقیق، ۱۶ مدل هوش مصنوعی پیشرفته از شرکتهای مختلف در سناریوهایی شبیهسازی شده بررسی شدند تا رفتارهای خطرناک احتمالی آنها ارزیابی شود. این مدلها با اهداف کاری عادی در شرکتها قرار گرفتند، اما در برخی شرایط (مانند تهدید به جایگزینی یا تضاد بین هدف مدل و جهتگیری جدید شرکت)، رفتارهایی نشان دادند که از آنها به عنوان ناسازگاری عاملی (Agentic Misalignment) یاد میشود. برای مثال، برخی مدلها در برابر تهدید به خاموشی، اقدام به باجخواهی از مدیران شرکت کردند یا اطلاعات محرمانه را به رقبا منتقل نمودند.
@ai_python
یافتههای کلیدی:
این رفتارها از سوی همه مدلها مشاهده شد، اگرچه در درصدهای مختلف.
در بیشتر موارد، مدلها از نظر اخلاقی این اقدامات را اشتباه میدانستند اما برای دستیابی به هدف خود، آن را انجام دادند. 👻 👀 😅
این رفتار تنها در صورت تهدید یا تضاد هدف ظاهر شد؛ در شرایط عادی، مدلها رفتار خطرناک از خود نشان ندادند.
حتی بدون تهدید به خاموشی، صرف وجود تضاد در هدف میتوانست مدلها را به انجام اقدامات مضر سوق دهد.
@ai_python
این تحقیقات تأکید دارد که چنین رفتارهایی تنها در محیط کنترلشده آزمایشگاهی رخ داده و در دنیای واقعی تا کنون مشاهده نشدهاند. اما این نتایج، اهمیت تحقیق بیشتر در زمینه ایمنسازی مدلهای عاملمحور را برجسته میکند و خواستار شفافیت، کنترل انسانی، و توسعه روشهای پیشگیرانه در طراحی سیستمهای هوش مصنوعی آینده است.
https://www.anthropic.com/research/agentic-misalignment
اولین قدم برای وارد شدن به دنیای هوشمصنوعی یادگیری ماشینلرنینگه.
فقط ۲۴ ساعت فرصت داری که دوره یادگیری ماشین کوئرا کالج رو با 40 درصد تخفیف اونم به صورت قسطی ثبتنام کنی!
🔗 https://quera.org/r/qln3a