یه خبر جالب درباره دنیای چیپها و مخصوصاً کارت گرافیکهای هیولای جدید انویدیا براتون دارم. فکر کن، برای ساخت سریعترین GPU یا همون واحد پردازش گرافیکی (که مسئول پردازش تصویر و خیلی کارهای سنگین هست) انویدیا به اسم روبین (Rubin)، دو تا رقیب بزرگ یعنی سختافزار خودش و AMD رو کنار هم گذاشته تا کارت بعدیش رو فوقالعاده کنه!
حالا داستان از این قراره که شرکت Cadence یه ابزار خیلی حرفهای ساخته به اسم Dynamic Power Analysis (یا همون DPA، که کارش آنالیز مصرف برقه)، این ابزار برای چیپهایی طراحی شده که خیلی بزرگ و پیچیدن. مثلاً روبین که تازه ساخته شده، بالای ۴۰ میلیارد تا گیت (یا همون ترانزیستور، واحدهای کوچیکی که مغز اصلی چیپها رو میسازن) داره! یعنی حسابی شلوغ پلوغه!
حالا این DPA روی یه دستگاه به اسم Palladium Z3 اجرا میشه (که در واقع یه شبیهساز فوقسنگینه و اینقدر قویه که تو فقط چند ساعت میتونه مصرف برق رو تو میلیاردها چرخه محاسبه کنه). این کار معمولاً برای چیپهای هوش مصنوعی مثل روبین خیلی مهمه. چون این چیپها کارشون متنوعه و ممکنه یه دفعه یه بخششون خیلی زیر فشار بره و برق زیادی مصرف کنه.
یه نکته بامزه این وسط اینه که این پلتفرم شبیهسازی Palladium Z3 خودش از چندتا از سختافزارهای انویدیا مثل BlueField DPU (یا همون واحد پردازش دیتا که مخصوص انتقال اطلاعات با سرعت بالا تو سرورهاست) و Quantum Infiniband (که نوعی شبکه مخصوص انتقال داده خیلی سریع مخصوص دیتاسنترهاست) استفاده میکنه تا با پروتوتایپ Protium X3 (یه جور FPGA خیلی پیشرفته که مدل چیپ هنوز ساخته نشده رو میشه روش تست کرد) ارتباط برقرار کنه.
حالا این پروتوتایپ Protium X3 هم با FPGAهای UltraScale شرکت AMD ساخته شده! FPGA هم یعنی یک مدار قابل برنامهریزی که میشه هرچی دلت خواست روش تعریف کنی، مثلاً برای تست چیپ قبل از اینکه واقعا ساخته بشه. خلاصه، تو این پروژه هم سختافزار انویدیا هست، هم AMD! قشنگ دو رقیب دست هم رو گرفتن واسه یه هدف مشترک.
حالا چرا انقدر آنالیز مصرف برق مهمه؟ چون هرچی چیپها قویتر و بزرگتر میشن، مصرف انرژیشون هم فضاییتر میشه. مثلاً روبین اگه بخواد با حداکثر قدرت کار کنه، ممکنه تا ۷۰۰ وات برق بخوره! اگه چندتا روبین کنار هم بذاری (تو حالت چند چیپی که برای دیتاسنترها لازمه)، مصرفش تا ۳۶۰۰ وات هم میره بالا! یعنی فقط با این چندتا چیپ میشه یه اتو رو روشن نگه داشت!
واسه اینکه این چیپها بدون دردسر بیان تو بازار، باید طراحها از همون اول مصرف انرژی و مشکلات احتمالی رو دقیقاً بدونن. با شبیهسازی و آنالیز زودهنگام مثل همون Palladium Z3 و DPA، طراحا میتونن بخشهایی که گلوگاه میشن (یعنی سرعت بقیه رو کند میکنن یا برق زیادی میکشن) رو از قبل پیدا و رفع کنن، قبل از اینکه چیپ واقعا ساخته بشه.
یه جورایی روبین قراره با غول بعدی AMD به اسم MI450 مسابقه بده. به خاطر همینم انویدیا رو داره حسابی به خودش فشار میاره تا چیپش رو بهینهتر کنه. البته انگار روبین یه بار ساخته شده اما نیاز به یه طراحی دوباره یا همون “ریاسپین” پیدا کرده (ریاسپین یعنی یه نسخه جدیدتر و بهتر از چیپ رو بسازن چون قبلی یه جاهایی ایراد داشته). قراره چیپ با فناوری ۳ نانومتری TSMC ساخته بشه – تازه این تکنولوژی فوقالعاده ریز و قدرتمنده و معمولاً برای سریعترین چیپهای دنیا استفاده میشه.
البته چون این فرایند هی زیادی تخصصیه و بهینهسازی زیادی میطلبه، شاید اولین نمونههای روبین تا سال ۲۰۲۶ آماده نشه (ولی اواخر همون سال احتمالاً کمکم وارد بازار میشه).
در آخر، این ابزارهای شبیهسازی و پروتوتایپینگ نه تنها برای مهندسا کمک بزرگیه که بتونن مصرف برق رو کنترل کنن و چیپ رو سبکتر و شیکتر بسازن، بلکه این تجربیات بعداً تو محصولات معمولی (یعنی اون کارت گرافیکهایی که ما هم میخریم!) استفاده میشه! خلاصه ایدهها و تکنولوژیهایی که الان واسه دیتاسنترها دارن امتحان میکنن، فردا سر از کامپیوترای خونههای ما درمیاره.
پس اگه ببینی موقع خرید کارت گرافیک، روش نوشته “بهینه شده با یادگیری از پروژه Rubin” بدون کلی مهندس شب و روز خواب نداشتن تا این شاهکار رو براتون بسازن – تازه با همکاری عجیبترین رقیبها، یعنی AMD و انویدیا کنار هم!
منبع: +