ماجرای عجیب ساخت سریع‌ترین کارت گرافیک انویدیا با کمک سخت‌افزار انویدیا و AMD!

یه خبر جالب درباره دنیای چیپ‌ها و مخصوصاً کارت گرافیک‌های هیولای جدید انویدیا براتون دارم. فکر کن، برای ساخت سریع‌ترین GPU یا همون واحد پردازش گرافیکی (که مسئول پردازش تصویر و خیلی کارهای سنگین هست) انویدیا به اسم روبین (Rubin)، دو تا رقیب بزرگ یعنی سخت‌افزار خودش و AMD رو کنار هم گذاشته تا کارت بعدیش رو فوق‌العاده کنه!

حالا داستان از این قراره که شرکت Cadence یه ابزار خیلی حرفه‌ای ساخته به اسم Dynamic Power Analysis (یا همون DPA، که کارش آنالیز مصرف برقه)، این ابزار برای چیپ‌هایی طراحی شده که خیلی بزرگ و پیچیدن. مثلاً روبین که تازه ساخته شده، بالای ۴۰ میلیارد تا گیت (یا همون ترانزیستور، واحدهای کوچیکی که مغز اصلی چیپ‌ها رو می‌سازن) داره! یعنی حسابی شلوغ پلوغه!

حالا این DPA روی یه دستگاه به اسم Palladium Z3 اجرا میشه (که در واقع یه شبیه‌ساز فوق‌سنگینه و اینقدر قویه که تو فقط چند ساعت می‌تونه مصرف برق رو تو میلیاردها چرخه محاسبه کنه). این کار معمولاً برای چیپ‌های هوش مصنوعی مثل روبین خیلی مهمه. چون این چیپ‌ها کارشون متنوعه و ممکنه یه دفعه یه بخششون خیلی زیر فشار بره و برق زیادی مصرف کنه.

یه نکته بامزه این وسط اینه که این پلتفرم شبیه‌سازی Palladium Z3 خودش از چندتا از سخت‌افزارهای انویدیا مثل BlueField DPU (یا همون واحد پردازش دیتا که مخصوص انتقال اطلاعات با سرعت بالا تو سرورهاست) و Quantum Infiniband (که نوعی شبکه مخصوص انتقال داده خیلی سریع مخصوص دیتاسنترهاست) استفاده می‌کنه تا با پروتوتایپ Protium X3 (یه جور FPGA خیلی پیشرفته که مدل چیپ هنوز ساخته نشده رو میشه روش تست کرد) ارتباط برقرار کنه.

حالا این پروتوتایپ Protium X3 هم با FPGAهای UltraScale شرکت AMD ساخته شده! FPGA هم یعنی یک مدار قابل برنامه‌ریزی که میشه هرچی دلت خواست روش تعریف کنی، مثلاً برای تست چیپ قبل از اینکه واقعا ساخته بشه. خلاصه، تو این پروژه هم سخت‌افزار انویدیا هست، هم AMD! قشنگ دو رقیب دست هم رو گرفتن واسه یه هدف مشترک.

حالا چرا انقدر آنالیز مصرف برق مهمه؟ چون هرچی چیپ‌ها قوی‌تر و بزرگ‌تر میشن، مصرف انرژی‌شون هم فضایی‌تر میشه. مثلاً روبین اگه بخواد با حداکثر قدرت کار کنه، ممکنه تا ۷۰۰ وات برق بخوره! اگه چندتا روبین کنار هم بذاری (تو حالت چند چیپی که برای دیتاسنترها لازمه)، مصرفش تا ۳۶۰۰ وات هم می‌ره بالا! یعنی فقط با این چندتا چیپ میشه یه اتو رو روشن نگه داشت!

واسه اینکه این چیپ‌ها بدون دردسر بیان تو بازار، باید طراح‌ها از همون اول مصرف انرژی و مشکلات احتمالی رو دقیقاً بدونن. با شبیه‌سازی و آنالیز زودهنگام مثل همون Palladium Z3 و DPA، طراحا می‌تونن بخش‌هایی که گلوگاه می‌شن (یعنی سرعت بقیه رو کند می‌کنن یا برق زیادی می‌کشن) رو از قبل پیدا و رفع کنن، قبل از اینکه چیپ واقعا ساخته بشه.

یه جورایی روبین قراره با غول بعدی AMD به اسم MI450 مسابقه بده. به خاطر همینم انویدیا رو داره حسابی به خودش فشار میاره تا چیپش رو بهینه‌تر کنه. البته انگار روبین یه بار ساخته شده اما نیاز به یه طراحی دوباره یا همون “ری‌اسپین” پیدا کرده (ری‌اسپین یعنی یه نسخه جدیدتر و بهتر از چیپ رو بسازن چون قبلی یه جاهایی ایراد داشته). قراره چیپ با فناوری ۳ نانومتری TSMC ساخته بشه – تازه این تکنولوژی فوق‌العاده ریز و قدرتمنده و معمولاً برای سریع‌ترین چیپ‌های دنیا استفاده میشه.

البته چون این فرایند هی زیادی تخصصیه و بهینه‌سازی زیادی می‌طلبه، شاید اولین نمونه‌های روبین تا سال ۲۰۲۶ آماده نشه (ولی اواخر همون سال احتمالاً کم‌کم وارد بازار میشه).

در آخر، این ابزارهای شبیه‌سازی و پروتوتایپینگ نه تنها برای مهندسا کمک بزرگیه که بتونن مصرف برق رو کنترل کنن و چیپ رو سبک‌تر و شیک‌تر بسازن، بلکه این تجربیات بعداً تو محصولات معمولی (یعنی اون کارت گرافیک‌هایی که ما هم می‌خریم!) استفاده میشه! خلاصه ایده‌ها و تکنولوژی‌هایی که الان واسه دیتاسنترها دارن امتحان می‌کنن، فردا سر از کامپیوترای خونه‌های ما درمیاره.

پس اگه ببینی موقع خرید کارت گرافیک، روش نوشته “بهینه شده با یادگیری از پروژه Rubin” بدون کلی مهندس شب و روز خواب نداشتن تا این شاهکار رو براتون بسازن – تازه با همکاری عجیب‌ترین رقیب‌ها، یعنی AMD و انویدیا کنار هم!

منبع: +