جدیدترین ابررایانه‌های Microsoft و NVIDIA: همکاری در حوزه‌ی هوش مصنوعی و محاسبات پیشرفته

در سال‌های اخیر، رقابت در حوزه‌ی ابررایانه‌های هوش مصنوعی به اوج خود رسیده است. دو شرکت بزرگ Microsoft و NVIDIA با همکاری نزدیک، ابررایانه‌های قدرتمندی را توسعه داده‌اند که نه تنها قدرت محاسباتی بالایی دارند، بلکه به‌عنوان پایه‌ی اصلی توسعه‌ی مدل‌های بزرگ زبان (LLM) و هوش مصنوعی تولیدی نیز عمل می‌کنند. در این مقاله از مجموعه ند، به بررسی جدیدترین پروژه‌های مشترک این دو شرکت، از جمله ابررایانه‌ی NVIDIA GH200 Grace CPU و زیرساخت‌های AI در Azure می‌پردازیم.

ساخت جدیدترین ابرکامپیوتر با مشارکت Microsoft و Nvidia

فناوری هوش مصنوعی تولیدی Generative AI و یادگیری عمیق یا ماشینی Deep Learning موارد استفاده این ابرکامپیوتر هستند.

دو شرکت مایکروسافت و Nvidia با مشارکت یکدیگر در حال ساخت جدیدترین ابرکامپیوتر مبتنی بر سیستم ابری هستند که بر روی فناوری هوش مصنوعی متمرکز است. طبق ادعای این دو شرکت این رایانه پس از اتمام پروژه، یکی از قدرتمندترین ابرکامپیوترهای دنیا خواهد بود.

این ماشین جدید، زیرساخت ابرمحاسباتی Microsoft Azure و Nvidia GPU و نرم افزار هوش مصنوعی را تحت تاثیر قرار می‌دهد. بنا بر گفته این شرکت‌ها ابرکامپیوتر مورد نظر به طیف وسیعی از شرکت‌ها و سازمان‌ها کمک شایانی خواهد کرد و در استقرار، گسترش و مقیاس‌پذیری هوش مصنوعی نیز نقش مهمی خواهد داشت.

این یک حوزه جدیدی از فناوری هوش مصنوعی است که در آن مدل‌های بنیادین مثل Megatron Turing NLG 530B مبنایی برای الگوریتم‌های کنترل نشده و خودفراگیر ارائه می‌دهند که صرفا به منظور ایجاد متن، کد، تصاویر دیجیتال و ویدئو جدید می‌باشد.

طبق اضهارات Manuvir Das، معاون سازمان رایانشی NVIDIA، پیشرفت‌های هوش مصنوعی در حال حاضر سرعت زیادی گرفته و این پیشرفت غیرمنتظره مدل‌های بنیادین، موجی از تحقیقات را به راه انداخته و باعث ترویج استارت‌آپ‌ها و برنامه‌های سازمانی جدید شده است.

منبع:

https://www.techradar.com/news/nvidia-and-microsoft-are-building-a-supercomputer-in-the-cloud


۱. NVIDIA GH200 Grace CPU: مغز ابررایانه‌های آینده

معرفی NVIDIA GH200

در ماه مه ۲۰۲۳، NVIDIA اولین ابرپردازنده (Superchip) مبتنی بر CPU Grace را با نام GH200 معرفی کرد. این پردازنده ترکیبی از CPU ARM-based Grace و GPU H100 Tensor Core است که از طریق NVLink-C2C (اتصال مستقیم با پهنای باند ۹۰۰ گیگابایت بر ثانیه) به یکدیگر متصل شده‌اند. این ساختار به بهبود عملکرد و کاهش مصرف انرژی کمک می‌کند و برای مدیریت داده‌های حجیم هوش مصنوعی طراحی شده است.

ویژگی‌های کلیدی GH200

  • پهنای باند حافظه : چندین برابر بیشتر از سیستم‌های قبلی.
  • کاهش تاخیر : اتصال مستقیم GPU و CPU باعث کاهش تاخیر در پردازش داده‌ها شده است.
  • کاربردها : آموزش و استنتاج مدل‌های بزرگ زبان (مانند GPT-4)، شبیه‌سازی‌های علمی و تحلیل داده‌های بزرگ.

کاربردهای عملی

  • هوش مصنوعی تولیدی : GH200 به طور خاص برای مدیریت مدل‌های زبانی با میلیاردها پارامتر طراحی شده است.
  • علم داده و ML : پردازش سریع داده‌های بزرگ در حوزه‌هایی مانند بیوانفورماتیک و مالی.
  • شبیه‌سازی‌های فیزیکی : مانند مدل‌سازی آب و هوا یا شبیه‌سازی‌های اتمی.
جدیدترین ابررایانه‌های Microsoft و NVIDIA

۲. همکاری Microsoft و NVIDIA در Azure: ابررایانه‌های ابری

ایجاد زیرساخت AI در Azure

مایکروسافت با استفاده از تکنولوژی‌های NVIDIA، زیرساخت‌های ابری هوش مصنوعی را در پلتفرم Azure گسترش داده است. این زیرساخت‌ها از ماژول‌های DGX SuperPOD تشکیل شده‌اند که با استفاده از GPU‌های H100 و اتصال NVLink ، قدرت پردازشی بی‌نظیری را فراهم می‌کنند.

مزایای زیرساخت‌های Azure + NVIDIA

  • مقیاس‌پذیری بالا : کاربران می‌توانند منابع محاسباتی را به‌صورت خودکار و بر اساس نیاز خود افزایش یا کاهش دهند.
  • سرعت پردازش : با استفاده از GPU‌های H100، زمان آموزش مدل‌های هوش مصنوعی به‌طور چشمگیری کاهش یافته است.
  • یکپارچه‌سازی با خدمات Azure : شامل Cognitive Services، OpenAI Service و Azure Machine Learning.

مثال کاربردی: Azure OpenAI Service

مایکروسافت از زیرساخت‌های NVIDIA برای ارائه‌ی خدمات هوش مصنوعی به کاربران Azure استفاده می‌کند. برای مثال:

  • GPT-4 در Azure از زیرساخت‌های مبتنی بر GPU H100 پشتیبانی می‌کند.
  • Codex و DALL-E نیز با استفاده از این زیرساخت‌ها قابل دسترسی هستند.

بیشتر بخوانید: دور زدن هشدارهای امنیتی مایکروسافت توسط یک بدافزار

۳. پروژه‌های مشترک آینده: ابررایانه‌های اختصاصی برای AI

ابررایانه‌ی اختصاصی برای توسعه‌ی مدل‌های زبانی

مایکروسافت و NVIDIA در حال توسعه‌ی ابررایانه‌های اختصاصی برای آموزش و بهینه‌سازی مدل‌های زبانی جدید هستند. این سیستم‌ها از صدها یا هزاران GPU H100 تشکیل شده‌اند و به‌صورت موازی داده‌ها را پردازش می‌کنند.

کاربردهای آینده

  • آموزش مدل‌های زبانی بزرگتر : مانند GPT-5 یا مدل‌های اختصاصی برای شرکت‌ها.
  • هوش مصنوعی چند حوزه‌ای (Multimodal AI) : ترکیب تصویر، صدا و متن در یک مدل واحد.
  • تحلیل داده‌های زمان واقعی : در حوزه‌هایی مانند بازاریابی و بهداشت.

۴. چالش‌های فناوری و راهکارهای microsoft و NVIDIA

چالش ۱: مصرف انرژی بالا

ابررایانه‌های مدرن به دلیل توان پردازشی بالای خود، مصرف انرژی بسیاری دارند.

راهکار :

  • استفاده از GPU‌های بهینه‌سازی شده (مانند H100) با عملکرد بهتر در واحد انرژی.
  • بهبود سیستم‌های خنک‌کننده و استفاده از انرژی‌های تجدیدپذیر در مرکز داده‌ها.

چالش ۲: هزینه‌های بالای سخت‌افزار

خرید و نگهداری ابررایانه‌های اختصاصی برای بسیاری از سازمان‌ها گران است.

راهکار :

  • دسترسی ابری (Cloud Access) : مایکروسافت با ارائه‌ی زیرساخت‌های Azure، امکان استفاده از ابررایانه‌ها را به‌صورت پرداخت در هنگام استفاده (Pay-as-you-go) فراهم کرده است.

چالش ۳: نیاز به نرم‌افزارهای بهینه‌شده

برای استفاده کامل از قدرت GPU‌ها، نیاز به نرم‌افزارهایی است که بتوانند محاسبات موازی را مدیریت کنند.

راهکار :

  • توسعه‌ی فریم‌ورک‌هایی مانند RAPIDS (توسط NVIDIA) و ONNX Runtime (توسط Microsoft) برای بهینه‌سازی کار با GPU.
4. چالش‌های فناوری و راهکارهای Microsoft و NVIDIA

۵. رقابت با سایر شرکت‌ها در بازار ابررایانه‌های AI

مایکروسافت و NVIDIA در برابر شرکت‌هایی مانند AWS، Google Cloud و AMD قرار دارند که هر یک استراتژی‌های خود را در حوزه‌ی ابررایانه‌های هوش مصنوعی دنبال می‌کنند.

شرکت
فناوری کلیدی
مزایا
Microsoft + NVIDIA
GH200 Grace CPU + GPU H100 + Azure
قدرت پردازش بالا، زیرساخت ابری قوی
AWS
Trainium و Inferentia Chips
هزینه‌ی پایین‌تر برای بعضی کاربردها
Google
TPU v5
بهینه‌سازی برای مدل‌های Google AI
AMD
Instinct MI300A
رقابت در قیمت و عملکرد

۶. آینده‌ی همکاری مایکروسافت و NVIDIA

با توجه به روند فعلی، مایکروسافت و NVIDIA قصد دارند همکاری خود را در حوزه‌های زیر گسترش دهند:

  1. ایجاد ابررایانه‌های اختصاصی برای شرکت‌های بزرگ : مانند بانک‌ها، شرکت‌های داروسازی و سازمان‌های دولتی.
  2. بهینه‌سازی نرم‌افزارهای AI برای GH200 : توسعه‌ی کتابخانه‌ها و فریم‌ورک‌هایی که قابلیت استفاده از پتانسیل کامل GH200 را فراهم کنند.
  3. استفاده از ابررایانه‌ها در آموزش مدل‌های چند حوزه‌ای : ترکیب داده‌های متنی، تصویری و صوتی در یک مدل واحد.

معرفی محصول :

تابلو برق دانوب ۱۵۰*۳۵۰*۲۵۰ همرنگ

سوئیچ شبکه PoE سیسکو CBS350-24P-4G

ویس پنل Voice Panel 25 Port Rj45

جمع‌بندی

همکاری مایکروسافت و NVIDIA در زمینه‌ی ابررایانه‌های هوش مصنوعی نشان‌دهنده‌ی رویکرد استراتژیک این دو شرکت در تسلط به بازار AI است. با معرفی NVIDIA GH200 Grace CPU و توسعه‌ی زیرساخت‌های هوشمند در Azure، این دو شرکت قدرتمندترین ابررایانه‌های جهان را در اختیار کاربران قرار داده‌اند. این فناوری‌ها نه تنها به پیشرفت مدل‌های زبانی بزرگ کمک می‌کنند، بلکه در حوزه‌هایی مانند علم داده، شبیه‌سازی‌های فیزیکی و هوش مصنوعی تولیدی نیز نقش برجسته‌ای ایفا خواهند کرد. آینده‌ی هوش مصنوعی با ابررایانه‌هایی مانند GH200 و زیرساخت‌های Azure شکل خواهد گرفت.