فناوریهوش مصنوعی

NVIDIA DGX™ Spark ابررایانه‌ی شخصی هوش مصنوعی

NVIDIA DGX™ Spark ابررایانه‌ی شخصی هوش مصنوعی شما، امکان اجرای مدل‌های بزرگ و پیچیده را به‌صورت مستقیم روی دسکتاپ فراهم می‌کند و سرعت و مقیاس‌پذیری نزدیک به مراکز داده را ارائه می‌دهد. این سیستم با حافظه‌ی یکپارچه، پشتیبانی از ابزارهای استاندارد و قابلیت استنتاج مدل‌های بزرگ، محیطی پیشرفته و کارآمد برای توسعه و نوآوری در حوزه‌ی هوش مصنوعی ایجاد می‌کند.

ابررایانه‌ی شخصی هوش مصنوعی شما

افزایش اندازه و پیچیدگی مدل‌های مولد هوش مصنوعی، تلاش‌های توسعه روی سیستم‌های محلی را به چالش کشیده است. نمونه‌سازی، تنظیم و استنتاج مدل‌های بزرگ به‌صورت محلی به مقادیر زیادی حافظه و توان پردازشی قابل توجه نیاز دارد. با گسترش تلاش‌های توسعه‌ی هوش مصنوعی در سازمان‌ها، ارائه‌دهندگان نرم‌افزار، نهادهای دولتی، استارتاپ‌ها و پژوهشگران، نیاز به منابع پردازشی هوش مصنوعی همچنان رو به رشد است.

NVIDIA DGX™ Spark به دسته‌ی جدیدی از رایانه‌ها تعلق دارد که از پایه برای ساخت و اجرای هوش مصنوعی طراحی شده‌اند. این سیستم با قدرت‌بخشی تراشه‌ی فوق‌العاده‌ی NVIDIA GB10 Grace Blackwell، تا 1 پتاFLOP عملکرد را برای اجرای بارهای کاری هوش مصنوعی فراهم می‌کند. با 128 گیگابایت حافظه‌ی یکپارچه و همگن، توسعه‌دهندگان می‌توانند جدیدترین نسل مدل‌های استدلالی هوش مصنوعی را اجرا کنند. این مدل‌ها شامل DeepSeek، Meta، Google و دیگر نمونه‌ها هستند و تا سقف 200 میلیارد پارامتر پشتیبانی می‌شوند. علاوه بر این، شبکه‌سازی NVIDIA ConnectX™ دو رایانه‌ی هوش مصنوعی DGX Spark را به هم متصل می‌کند. این اتصال امکان استنتاج روی مدل‌هایی با حداکثر 405 میلیارد پارامتر را فراهم می‌سازد.

این مطلب پنج مزیت کمتر شناخته‌شده‌ی NVIDIA DGX Spark را بیان می‌کند که آن را فراتر از یک سیستم فشرده‌ی GPU قرار می‌دهد. هر ویژگی از مقیاس‌پذیری بلندمدت پشتیبانی می‌کند، اصطکاک توسعه‌ی اولیه را کاهش می‌دهد و ارزشی فنی فراتر از آنچه بیشتر ایستگاه‌های کاری ارائه می‌دهند فراهم می‌سازد.

پیشتر در سایت رصدخانه به معرفی ۸ محصول زیرساخت هوش مصنوعی انویدیا بر پایه معماری Blackwell پرداخته بودیم.

1. ‏NVIDIA DGX Spark بر پایه‌ی ابرتراشه‌ی NVIDIA GB10 ساخته شده است

سوپرچیپ NVIDIA GB10

یک پلتفرم کاربردی برای توسعه‌ی هوش مصنوعی

در قلب DGX Spark ابرتراشه‌ی جدید GB10 Grace Blackwell قرار دارد. این تراشه بر پایه‌ی معماری Grace Blackwell ساخته شده و برای فرم‌فکتور دسکتاپ بهینه‌سازی شده است. GB10 یک GPU قدرتمند Blackwell با هسته‌های Tensor نسل پنجم و پشتیبانی از FP4 دارد. این GPU تا 1 پتاFLOP توان پردازشی هوش مصنوعی ارائه می‌دهد. علاوه بر آن، GB10 شامل یک پردازنده‌ی مرکزی Grace با 20 هسته‌ی Arm است. این پردازنده پردازش پیش‌داده‌ها و هماهنگ‌سازی را شتاب می‌بخشد و سرعت تنظیم مدل و استنتاج بلادرنگ را افزایش می‌دهد. ابرتراشه‌ی GB10 از NVLink™-C2C استفاده می‌کند. این فناوری یک مدل حافظه‌ی همگن CPU+GPU با پنج برابر پهنای باند PCIe Gen 5 ارائه می‌دهد.

با 128 گیگابایت حافظه‌ی یکپارچه‌ی سیستمی و پشتیبانی از قالب داده‌ی FP4، DGX Spark توانایی پشتیبانی از مدل‌های هوش مصنوعی تا سقف 200 میلیارد پارامتر را دارد. این ویژگی به توسعه‌دهندگان امکان می‌دهد نسل جدید مدل‌های استدلالی هوش مصنوعی را اجرا کنند. به‌عنوان نمونه، نسخه‌های تقطیرشده‌ی DeepSeek R1 تا 70 میلیارد پارامتر را می‌توان روی دسکتاپ نمونه‌سازی، تنظیم دقیق و استنتاج کرد.

سازگار با ابزارهای متداول توسعه

NVIDIA DGX Spark از مجموعه‌ی گسترده‌ای از ابزارهای استاندارد پشتیبانی می‌کند. فریم‌ورک‌های اصلی مانند PyTorch و TensorFlow به‌طور کامل روی Arm اجرا می‌شوند و تنها به تغییرات اندک یا هیچ تغییری نیاز ندارند. ابزارهای علم داده مانند RAPIDS و Dask نیز به‌صورت بومی قابل استفاده هستند. این قابلیت به تیم‌ها اجازه می‌دهد پردازش داده، مهندسی ویژگی و خط لوله‌های ارزیابی را در محیط‌های آشنا آزمایش کنند.

همچنین توسعه‌دهندگان می‌توانند با ثبت‌نام به NVIDIA NGC دسترسی داشته باشند. این پلتفرم نرم‌افزارهای شتاب‌گرفته با GPU را همراه با کانتینرهای بهینه‌شده برای عملکرد بهتر ارائه می‌دهد. علاوه بر این، مدل‌های ازپیش‌آموزش‌دیده‌ی هوش مصنوعی و کیت‌های توسعه‌ی تخصصی برای صنایع مختلف نیز در دسترس قرار دارند.

۲. شما می‌توانید مدل‌های ۲۰۰ میلیارد پارامتری را به صورت محلی با کنترل کامل داده‌ها اجرا کنید.

پشتیبانی از استنتاج برای مدل‌ها تا سقف 200 میلیارد پارامتر

NVIDIA DGX Spark این توانایی را به توسعه‌دهندگان می‌دهد که استنتاج را روی برخی از بزرگ‌تر

ین مدل‌های هوش مصنوعی عمومی موجود با استفاده از سخت‌افزار محلی اجرا کنند. با 128 گیگابایت حافظه‌ی یکپارچه و همگن و پشتیبانی از FP4 همراه با پراکندگی (sparsity)، این سیستم می‌تواند مدل‌هایی تا سقف 200 میلیارد پارامتر را بارگذاری و اجرا کند. این شامل مدل‌هایی مانند LLaMA 2، DeepSeek-V2 و Mistral به‌همراه مدل‌های پایه‌ی داخلی ساخته‌شده برای کاربردهای اختصاصی می‌شود.

اجرای استنتاج به‌صورت محلی به تیم‌ها امکان می‌دهد عملکرد را ارزیابی کنند، تأخیر را بسنجند و رفتار پرامپت را بدون نیاز به تخصیص نمونه‌های GPU خارجی آزمایش کنند. همچنین فضایی برای آزمایش‌های عمیق‌تر فراهم می‌سازد، مانند مقایسه‌ی راهبردهای کوانتیزاسیون یا مشاهده‌ی تغییرات خروجی در میان وزن‌های تنظیم‌شده‌ی مختلف.

توسعه‌ی امن با نگه‌داری داده‌ها در محل

برای بسیاری از سازمان‌ها، ارسال داده‌ها به فضای ابری ریسک به همراه دارد یا برخلاف سیاست‌های داخلی است. NVIDIA DGX Spark این امکان را فراهم می‌کند که مجموعه‌داده‌های حساس در یک محیط محلی و امن نگه داشته شوند، در حالی‌که همچنان می‌توان مدل‌های پرظرفیت را آزمایش و تنظیم کرد. توسعه‌دهندگان می‌توانند در هنگام اعتبارسنجی مدل با داده‌های تولیدی کار کنند، نتایج را مستقیماً در سیستم‌های محلی ثبت نمایند و خروجی‌ها را بدون انتقال دارایی‌ها به پلتفرم‌های شخص ثالث ممیزی کنند.

این رویکرد به‌ویژه برای تیم‌هایی در صنایع دارای الزامات انطباق یا فرایندهای بازبینی داخلی، مانند مراقبت‌های بهداشتی، دولت، مالی یا دفاع اهمیت دارد. NVIDIA DGX Spark از یک چرخه‌ی کامل توسعه پشتیبانی می‌کند که در آن همه‌ی داده‌ها تحت کنترل شما باقی می‌مانند.

مهاجرت آسان به زیرساخت شتاب‌یافته‌ی هوش مصنوعی

استفاده از معماری نرم‌افزاری پلتفرم NVIDIA AI این امکان را فراهم می‌سازد که کاربران DGX Spark مدل‌های خود را بدون تغییرات کدنویسی قابل توجه، به‌طور یکپارچه از دسکتاپ به DGX Cloud یا هر زیرساخت ابری یا مرکز داده‌ی شتاب‌یافته منتقل کنند و نمونه‌سازی، تنظیم دقیق و تکرار را آسان‌تر از همیشه انجام دهند. AMAX این فرایند را با برنامه‌ریزی استقرار، خدمات یکپارچه‌سازی و پشتیبانی اعتبارسنجی پشتیبانی می‌کند تا به مشتریان کمک کند در صورت آمادگی از توسعه‌ی اولیه به استقرار کامل در محل (on-prem) منتقل شوند.

پشته‌ی نرم‌افزاری NVIDIA AI به‌صورت بومی روی NVIDIA DGX Spark اجرا می‌شود

بارگذاری‌شده با ابزارهای توسعه‌ی هوش مصنوعی

NVIDIA DGX Spark شامل اجزای کلیدی پشته‌ی نرم‌افزاری NVIDIA AI است و یک محیط آماده‌ی استفاده برای توسعه‌ی هوش مصنوعی از ابتدا فراهم می‌کند. این سیستم از NVIDIA DGX OS، یک سیستم‌عامل مبتنی بر لینوکس بهینه‌شده برای بارهای کاری GPU، همراه با محیط‌های اجرای کانتینر، درایورها و کتابخانه‌های رایج در جریان‌های کاری یادگیری عمیق و علم داده پشتیبانی می‌کند. این امکان را به توسعه‌دهندگان می‌دهد تا بدون پیکربندی گسترده، کانتینرها را اجرا کرده و کارها را آغاز کنند.

نرم‌افزار پیش‌نصب‌شده به توسعه‌دهندگان کمک می‌کند تا پروژه‌ها را سریعاً راه‌اندازی کنند. محیط نرم‌افزاری توسط NVIDIA نگهداری و به‌طور منظم به‌روزرسانی می‌شود که به کاهش اصطکاک در هنگام راه‌اندازی و توسعه‌ی بلندمدت کمک می‌کند.

کانتینرهای بهینه‌سازی‌شده و مدل‌های ازپیش‌آموزش‌دیده از NGC

NVIDIA DGX Spark دسترسی به فهرست NVIDIA NGC را فراهم می‌کند، جایی که توسعه‌دهندگان می‌توانند کانتینرهای بهی

نه‌شده برای فریم‌ورک‌هایی مانند PyTorch، TensorFlow و JAX را دریافت کنند. این سیستم همچنین شامل مدل‌های ازپیش‌آموزش‌دیده و نمونه‌های خط لوله است که برای سخت‌افزار NVIDIA بهینه‌سازی شده‌اند. این منابع به تیم‌ها کمک می‌کنند سریع‌تر پیش بروند و نقاط شروع تأییدشده‌ای برای مدل‌های زبان بزرگ (LLM)، مدل‌های بینایی، سیستم‌های پیشنهاددهنده و سایر بارهای کاری رایج ارائه می‌دهند.

از آنجا که این دارایی‌ها با زیرساخت‌های مقیاس تولید همسو هستند، توسعه‌دهندگان می‌توانند مدل‌ها را روی DGX Spark آزمایش و اصلاح کنند با اطمینان از اینکه همان کد می‌تواند در صورت نیاز به زیرساخت پردازشی بزرگ‌تر منتقل شود.

پشتیبانی از میکروسرویس‌ها و ابزارهای جریان کاری

NVIDIA DGX Spark از جریان‌های کاری مدرن توسعه‌ی هوش مصنوعی پشتیبانی می‌کند، از جمله استقرار میکروسرویس‌ها و ارائه‌ی مدل‌ها از طریق NVIDIA Inference Microservices (NIM).

ابزارهایی مانند NVIDIA AI Workbench و Blueprints نیز پشتیبانی می‌شوند و به استانداردسازی آزمایش‌ها و بهبود قابلیت تکرار کمک می‌کنند. برای تیم‌هایی که ابزارها یا خط لوله‌های داخلی خود را با استفاده از ارکستراسیون کانتینر می‌سازند، NVIDIA DGX Spark یک پلتفرم یکپارچه و مستند ارائه می‌دهد تا این بارهای کاری را پیش از استقرارهای بزرگ‌تر توسعه و آزمایش کنند.

۴. دو واحد NVIDIA DGX Spark می‌توانند برای پشتیبانی از مدل‌های ۴۰۵میلیارد پارامتری به صورت خوشه‌ای (کلاستر) در کنار هم قرار گیرند.

دو کارت گرافیک NVIDIA DGX Spark که از طریق ConnectX 7 SmartNIC به هم متصل شده‌اند

مقیاس‌بندی فشرده برای اندازه‌های مدل پرتقاضا

NVIDIA DGX Spark می‌تواند به‌طور مستقیم با واحد دوم از طریق ConnectX-7 SmartNIC داخلی متصل شود و به توسعه‌دهندگان امکان می‌دهد اندازه مدل و ظرفیت حافظه را فراتر از آنچه یک سیستم واحد می‌تواند مدیریت کند، افزایش دهند. در این پیکربندی دو‌نودی، NVIDIA DGX Spark از اجرای مدل‌هایی با حداکثر 405 میلیارد پارامتر با استفاده از FP4 همراه با پراکندگی (sparsity) پشتیبانی می‌کند. این قابلیت برای تیم‌هایی که با مدل‌های پیشرفته‌ی LLM یا مدل‌های ترکیبی از متخصصان کار می‌کنند، ارزشمند است، جایی که اندازه مدل می‌تواند بر کیفیت خروجی، عمق استدلال و کنترل سطح توکن تأثیر بگذارد.

اجرای استنتاج در این مقیاس به توسعه‌دهندگان اجازه می‌دهد عملکرد، دقت و تأخیر را در میان تعداد بالای پارامترها بدون تکیه بر زیرساخت خارجی بررسی کنند. همچنین محیط واقعی‌تری برای ارزیابی تصمیمات معماری مدل، رفتار پنجره توکن و ملاحظات حافظه فراهم می‌کند. برای تیم‌هایی که قصد دارند به استقرارهای توزیع‌شده‌ی بزرگ‌تر منتقل شوند، خوشه‌بندی دو سیستم NVIDIA DGX Spark یک نقطه شروع عملی برای ارزیابی ویژگی‌های عملکرد مرتبط با مقیاس در جریان کاری توسعه‌ی محلی ارائه می‌دهد.

۵. انویدیا DGX Spark از توسعه‌هایی که در مقیاس‌های بزرگتر قابل اجرا هستند، پشتیبانی می‌کند.

خانواده NVIDIA DGX

طراحی شده برای همسویی با زیرساخت هوش مصنوعی NVIDIA DGX

NVIDIA DGX Spark روی ابرتراشه‌ی Grace Blackwell GB10 اجرا می‌شود، نسخه‌ای با مقیاس دسکتاپ از فناوری Grace Blackwell که در مراکز داده استفاده می‌شود. این ویژگی توسعه‌ی بارهای کاری کانتینری، خطوط آموزش و خدمات استنتاج را برای تیم‌ها آسان‌تر می‌کند تا بعداً به سیستم‌های بزرگ‌تر مقیاس‌بندی شوند. توسعه‌دهندگان می‌توانند در یک محیط یکسان کار کنند بدون آنکه نیاز به بازطراحی اجزای اصلی هنگام افزایش نیازهای استقرار داشته باشند.

برای ارائه تجربه‌ای آشنا به توسعه‌دهندگان، DGX Spark همان معماری نرم‌افزاری را بازتاب می‌دهد که کارخانه‌های صنعتی هوش مصنوعی را قدرت می‌بخشد. با استفاده از NVIDIA DGX OS مبتنی بر Ubuntu Linux، توسعه‌دهندگان می‌توانند به‌طور یکپارچه به DGX Cloud یا هر زیرساخت شتاب‌یافته‌ی مرکز داده یا ابری استقرار دهند.

مقیاس‌پذیری با پشتیبانی AMAX

برای سازمان‌هایی که قصد دارند از نمونه‌سازی محلی به زیرساخت هوش مصنوعی در مقیاس بزرگ‌تر منتقل شوند، AMAX پشتیبانی تخصصی در زمینه‌ی برنامه‌ریزی، استقرار و اعتبارسنجی سیستم ارائه می‌دهد. این شامل راهنمایی در مورد استقرارهای Rack-scale NVIDIA DGX BasePOD و ساخت سیستم‌های خنک‌شونده با مایع سفارشی است. AMAX کمک می‌کند تا تیم‌ها با اطمینان از توسعه‌ی کوچک‌مقیاس به سمت راه‌حل‌های آماده‌ی تولید پیش بروند.

طراحی شده برای مقیاس‌پذیری همراه با شما

NVIDIA DGX Spark یک راهکار عملی برای آوردن توسعه‌ی مدل‌های بزرگ به داخل سازمان ارائه می‌دهد و منابع محاسباتی مرکز داده و ابری را تقویت می‌کند. با پشتیبانی از معماری‌های مبتنی بر Arm، استنتاج مدل‌های با بیش از 200 میلیارد پارامتر و پشته‌ی کامل نرم‌افزاری NVIDIA AI، این سیستم مسیر روشنی از نمونه‌سازی تا تولید فراهم می‌کند.

امتیاز کاربران: 5 ( 1 رای)

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا