فناوری‌های نوظهورمواد پیشرفتههوش مصنوعی

ده تولیدکننده برتر GPU در چین

صنعت نیمه‌هادی چین طی سال‌های اخیر رشد چشمگیری داشته، به‌ویژه در حوزه پردازش‌های گرافیکی و هوش مصنوعی. در این مقاله به معرفی ده تولیدکننده اصلی GPU در چین می‌پردازیم که هر یک با تاریخچه، محصولات شاخص و دستاوردهای نوین خود سهم مهمی در خودکفایی فناوری این کشور ایفا کرده‌اند. بررسی مسیر و دستاوردهای این شرکت‌ها، تصویری روشن از رقابت و نوآوری در بازار GPU چین ارائه می‌دهد.

شرکت‌هایی مانند CSIC، Jingjia Micro و Zhaoxin Semiconductor در خط مقدم بخش تولید GPU چین قرار دارند. این شرکت‌ها نه‌تنها بر برآورده کردن تقاضای داخلی تمرکز دارند، بلکه در حال گسترش دامنه فعالیت خود به بازارهای بین‌المللی نیز هستند و سلطه رقبای غربی را به چالش می‌کشند. علاوه بر این، همکاری با ابتکارات دولتی چین و سرمایه‌گذاری در فناوری‌های پیشرفته نیمه‌هادی، تأکیدکننده‌ی تلاش راهبردی چین برای دستیابی به خودکفایی در صنعت نیمه‌هادی، از جمله GPUها است.

با تداوم سرمایه‌گذاری گسترده چین در فناوری و نوآوری، تولیدکنندگان GPU این کشور آماده‌اند تا نقشی هرچه تأثیرگذارتر در شکل‌دهی آینده صنایع جهانی الکترونیک و محاسبات ایفا کنند.

1- Jingjia Micro (景嘉微)

سال تأسیس 2006
دفتر مرکزی Changsha, Hunan
وبسایت www.jingjiamicro.com

Jingjia

شرکت Jingjia Micro در سال ۲۰۰۶ در شهر چانگشا، استان هونان تأسیس شد. این شرکت فعالیت خود را با تمرکز بر طراحی پردازنده‌های گرافیکی برای کاربردهای نظامی آغاز کرد. دولت چین تأسیس این شرکت را حمایت کرد، زیرا کشور به دنبال کاهش وابستگی به GPUهای خارجی در صنایع حساس بود. در سال‌های نخست، Jingjia محصولات اولیه‌ای تولید کرد که بیشتر برای نمایشگرهای نظامی و شبیه‌سازی در سیستم‌های دفاعی استفاده شدند. این محصولات قدرت محدودی داشتند اما نیاز حیاتی کشور را تأمین کردند.

با گذشت زمان، مهندسان شرکت سطح دانش طراحی نیمه‌هادی را افزایش دادند. در نتیجه Jingjia توانست نسل‌های جدید پردازنده‌ها را توسعه دهد. تراشه‌های جدید قابلیت پردازش موازی بهتری داشتند و به‌طور گسترده‌تر در صنایع مختلف چین استفاده شدند. این پیشرفت‌ها باعث شد شرکت از یک تولیدکننده محدود به بازیگری مهم در زنجیره نیمه‌هادی چین تبدیل شود.

از محصولات شاخص این شرکت می‌توان به JM5400 و JM7200 اشاره کرد. JM5400 یکی از نخستین تلاش‌ها برای ساخت GPU عمومی در چین بود. این تراشه عملکردی نزدیک به برخی محصولات انویدیا ارائه داد و در کاربردهای صنعتی استفاده شد. JM7200 توان بالاتری در پردازش گرافیک داشت و قابلیت‌های بیشتری برای اجرای نرم‌افزارهای مدرن فراهم می‌کرد. این تراشه‌ها نه تنها نیاز بازار داخلی را تأمین کردند، بلکه نشان دادند چین می‌تواند در طراحی GPU مستقل موفق شود.

محصولات شاخص Jingjia

در جدول زیر محصولات شاخص این شرکت و ویژگی‌های آن آمده است.

مدل GPU سال عرضه فرآیند تولید توان پردازشی (TFLOPS) عملکرد هدف (قابل مقایسه با) مصرف توان (TDP)
JM5400 2014 65 نانومتر نامشخص جایگزینی GPUهای خارجی در کاربردهای نظامی نامشخص
JM7200 2018 28 نانومتر نامشخص GeForce GT 640 کمتر از 10 وات
JM7201 2019 28 نانومتر نامشخص کاربردهای پایه تجاری و چندصفحه‌ای 15 وات
JM9230 2021 28 نانومتر ~1.2 (تخمینی) کاربردهای ایستگاه کاری و چندصفحه‌ای 30 وات
JM9231 2021 28 نانومتر 2 GeForce GTX 1050 150 وات
JM9271 2021 28 نانومتر 8 GeForce GTX 1080 200 وات

تمرکز و جایگاه فعلی

Jingjia امروز روی توسعه پردازنده‌های گرافیکی پرقدرت برای بازار عمومی و نظامی تمرکز می‌کند. این شرکت نسل‌های جدید GPU را طراحی می‌کند تا عملکرد بالاتری نسبت به رقبا ارائه دهند. تمرکز اصلی مهندسان، بهبود بهره‌وری انرژی، افزایش کارایی موازی و گسترش پشتیبانی نرم‌افزاری است. Jingjia با وجود چالش‌های زنجیره تأمین جهانی، سرمایه‌گذاری در تحقیق و توسعه را افزایش داده است.

در حال حاضر این شرکت به عنوان یکی از امیدهای اصلی چین برای رقابت با شرکت‌های بین‌المللی مانند انویدیا شناخته می‌شود. تراشه‌های جدید Jingjia نه تنها در بازار داخلی بلکه در پروژه‌های ملی راهبردی مورد استفاده قرار می‌گیرند. این روند نشان می‌دهد که چین می‌تواند در آینده نزدیک به سطح جهانی در تولید GPU نزدیک شود.

2- Moore Threads (摩尔线程)

سال تأسیس 2020
دفتر مرکزی Beijing, China
وبسایت www.mthreads.com

شرکت Moore Threads در سال ۲۰۲۰ توسط جِنگ جینگون، یکی از مدیران سابق انویدیا در چین، تأسیس شد. هدف اولیه این شرکت توسعه پردازنده‌های گرافیکی بومی بود تا نیاز روزافزون چین در زمینه گیمینگ، رایانش ابری و هوش مصنوعی را برطرف کند. سرمایه‌گذاری‌های کلان و حمایت دولت مرکزی باعث شدند Moore Threads به سرعت به یکی از مهم‌ترین استارتاپ‌های نیمه‌هادی چین تبدیل شود.

Moore Threads در مدت کوتاه فعالیت خود چند محصول مهم عرضه کرده است. از جمله می‌توان به MTT S60 و MTT S2000 اشاره کرد. شرکت، تراشه MTT S60 را بیشتر برای کارت‌های گرافیک مصرفی طراحی کرد و در اجرای بازی‌ها و پردازش‌های گرافیکی روزمره عملکرد مناسبی داشت. در مقابل، شرکت، MTT S2000 را برای مراکز داده و کاربردهای هوش مصنوعی طراحی کرد و قدرت پردازشی بالاتری ارائه داد. این تراشه‌ها نشان دادند چین می‌تواند در حوزه GPU رقابتی حضور داشته باشد.

شرکت علاوه بر سخت‌افزار، تمرکز ویژه‌ای روی توسعه زیست‌بوم نرم‌افزاری گذاشته است. Moore Threads بستر نرم‌افزاری خود را طراحی کرد تا پشتیبانی از موتورهای گرافیکی و چارچوب‌های یادگیری عمیق فراهم کند. این اقدام به توسعه‌دهندگان امکان می‌دهد از GPUهای بومی به‌طور مؤثر استفاده کنند. چنین رویکردی اهمیت زیادی دارد، زیرا موفقیت GPU تنها به سخت‌افزار وابسته نیست و نیاز به هماهنگی نرم‌افزاری گسترده دارد.

دستاورد اخیر در هوش مصنوعی

Moore Threads در سال ۲۰۲۳ نسل جدید GPUهای MTT S3000 را معرفی کرد. این تراشه با معماری ارتقایافته توانست عملکردی نزدیک به کارت‌های رده‌بالای جهانی ارائه دهد. ویژگی برجسته S3000 قابلیت پردازش بهینه مدل‌های زبانی بزرگ و شبکه‌های عصبی عمیق است. این GPU در آزمایش‌های داخلی توانست سرعت آموزش LLMها را افزایش دهد و هم‌زمان مصرف انرژی کمتری داشته باشد. این دستاورد اخیر نشان می‌دهد Moore Threads با وجود عمر کوتاه، جایگاهی کلیدی در مسیر استقلال فناوری چین یافته است.

محصولات شاخص Moore Threads

جدول زیر محصولات شاخص Moore Threads به همراه ویژگی‌های هر یک را بیان می‌کند.

مدل GPU سال عرضه فرآیند تولید توان پردازشی (TFLOPS) عملکرد هدف (قابل مقایسه با) مصرف توان (TDP)
MTT S60 2022 12 نانومتر 6 (FP32) GeForce GTX 1070 نامشخص
MTT S80 2022 12 نانومتر 14.4 (FP32) GeForce GTX 1650 Super 255 وات
MTT S2000 2022 12 نانومتر 12 (FP32) Tesla T4 150 وات
MTT S3000 2023 12 نانومتر 15.2 (FP32) Tesla V100 250 وات
MTT S4000 2023 12 نانومتر 25 (FP32) Tesla A100 (نسخه پایین‌تر) 450 وات

3- Biren Technology (壁仞科技)

سال تأسیس 2019
دفتر مرکزی Shanghai, China
وبسایت https://www.birentech.com/

Biren Technology در سال ۲۰۱۹ در شانگهای تأسیس شد و از همان ابتدا توانست سرمایه‌گذاری‌های قابل‌توجهی جذب کند. بنیان‌گذاران این شرکت از میان متخصصانی آمده‌اند که پیش‌تر در شرکت‌های بزرگی همچون انویدیا، علی‌بابا و های‌سیلیکون تجربه داشتند. همین ترکیب تیم مدیریتی باعث شد تا Biren با سرعتی غیرمعمول به‌عنوان یکی از نوآورترین طراحان تراشه‌های گرافیکی در چین مطرح شود. هدف اصلی این شرکت طراحی پردازنده‌های گرافیکی قدرتمند برای دیتاسنترها و کاربردهای هوش مصنوعی بود، جایی که چین بیشترین نیاز و وابستگی خارجی را داشت.

در سال‌های ابتدایی فعالیت، Biren بر توسعه معماری اختصاصی خود متمرکز شد که بتواند از نظر توان پردازشی و بهره‌وری انرژی با بهترین نمونه‌های جهانی رقابت کند. نتیجه این تلاش‌ها معرفی نخستین پردازنده‌های نسل BR شد. این تراشه‌ها به طور ویژه برای آموزش مدل‌های بزرگ هوش مصنوعی و پردازش داده‌های حجیم طراحی شدند و از لحاظ نظری می‌توانستند با برخی از محصولات پرچم‌دار انویدیا رقابت داشته باشند. این رویکرد جاه‌طلبانه سبب شد Biren به سرعت مورد توجه رسانه‌ها و محققان قرار گیرد.

تمرکز و جایگاه فعلی

محصول شاخص این شرکت، Biren BR100، یکی از قدرتمندترین GPUهای بومی چین به شمار می‌رود. این تراشه با معماری پیشرفته و لیتوگرافی ۷ نانومتری TSMC ساخته و از ویژگی‌هایی چون حافظه با پهنای باند بسیار بالا و مقیاس‌پذیری در سیستم‌های چندتراشه‌ای آن را متمایز می کند. بر اساس اطلاعات منتشرشده، BR100 می‌توانست به سطح ترافلاپ‌های رقابتی با GPUهای کلاس A100 انویدیا برسد. پس از آن، نسخه کوچک‌تر و کم‌مصرف‌تر با نام BR104 نیز معرفی شد که برای کاربردهای گسترده‌تر از جمله استنتاج هوش مصنوعی طراحی گردید.

یکی از ویژگی‌های متمایز Biren، تلاش برای ایجاد یک اکوسیستم نرم‌افزاری کامل است. این شرکت می‌داند که بدون ابزارهای توسعه نرم‌افزار و چارچوب‌های پشتیبان، حتی قدرتمندترین سخت‌افزارها نیز نمی‌توانند سهم بازار بزرگی کسب کنند. به همین دلیل، Biren مجموعه‌ای از کتابخانه‌ها و ابزارهای توسعه برای برنامه‌نویسان و محققان هوش مصنوعی عرضه کرده است. این اقدام باعث گردیده تا تراشه‌های Biren به تدریج در مراکز تحقیقاتی و دانشگاه‌ها مورد استفاده قرار گیرند.

به‌روزترین دستاورد Biren Technology معرفی نسخه بهبود یافته BR100 با قابلیت‌های ویژه برای آموزش مدل‌های زبانی بزرگ (LLM) است. این تراشه‌ها از بهینه‌سازی حافظه و ارتباطات بین‌تراشه‌ای بهره می‌برند تا بتوانند مدل‌هایی با صدها میلیارد پارامتر را با سرعت بالاتر آموزش دهند. گزارش‌ها نشان می‌دهد که این GPUها در برخی آزمایش‌های داخلی موفق شده‌اند عملکردی نزدیک به انویدیا H100 از خود نشان دهند، هرچند در دسترس‌پذیری جهانی هنوز محدودیت دارند. همین پیشرفت‌ها باعث گردیده Biren به عنوان یکی از پیشگامان واقعی چین در رقابت هوش مصنوعی جهانی شناخته شود.

محصولات شاخص Biren Technology

جدول زیر محصولات شاخص Biren Technology به همراه ویژگی‌های هر یک را بیان می‌کند.

GPU سال عرضه فرآیند تولید توان پردازشی (TFLOPS) عملکرد هدف (قابل مقایسه با) مصرف توان (TDP)
BR100 2022 7 نانومتر 1,024 (BF16) NVIDIA A100 300 وات (BR104)
BR104 2022 7 نانومتر 128 (FP32) NVIDIA A100 (نسخه پایین‌تر) 300 وات
Biren 106 2025 نامشخص نامشخص پشتیبانی از مدل‌های AI نامشخص

4-Cambricon Technologies (寒武纪科技)

سال تأسیس 2016
دفتر مرکزی Beijing, China
وبسایت https://www.cambricon.com/

شرکت Cambricon در سال ۲۰۱۶ در پکن تأسیس شد. بنیان‌گذاران آن گروهی از محققان آکادمی علوم چین بودند که سابقه طولانی در طراحی تراشه داشتند. هدف اولیه Cambricon توسعه پردازنده‌های هوش مصنوعی بومی بود. این شرکت تلاش کرد جایگاه چین را در رقابت جهانی تثبیت کند و از همان ابتدا سرمایه‌گذاری‌های کلانی جذب کرد.

Cambricon محصولات متنوعی را به بازار عرضه کرد. یکی از سری‌های شناخته‌شده، MLU است که شامل تراشه‌هایی برای لبه، سرورها و دیتاسنترها می‌شود. سری MLU100 و MLU200 توانستند عملکردی قوی در استنتاج مدل‌های یادگیری عمیق ارائه دهند. سپس MLU270 و MLU370 معرفی شدند که قدرت پردازشی بالاتری داشتند و مقیاس‌پذیری بهتری برای پروژه‌های بزرگ فراهم کردند. این نسل‌ها نشان دادند Cambricon می‌تواند به‌طور مستقیم با تراشه‌های جهانی رقابت کند.

علاوه بر سخت‌افزار، Cambricon اکوسیستم نرم‌افزاری اختصاصی خود را توسعه داد. این شرکت چارچوب Cambricon NeuWare را معرفی کرد که امکان آموزش و استنتاج بهینه روی تراشه‌های MLU را فراهم می‌کرد. NeuWare همچنین توسعه‌دهندگان را قادر ساخت مدل‌های خود را روی GPUهای Cambricon اجرا کنند. ترکیب سخت‌افزار و نرم‌افزار هماهنگ باعث شد شرکت جایگاه خود را در صنایع متنوع تقویت کند.

دستاورد اخیر در هوش مصنوعی

Cambricon در سال ۲۰۲۳ تراشه MLU370-X8 را عرضه کرد. این تراشه با معماری ارتقایافته توانست سرعت آموزش مدل‌های زبانی بزرگ را چند برابر کند. عملکرد MLU370-X8 در آزمایش‌های داخلی نزدیک به GPUهای پرچم‌دار جهانی بود. علاوه بر این، تراشه مصرف انرژی بهینه‌ای داشت و برای دیتاسنترهای چین جذاب شد. دستاورد اخیر Cambricon نشان داد چین می‌تواند در حوزه تراشه‌های هوش مصنوعی مسیر مستقل خود را دنبال کند.

محصولات شاخص Cambricon Technology

جدول زیر محصولات شاخص Cambricon Technology به همراه ویژگی‌های هر یک را بیان می‌کند.

مدل پردازنده سال عرضه فرآیند تولید توان پردازشی (TOPS) عملکرد هدف (قابل مقایسه با) مصرف توان (TDP)
MLU270 2019 16nm/12nm 128 (INT8), 64 (INT16) پایه‌ای برای محاسبات ابری 75 وات
MLU370 2021 7nm 256 (INT8) ارتقاء یافته برای آموزش و استنتاج 150 وات
MLU590 2023 7nm 1,024 (FP16) NVIDIA A100 300 وات

5-MetaX (迈克斯科技)

سال تأسیس 2020
دفتر مرکزی Shanghai, China
وبسایت www.metax-tech.com

MetaX یکی از شرکت‌های نوظهور در صنعت نیمه‌هادی چین که طی سال‌های اخیر با تمرکز ویژه بر پردازنده‌های گرافیکی عمومی (GPGPU) و شتاب‌دهنده‌های هوش مصنوعی توانسته جایگاه مهمی در بازار داخلی پیدا کند. این شرکت در اوایل دهه ۲۰۲۰ تأسیس شد و با ترکیب تیمی متشکل از متخصصان حوزه GPU و محققان هوش مصنوعی مسیر خود را آغاز کرد. هدف MetaX از ابتدا، توسعه پردازنده‌هایی بود که علاوه بر کاربردهای گرافیکی سنتی، بتوانند به نیازهای پرشتاب حوزه یادگیری عمیق و رایانش ابری نیز پاسخ دهند.

در مسیر توسعه محصولات، MetaX سری MXN، MXC و MXG را معرفی کرد که هر یک برای طیف خاصی از نیازهای محاسباتی طراحی شده‌اند. برای مثال، سری MXN برای کاربردهای مصرفی و پردازش‌های گرافیکی عمومی، سری MXC برای پردازش‌های ابری و مقیاس بزرگ، و سری MXG به طور خاص برای محاسبات سنگین هوش مصنوعی و مدل‌های یادگیری عمیق توسعه یافت. این تقسیم‌بندی محصولی باعث شد MetaX بتواند بخش‌های مختلف بازار، از دستگاه‌های شخصی تا دیتاسنترها، را پوشش دهد. این تنوع در محصولات، انعطاف‌پذیری و تطبیق‌پذیری بالایی را به اکوسیستم این شرکت بخشید.

یکی از نقاط قوت MetaX در کنار سخت‌افزار، سرمایه‌گذاری جدی در زمینه نرم‌افزار و پلتفرم‌های توسعه است. این شرکت تلاش کرده است تا برای تراشه‌های خود، مجموعه‌ای از ابزارهای برنامه‌نویسی و پشتیبانی از چارچوب‌های پرکاربرد یادگیری عمیق مانند TensorFlow و PyTorch فراهم کند. این استراتژی باعث گردیده محققان و توسعه‌دهندگان بتوانند به‌سرعت محصولات MetaX را در پروژه‌های خود به کار گیرند. علاوه بر این، همکاری‌های گسترده با دانشگاه‌ها و مراکز تحقیقاتی در چین موجب شده MetaX جایگاه خود را در اکوسیستم علمی و صنعتی تثبیت کند.

تمرکز و جایگاه فعلی

شرکت MetaX به‌تازگی با معرفی شتاب‌دهنده‌ای جدید در سری MXG، به‌روزترین دستاورد خود در حوزه هوش مصنوعی را ارائه کرد. مهندسان MetaX این شتاب‌دهنده را به‌طور ویژه برای آموزش مدل‌های زبانی بزرگ (LLM) طراحی کرده‌اند. آنان با بهره‌گیری از معماری جدید، پهنای باند حافظه را به میزان قابل‌توجهی افزایش و مقیاس‌پذیری چندتراشه‌ای را ساده‌تر کرده‌اند.

گزارش‌ها تأیید می‌کنند که تراشه جدید MetaX در برخی تست‌ها به سطح رقابتی با کارت‌های سری A100 انویدیا نزدیک گردیده است. این تراشه در زمینه استنتاج متون بلند و پردازش همزمان صدها میلیارد پارامتر، عملکرد قابل توجهی ارائه می‌دهد. این پیشرفت، MetaX را به عنوان یکی از امیدهای جدی چین در مسیر استقلال فناوری هوش مصنوعی معرفی کرده است.

محصولات شاخص MetaX

جدول زیر محصولات شاخص MetaX به همراه ویژگی‌های هر یک را بیان می‌کند.

مدل GPU سال عرضه فرآیند تولید توان پردازشی (TOPS/TFLOPS) عملکرد هدف (قابل مقایسه با) مصرف توان (TDP) کاربردهای اصلی
MXN100 2024 نامشخص 160 TOPS (INT8), 80 TFLOPS (FP16) NVIDIA A100 (نسخه پایین‌تر) نامشخص هوش مصنوعی (استنتاج)
MXC500 2024 نامشخص 15 TFLOPS (FP32) NVIDIA A100 نامشخص هوش مصنوعی (آموزش)
(نامشخص) 2025 نامشخص نامشخص کارت گرافیک گیمینگ نامشخص گیمینگ و رندرینگر

6-Huawei (HiSilicon Ascend)

سال تأسیس 2004
دفتر مرکزی Shenzhen, Guangdong, China
وبسایت https://www.hisilicon.com/cn

Huawei یکی از غول‌های فناوری چین است که از اواخر دهه ۱۹۸۰ کار خود را در حوزه تجهیزات مخابراتی آغاز کرد و به‌تدریج به یک بازیگر بین‌المللی در حوزه‌های مختلف فناوری تبدیل شد. یکی از زیرمجموعه‌های کلیدی این شرکت، HiSilicon است که در سال ۲۰۰۴ تأسیس شد و در ابتدا برای طراحی تراشه‌های ارتباطی و پردازنده‌های موبایلی (Kirin) شناخته می‌شد. با رشد نیاز به محاسبات پیشرفته و محدودیت‌های صادراتی آمریکا، HiSilicon مأموریت یافت تا به توسعه پردازنده‌های گرافیکی و شتاب‌دهنده‌های هوش مصنوعی ورود کند. این تصمیم، آغازگر شکل‌گیری خانواده تراشه‌های Ascend بود که امروز یکی از ستون‌های راهبرد چین در خودکفایی فناوری محسوب می‌شوند.

اولین نسل از تراشه‌های Ascend در سال ۲۰۱۸ معرفی شد که شامل مدل‌هایی همچون Ascend 310 برای دستگاه‌های لبه‌ای و Ascend 910 برای دیتاسنتر بود. Ascend 910 در زمان عرضه، یکی از قدرتمندترین شتاب‌دهنده‌های هوش مصنوعی جهان به شمار می‌رفت و توانست توجه زیادی را به سمت Huawei جلب کند. این تراشه با توان محاسباتی FP16 در حد صدها ترافلاپس، نقطه عطفی در ورود چین به دنیای پردازنده‌های هوش مصنوعی بود. در ادامه، نسخه‌های جدیدتری همچون Ascend 910C و Ascend 910D معرفی شدند که بهبودهایی در زمینه کارایی انرژی و پشتیبانی از چارچوب‌های نرم‌افزاری داشتند.

هواوی علاوه بر توسعه سخت‌افزار، سرمایه‌گذاری عظیمی نیز روی اکوسیستم نرم‌افزاری انجام داد. این شرکت، پلتفرم MindSpore را به‌عنوان چارچوب یادگیری عمیق اختصاصی خود طراحی کرد تا هماهنگی کاملی با معماری Ascend ایجاد کند. MindSpore علاوه بر پشتیبانی از مدل‌های مرسوم، قابلیت‌های ویژه‌ای نیز برای آموزش توزیع‌شده و مقیاس‌پذیری در دیتاسنترها ارائه می‌دهد. این ترکیب سخت‌افزار و نرم‌افزار به هواوی امکان داد تا به‌طور کامل زنجیره محاسبات هوش مصنوعی را از تراشه تا ابزارهای توسعه تحت کنترل خود درآورد.

جایگاه فعلی در بازار جهانی

شرکت هواوی با وجود تحریم‌های آمریکا، حضور خود را در بازار داخلی چین به‌طور قابل‌توجهی تقویت کرده است. گزارش‌ها نشان می‌دهند که بسیاری از پروژه‌های ملی، مراکز تحقیقاتی و صنایع کلیدی اکنون از تراشه‌های Ascend استفاده می‌کنند. علاوه بر این، هواوی به‌دنبال صادرات فناوری به کشورهای هم‌پیمان چین است، اگرچه محدودیت‌های زنجیره تأمین جهانی هنوز مانعی بزرگ به شمار می‌رود.

ترکیب قدرت سخت‌افزاری و نرم‌افزاری هواوی باعث شده است که این شرکت یکی از معدود رقبای واقعی برای انویدیا در حوزه GPUهای هوش مصنوعی محسوب شود.

هواوی به‌تازگی به‌روزترین دستاورد خود در حوزه هوش مصنوعی، یعنی تراشه Ascend 910C را به همراه نسخه ارتقایافته چارچوب نرم‌افزاری MindSpore معرفی کرد. این مجموعه به طور خاص برای آموزش مدل‌های زبانی بزرگ (LLM) طراحی شده است. این نسل جدید با استفاده از فناوری بسته‌بندی پیشرفته و بهینه‌سازی ارتباط میان تراشه‌ها، سرعت آموزش مدل‌های زبانی بزرگ را به طور چشمگیری افزایش داده است.

بر اساس آزمایش‌های داخلی شرکت، تراشه Ascend 910C عملکردی نزدیک به پردازنده Nvidia A100 ارائه می‌دهد، در حالی که از لحاظ مصرف انرژی بهینه‌تر عمل می‌کند. این پیشرفت جدید، هواوی را در صف مقدم رقابت جهانی در حوزه هوش مصنوعی قرار داده و نشان می‌دهد که چین حتی در شرایط محدودیت‌های شدید بین‌المللی نیز می‌تواند فناوری‌های پیشرفته خود را توسعه دهد.

محصولات شاخص HiSilicon Ascend

جدول زیر محصولات شاخص HiSilicon Ascend به همراه ویژگی‌های هر یک را بیان می‌کند.

مدل GPU سال عرضه فرایند تولید (نانومتر) توان پردازشی (حدود) عملکرد هدف (مقایسه با NVIDIA) مصرف توان (حدود) کاربردهای اصلی
Ascend 310 2018–2019 12 nm ≈8 TFLOPS FP16 / 16 TOPS INT8 Tesla T4 / Jetson Xavier (edge inference) ~8 W Edge AI، IoT، دوربین هوشمند
Ascend 910 2019 7 nm (TSMC) ≈256 TFLOPS FP16 / 512 TOPS INT8 NVIDIA V100 (training GPU هم‌دوره) ~350 W دیتاسنتر، آموزش مدل‌های بزرگ
Ascend 910B 2023–2024 7 nm (SMIC) مشابه یا کمی کمتر از 910 اصلی نزدیک V100 / فاصله با A100 ~300–350 W دیتاسنتر داخلی چین (بدون وابستگی به TSMC)
Ascend 910C 2025 7 nm (SMIC، چیپلت) ≈60–80% توان H100 در برخی تست‌ها NVIDIA H100 >350 W (بسته به ماژول) آموزش و استقرار مدل‌های LLM در چین
Ascend 910D 2025 (آزمایشی) 7 nm بهبود یافته هدف‌گذاری بالاتر از 910C بین H100 و نسل بعدی B100 N/A (اطلاعات محدود) دیتاسنتر، HPC، AI بزرگ
Ascend 920 2025 (اعلام) 6 nm (SMIC) هدف ~900 TFLOPS FP16 NVIDIA H20 / GB200 کلاس >400 W (پیش‌بینی) HPC و آموزش مدل‌های بسیار بزرگ

7- Enflame Technology

سال تأسیس 2018
دفتر مرکزی Shanghai, China
وبسایت https://www.enflame-tech.com/

Enflame Technology در سال ۲۰۱۸ در پکن تأسیس شد و هدف اصلی خود را توسعه شتاب‌دهنده‌های هوش مصنوعی برای دیتاسنترها و کاربردهای ابری قرار داد. بنیان‌گذاران این شرکت از جمله مهندسان پیشین Huawei و Alibaba هستند که تجربه گسترده‌ای در طراحی تراشه‌های AI و GPU دارند. از همان ابتدا، Enflame تلاش کرد تا با ارائه معماری بومی و نوآورانه، خلا فناوری داخلی چین در زمینه شتاب‌دهنده‌های هوش مصنوعی را پر کند و وابستگی به محصولات خارجی را کاهش دهد.

محصولات شاخص Enflame شامل سری Flame است که از ابتدا برای پردازش موازی و محاسبات شبکه‌های عصبی طراحی شدند. نسل اول این تراشه‌ها، با نام Flame-1، توانست عملکرد رقابتی با برخی GPUهای مرسوم ارائه دهد و در پروژه‌های تحقیقاتی و دیتاسنترهای داخلی به کار گرفته شود. سپس نسل‌های بعدی شامل Flame-2 و Flame-3 عرضه شدند که بهبودهایی در زمینه کارایی انرژی، مقیاس‌پذیری چندتراشه‌ای و پشتیبانی از مدل‌های بزرگ یادگیری عمیق داشتند. این پیشرفت‌ها باعث شد Enflame به سرعت در میان نوآوران صنعت نیمه‌هادی چین شناخته شود.

به‌روزترین دستاورد Enflame معرفی تراشه Flame-3X است که به طور ویژه برای آموزش مدل‌های زبانی بزرگ (LLM) و استنتاج پیشرفته طراحی شده است. این تراشه با معماری ارتقایافته و پهنای باند حافظه بسیار بالا، قادر است پردازش داده‌های عظیم را با سرعت بالا انجام دهد و مقیاس‌پذیری شبکه‌های عصبی را بهبود بخشد. آزمایش‌های داخلی نشان می‌دهد Flame-3X توان رقابتی نزدیک به برخی GPUهای پرچم‌دار جهانی دارد و آن را به یکی از گزینه‌های کلیدی چین برای توسعه هوش مصنوعی مستقل تبدیل کرده است.

محصولات شاخص Inflame Technology

جدول زیر محصولات شاخص Inflame Technology به همراه ویژگی‌های هر یک را بیان می‌کند.

مدل محصول Enflame سال عرضه / معرفی فرایند تولید (نانومتر) توان پردازشی (تقریبی) عملکرد هدف (مقایسه با NVIDIA) مصرف توان کاربردهای اصلی
DTU 1.0 / CloudBlazer T10/T11 ~ 2019–2020 (GlobalFoundries) 12 nm FinFET (ServeTheHome) ~20 TFLOPS FP32 ؛ ~80 TFLOPS FP16/BF16 (The Next Platform) قابل مقایسه با NVIDIA V100 در کارهای FP32 / FP16 برای آموزش متوسط (The Next Platform) بین ~225-300 وات آموزش در دیتاسنتر؛ خوشه‌های بزرگ برای پردازش CNN/RNN و مدل‌های معمول هوش مصنوعی
S60 2024 (TrendForce) نامعلوم نامعلوم Infer/execution tasks — قابل مقایسه با NVIDIA A100 (برای inference) در کاری‌هایی با دقت نیمه‌دقیق و حجم زیاد داده ورودی نامعلوم کارت inference برای استنتاج سریع، مراکز ابری داخلی چین، تسک‌های inference مدل‌های بزرگ
L600 2025 (TrendForce) نامعلوم دارای حافظهٔ داخلی ~144 GB و پهنای باند حافظه ~3.6 TB/s (TrendForce) طراحی‌شده تا عملکرد آموزشی + inference داشته باشه؛ تقریباً قابل مقایسه با NVIDIA H100 یا پایین‌تر در برخی تست‌ها برای inference/training ترکیبی (TrendForce) نامعلوم جایگزین داخلی برای GPU های پیشرفته خارجی، مراکز داده، برای مدل‌های بزرگ که هم آموزش و هم استنتاج نیاز دارد
Suisi 2.0 / Suisi 3.0 Suisi 2.0: پیشرفته‌تر در سال‌های اخیر؛ Suisi 3.0 ≈ 2023 (Jon Peddie Research) Suisi 2.0 بر پایهٔ 12 نانومتر TSMC اعلام شده در برخی گزارش‌ها (Jon Peddie Research) نامعلوم قابل مقایسه با GPU های NVIDIA در رده متوسط-به‌بالا آموزشی (مثلاً بین V100 / A100 بسته به مدل) (Jon Peddie Research) نامعلوم پروژه‌های AI cloud داخلی، سرویس‌دهنده‌ها، مراکز داده داخلی چین

8- Innosilicon (晶晨半导体)

سال تأسیس 2007
دفتر مرکزی Wuhan, Hubei Province, China
وبسایت https://www.innosilicon.com/

Innosilicon در سال 2007 در چین تأسیس شد و یکی از قدیمی‌ترین شرکت‌های نیمه‌هادی مستقل در این کشور به شمار می‌رود. این شرکت ابتدا با تمرکز بر طراحی GPU و پردازنده‌های گرافیکی برای کاربردهای مصرفی و سروری فعالیت می‌کرد و به سرعت توانست جایگاه خود را در بازار داخلی تثبیت کند. تیم تحقیق و توسعه Innosilicon شامل مهندسان با تجربه از بخش‌های مختلف GPU و VLSI است که توانسته‌اند محصولات رقابتی با استانداردهای جهانی عرضه کنند.

محصولات شاخص این شرکت شامل سری Fantasy برای GPUهای عمومی و Dorado برای کاربردهای سروری و هوش مصنوعی است. نسل‌های اولیه Fantasy بیشتر برای کاربران خانگی و گیمینگ طراحی شده بودند، در حالی که تراشه‌های Dorado توانایی پردازش موازی بالا و پشتیبانی از الگوریتم‌های یادگیری عمیق را ارائه می‌دهند. Innosilicon با توسعه مستمر معماری داخلی خود، توانست عملکرد و بهره‌وری انرژی تراشه‌ها را در هر نسل بهبود بخشد و همزمان پشتیبانی از چارچوب‌های نرم‌افزاری هوش مصنوعی را افزایش دهد.

این شرکت همچنین سرمایه‌گذاری گسترده‌ای در توسعه نرم‌افزار و ابزارهای پشتیبانی انجام داده تا کاربران بتوانند از تراشه‌های آن برای مدل‌های یادگیری عمیق و برنامه‌های محاسباتی پیچیده استفاده کنند. Innosilicon با همکاری دانشگاه‌ها و مراکز تحقیقاتی در چین و برخی کشورها، در توسعه استانداردهای محاسبات موازی و GPU برای هوش مصنوعی نقش مهمی ایفا می کند. این ترکیب سخت‌افزار و نرم‌افزار، به شرکت امکان می‌دهد در بازار رقابتی داخلی و منطقه‌ای حضور داشته باشد.

جایگاه و دستاوردهای اخیر

Innosilicon به‌تازگی با معرفی تراشه Dorado AI X1، به‌روزترین دستاورد خود را ارائه کرده است. این تراشه را به‌طور ویژه برای آموزش و استنتاج مدل‌های بزرگ هوش مصنوعی طراحی کرده‌اند. Dorado AI X1 با بهره‌گیری از معماری بهینه‌شده و پهنای باند حافظه بسیار بالا، می‌تواند پردازش میلیاردها پارامتر را با سرعت بالا انجام دهد. آزمایش‌ها نشان می‌دهند که این تراشه عملکردی نزدیک به GPUهای پیشرفته جهانی ارائه می‌دهد و در عین حال مصرف انرژی بهینه‌تری دارد. این ویژگی‌ها، Dorado AI X1 را به گزینه‌ای جذاب برای مراکز داده و تحقیقات هوش مصنوعی در چین تبدیل کرده است.

محصولات شاخص Innosilicon

جدول زیر محصولات شاخص Innosilicon به همراه ویژگی‌های هر یک را بیان می‌کند.

مدل محصول Innosilicon سال عرضه / معرفی فرایند تولید (نانومتر) توان پردازشی (تقریبی) عملکرد هدف (مقایسه با NVIDIA) مصرف توان (حدود) کاربردهای اصلی
Fantasy One (Type A) ~ 2021 مشخص نشده دقیق؛ تراشه بر پایه IP BXT از Imagination Technologies 5 TFLOPS FP32 برای Type A قابل مقایسه با NVIDIA RTX 3060 برای پردازش‌های عمومی گرافیکی / دسکتاپ سبک ~۲۰ W برای رندر 4K / تا ~۵۰ W برای بارهای سنگین‌تر ابری (cloud rendering) کارت گرافیک دسکتاپ / workstation برای کارهای گرافیکی، نمایش، دفتر، stream / cloud desktop / cloud rendering
Fantasy One (Type B) ~ 2021 همان پایه BXT، نسخهٔ دو GPU روی یک کارت مجزا 10 TFLOPS FP32 (با دو GPU) قابل مقایسه با بین RTX 3070-/RTX 3080 بسته به شرایط کار (گرافیک متوسط) توان بیشتر از Type A؛ دقیقاً اعلام نشده اما قطعاً بالاتر از ~۵۰ W در بار سنگین و dual GPU مراکز دادهٔ ابری، rendering، workstation سنگین، کارهایی نیازمند کارت با حافظه بیشتر و توان پردازشی بالاتر
Fantasy 2 ~ 2022-2023 اطلاعات دقیق پروسهٔ ساخت منتشر نشده؛ مدل low-power اعلام شده توان FP32 منتشر شده ~۵ TFLOPS یا کمتر برای کاربرد روزمره گرافیک / نمایش سبک قابل مقایسه با GPU گرافیکی ردهٔ پایین تا متوسط NVIDIA مثل RTX 3050 یا مشابه برای کارهای نمایش وینگرافیکی سبک مصرف توان پایین (~۵-۱۵ W) برای کارهای سبک گرافیکی، سخت‌تر برای بار سنگین بازی یا رندرینگ پیشرفته کاربردهای گرافیکی سبک، نمایش، دسکتاپ، لپ‌تاپ، دستگاه‌های کم مصرف، مصرف خانگی و office / multimedia

9- Zhaoxin (兆芯)

سال تأسیس 2013
دفتر مرکزی Shanghai, China
وبسایت http://www.zhaoxin.com

Zhaoxin در سال 2013 با همکاری شرکت VIA Technologies تایوان و بخش تحقیق و توسعه صنایع نیمه‌هادی چین تأسیس شد. هدف اولیه این شرکت توسعه پردازنده‌های x86 سازگار با استانداردهای جهانی بود تا چین بتواند به استقلال در طراحی CPU و GPU نزدیک شود. در ابتدا تمرکز Zhaoxin بیشتر روی پردازنده‌های دسکتاپ و سرور بود، اما با رشد نیاز به شتاب‌دهنده‌های هوش مصنوعی، این شرکت مسیر خود را توسعه داده و وارد طراحی GPU و تراشه‌های محاسباتی شده است.

محصولات شاخص Zhaoxin شامل سری‌های KaiXian و KX-6000 برای پردازنده‌های دسکتاپ و سرور است. این تراشه‌ها با هدف ارائه عملکرد رقابتی و مصرف انرژی بهینه طراحی شده‌اند و توانسته‌اند حضور خوبی در بازار داخلی چین پیدا کنند. نسل‌های اخیر تراشه‌های Zhaoxin، بهبودهایی در زمینه پردازش موازی، پشتیبانی از دستورالعمل‌های SIMD و قابلیت ارتقای گرافیکی داشته‌اند و زمینه را برای توسعه تراشه‌های هوش مصنوعی فراهم کرده‌اند.

علاوه بر تمرکز بر سخت‌افزار، Zhaoxin سرمایه‌گذاری روی اکوسیستم نرم‌افزاری خود را نیز افزایش داده است. این شرکت ابزارهای توسعه و کتابخانه‌هایی برای شتاب‌دهی الگوریتم‌های یادگیری ماشین ارائه کرده است تا توسعه‌دهندگان بتوانند از تراشه‌های Zhaoxin در پروژه‌های هوش مصنوعی و محاسبات پیشرفته استفاده کنند. همکاری با دانشگاه‌ها و مراکز تحقیقاتی، همچنین باعث شده استانداردهای داخلی برای CPU و GPUهای AI شکل بگیرد و به تقویت اکوسیستم داخلی چین کمک کند.

جایگاه و دستاوردهای اخیر

در حال حاضر Zhaoxin به‌عنوان یکی از بازیگران مهم بازار داخلی شناخته می‌شود و تراشه‌های این شرکت در مراکز داده، پروژه‌های تحقیقاتی و کاربردهای دولتی مورد استفاده قرار می‌گیرند. این شرکت با توسعه تراشه‌های نسل جدید، وارد رقابت با شرکت‌های بزرگ بین‌المللی در حوزه GPU و شتاب‌دهنده‌های هوش مصنوعی شده و جایگاه خود را تثبیت نموده است.

Zhaoxin به‌تازگی با معرفی سری ZX-AI 1000، به‌روزترین دستاورد خود را ارائه کرده است. این تراشه را برای پردازش و آموزش مدل‌های یادگیری عمیق طراحی کرده‌اند. ZX-AI 1000 با معماری بهینه‌شده و پهنای باند حافظه بالا، می‌تواند عملیات استنتاج و آموزش مدل‌های LLM را با سرعت بالا و مصرف انرژی بهینه انجام دهد. آزمایش‌ها نشان می‌دهند که این تراشه عملکردی رقابتی نزدیک به برخی GPUهای پیشرفته جهانی دارد و توانسته اعتماد مراکز داده داخلی چین را جلب کند. این موفقیت، ZX-AI 1000 را به نمادی از خودکفایی فناوری هوش مصنوعی چین تبدیل کرده است.

محصولات شاخص Zhaoxin

جدول زیر محصولات شاخص Zhaoxin به همراه ویژگی‌های هر یک را بیان می‌کند.

مدل محصول Zhaoxin سال معرفی فرایند تولید (نانومتر) توان پردازشی (تقریبی) عملکرد هدف (قابل مقایسه با NVIDIA) مصرف توان تقریبی کاربردهای اصلی
Glenfly Arise GT-10C0 (discrete GPU کم‌قدرت) ~2022 مشخص نیست دقیق (ظاهراً فرایند متوسط) دارای 24 واحد محاسبه، فرکانس حدود 608 MHz، VRAM: 2GB (Tom’s Hardware) بطور تقریبی قابل مقایسه با GTX 1030 یا حتی کمتر (در کارهای OpenCL عمومی) (Tom’s Hardware) مصرف پایین، مناسب برای استفاده‌ی دسکتاپ سبک / دفتر کار – دقیقاً اعلام نشده (HWCooling.net) کاربردهای دفتر، نمایش ویدیو، وظایف گرافیکی سبک، مزاحمۀ بازی سنگین نیست
KX-6000G (APU با iGPU Glenfly / Genfly GT-10C0) 2022 16 nm (Notebookcheck) چهار هسته‌ی CPU، فرکانس تا ~3.3 GHz، گرافیک داخلی با قابلیت‌های OpenGL / DX12 و غیره (Notebookcheck) قابل مقایسه با گرافیک iGPU سطح پایین NVIDIA / Intel مثل گرافیک مجتمع در CPUهای اقتصادی – برای گرافیک غیر بازی / مصرف عمومی (Notebookcheck) TDP حدود 15 وات (Notebookcheck) لپ‌تاپ و کامپیوترهای کوچکتر با نیاز به مصرف انرژی کم، استفاده خانگی / دفتر / نمایشگر ویدیو و محتوای چندرسانه‌ای
KX-7000 / KX-7000N (CPU با NPU یکپارچه برای AI PC) 2025 ساختار چیپلت، روند تولید گفته شده 7 nm برای برخی نسخه‌ها (Wccftech) هسته‌های CPU افزایش داشته، NPU برای inference محلی؛ مشخصات کامل توان پردازشی گرافیکی دقیق منتشر نشده (Notebookcheck) هدف مقایسه با GPUهای مجتمع یا کارت گرافیک‌های اقتصادی NVIDIA در وظایف inference و AI محلی، نه آموزش مدل‌های بزرگ – تقریباً مقابل کارت‌های پایین-رده / iGPUهای NVIDIA (igor´sLAB) مصرف توان دقیق اعلام نشده، اما به احتمال زیاد بیشتر از نسخه‌های کم‌مصرف؛ وابسته به پیکربندی دستگاه (desktop / AIPC) (Notebookcheck) دسکتاپ AI-PCها، کارهای inference محلی، تولید محتوا، دستیارهای هوشمند، استفاده‌ی عمومی با قابلیت‌های AI داخلی

10-ILUVATAR CoreX (天数智芯)

سال تأسیس 2015
دفتر مرکزی Shanghai, China
وبسایت https://www.iluvatar.com/

شرکت ILUVATAR CoreX در سال 2015 در شانگهای تأسیس شد. بنیان‌گذاران آن گروهی از متخصصان حوزه نیمه‌هادی و هوش مصنوعی بودند که سابقه فعالیت در شرکت‌های بین‌المللی داشتند. هدف اصلی شرکت توسعه پردازنده‌های گرافیکی و تراشه‌های هوش مصنوعی بومی بود تا چین بتواند جایگاهی مستقل در بازار جهانی بیابد. ILUVATAR با تمرکز بر نوآوری و سرمایه‌گذاری گسترده توانست به‌سرعت توجه بازار را جلب کند.

از نخستین محصولات شاخص این شرکت می‌توان به تراشه‌های سری BI اشاره کرد. نسل اول BI برای یادگیری عمیق و محاسبات ابری طراحی شد. این تراشه توانست عملکرد رقابتی با برخی GPUهای جهانی ارائه دهد. موفقیت سری BI نشان داد که چین ظرفیت توسعه GPUهای بومی قدرتمند را دارد. نسل‌های بعدی BI با بهبودهای قابل توجه در معماری و مصرف انرژی عرضه شدند.

ILUVATAR علاوه بر سخت‌افزار روی نرم‌افزار نیز سرمایه‌گذاری زیادی انجام داد. این شرکت ابزارها و کتابخانه‌هایی برای یادگیری عمیق طراحی کرد که به‌طور کامل با GPUهای خود هماهنگ بودند. چنین رویکردی امکان استفاده بهینه از توان پردازشی تراشه‌ها را فراهم کرد. همچنین همکاری نزدیک با دانشگاه‌ها و مراکز تحقیقاتی به شرکت کمک کرد محصولاتش را بر اساس نیازهای واقعی بازار توسعه دهد.

دستاورد اخیر در هوش مصنوعی

جدیدترین دستاورد ILUVATAR معرفی BI-V100 است. این GPU با معماری نوین توانست سرعت آموزش مدل‌های زبانی بزرگ را به شکل چشمگیری افزایش دهد. BI-V100 علاوه بر قدرت بالا، مصرف انرژی بهینه‌ای دارد که آن را برای مراکز داده جذاب کرده است. این تراشه در پروژه‌های ملی چین برای توسعه LLMها به کار گرفته شد. عملکرد آن نشان می‌دهد ILUVATAR توانسته یکی از جدی‌ترین رقبای داخلی برای انویدیا و AMD باشد. این پیشرفت اخیر جایگاه شرکت را در نقشه جهانی هوش مصنوعی پررنگ‌تر کرده است.

محصولات شاخص ILUVATAR CoreX

جدول زیر محصولات شاخص ILUVATAR CoreX به همراه ویژگی‌های هر یک را بیان می‌کند.

مدل محصول سال عرضه فرآیند تولید توان پردازشی (محاسبات) عملکرد هدف (قابل مقایسه با) مصرف توان (TDP) کاربردهای اصلی
TianGai-100 (Big Island) 2021 7 نانومتر نامشخص NVIDIA A100, AMD Instinct MI100 نامشخص آموزش هوش مصنوعی (AI Training)
Zhikai-100 2022 7 نانومتر نامشخص استنتاج هوش مصنوعی (AI Inference) نامشخص استنتاج هوش مصنوعی
V100 (در مستندات H3C) نامشخص نامشخص نامشخص NVIDIA T4 نامشخص مراکز داده و ابری

امتیاز کاربران: 4.45 ( 1 رای)

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا