ده تولیدکننده برتر GPU در چین

صنعت نیمههادی چین طی سالهای اخیر رشد چشمگیری داشته، بهویژه در حوزه پردازشهای گرافیکی و هوش مصنوعی. در این مقاله به معرفی ده تولیدکننده اصلی GPU در چین میپردازیم که هر یک با تاریخچه، محصولات شاخص و دستاوردهای نوین خود سهم مهمی در خودکفایی فناوری این کشور ایفا کردهاند. بررسی مسیر و دستاوردهای این شرکتها، تصویری روشن از رقابت و نوآوری در بازار GPU چین ارائه میدهد.
شرکتهایی مانند CSIC، Jingjia Micro و Zhaoxin Semiconductor در خط مقدم بخش تولید GPU چین قرار دارند. این شرکتها نهتنها بر برآورده کردن تقاضای داخلی تمرکز دارند، بلکه در حال گسترش دامنه فعالیت خود به بازارهای بینالمللی نیز هستند و سلطه رقبای غربی را به چالش میکشند. علاوه بر این، همکاری با ابتکارات دولتی چین و سرمایهگذاری در فناوریهای پیشرفته نیمههادی، تأکیدکنندهی تلاش راهبردی چین برای دستیابی به خودکفایی در صنعت نیمههادی، از جمله GPUها است.
با تداوم سرمایهگذاری گسترده چین در فناوری و نوآوری، تولیدکنندگان GPU این کشور آمادهاند تا نقشی هرچه تأثیرگذارتر در شکلدهی آینده صنایع جهانی الکترونیک و محاسبات ایفا کنند.
1- Jingjia Micro (景嘉微)
| سال تأسیس | 2006 |
| دفتر مرکزی | Changsha, Hunan |
| وبسایت | www.jingjiamicro.com |

شرکت Jingjia Micro در سال ۲۰۰۶ در شهر چانگشا، استان هونان تأسیس شد. این شرکت فعالیت خود را با تمرکز بر طراحی پردازندههای گرافیکی برای کاربردهای نظامی آغاز کرد. دولت چین تأسیس این شرکت را حمایت کرد، زیرا کشور به دنبال کاهش وابستگی به GPUهای خارجی در صنایع حساس بود. در سالهای نخست، Jingjia محصولات اولیهای تولید کرد که بیشتر برای نمایشگرهای نظامی و شبیهسازی در سیستمهای دفاعی استفاده شدند. این محصولات قدرت محدودی داشتند اما نیاز حیاتی کشور را تأمین کردند.
با گذشت زمان، مهندسان شرکت سطح دانش طراحی نیمههادی را افزایش دادند. در نتیجه Jingjia توانست نسلهای جدید پردازندهها را توسعه دهد. تراشههای جدید قابلیت پردازش موازی بهتری داشتند و بهطور گستردهتر در صنایع مختلف چین استفاده شدند. این پیشرفتها باعث شد شرکت از یک تولیدکننده محدود به بازیگری مهم در زنجیره نیمههادی چین تبدیل شود.
از محصولات شاخص این شرکت میتوان به JM5400 و JM7200 اشاره کرد. JM5400 یکی از نخستین تلاشها برای ساخت GPU عمومی در چین بود. این تراشه عملکردی نزدیک به برخی محصولات انویدیا ارائه داد و در کاربردهای صنعتی استفاده شد. JM7200 توان بالاتری در پردازش گرافیک داشت و قابلیتهای بیشتری برای اجرای نرمافزارهای مدرن فراهم میکرد. این تراشهها نه تنها نیاز بازار داخلی را تأمین کردند، بلکه نشان دادند چین میتواند در طراحی GPU مستقل موفق شود.
محصولات شاخص Jingjia
در جدول زیر محصولات شاخص این شرکت و ویژگیهای آن آمده است.
| مدل GPU | سال عرضه | فرآیند تولید | توان پردازشی (TFLOPS) | عملکرد هدف (قابل مقایسه با) | مصرف توان (TDP) |
|---|---|---|---|---|---|
| JM5400 | 2014 | 65 نانومتر | نامشخص | جایگزینی GPUهای خارجی در کاربردهای نظامی | نامشخص |
| JM7200 | 2018 | 28 نانومتر | نامشخص | GeForce GT 640 | کمتر از 10 وات |
| JM7201 | 2019 | 28 نانومتر | نامشخص | کاربردهای پایه تجاری و چندصفحهای | 15 وات |
| JM9230 | 2021 | 28 نانومتر | ~1.2 (تخمینی) | کاربردهای ایستگاه کاری و چندصفحهای | 30 وات |
| JM9231 | 2021 | 28 نانومتر | 2 | GeForce GTX 1050 | 150 وات |
| JM9271 | 2021 | 28 نانومتر | 8 | GeForce GTX 1080 | 200 وات |
تمرکز و جایگاه فعلی
Jingjia امروز روی توسعه پردازندههای گرافیکی پرقدرت برای بازار عمومی و نظامی تمرکز میکند. این شرکت نسلهای جدید GPU را طراحی میکند تا عملکرد بالاتری نسبت به رقبا ارائه دهند. تمرکز اصلی مهندسان، بهبود بهرهوری انرژی، افزایش کارایی موازی و گسترش پشتیبانی نرمافزاری است. Jingjia با وجود چالشهای زنجیره تأمین جهانی، سرمایهگذاری در تحقیق و توسعه را افزایش داده است.
در حال حاضر این شرکت به عنوان یکی از امیدهای اصلی چین برای رقابت با شرکتهای بینالمللی مانند انویدیا شناخته میشود. تراشههای جدید Jingjia نه تنها در بازار داخلی بلکه در پروژههای ملی راهبردی مورد استفاده قرار میگیرند. این روند نشان میدهد که چین میتواند در آینده نزدیک به سطح جهانی در تولید GPU نزدیک شود.

2- Moore Threads (摩尔线程)
| سال تأسیس | 2020 |
| دفتر مرکزی | Beijing, China |
| وبسایت | www.mthreads.com |

شرکت Moore Threads در سال ۲۰۲۰ توسط جِنگ جینگون، یکی از مدیران سابق انویدیا در چین، تأسیس شد. هدف اولیه این شرکت توسعه پردازندههای گرافیکی بومی بود تا نیاز روزافزون چین در زمینه گیمینگ، رایانش ابری و هوش مصنوعی را برطرف کند. سرمایهگذاریهای کلان و حمایت دولت مرکزی باعث شدند Moore Threads به سرعت به یکی از مهمترین استارتاپهای نیمههادی چین تبدیل شود.
Moore Threads در مدت کوتاه فعالیت خود چند محصول مهم عرضه کرده است. از جمله میتوان به MTT S60 و MTT S2000 اشاره کرد. شرکت، تراشه MTT S60 را بیشتر برای کارتهای گرافیک مصرفی طراحی کرد و در اجرای بازیها و پردازشهای گرافیکی روزمره عملکرد مناسبی داشت. در مقابل، شرکت، MTT S2000 را برای مراکز داده و کاربردهای هوش مصنوعی طراحی کرد و قدرت پردازشی بالاتری ارائه داد. این تراشهها نشان دادند چین میتواند در حوزه GPU رقابتی حضور داشته باشد.
شرکت علاوه بر سختافزار، تمرکز ویژهای روی توسعه زیستبوم نرمافزاری گذاشته است. Moore Threads بستر نرمافزاری خود را طراحی کرد تا پشتیبانی از موتورهای گرافیکی و چارچوبهای یادگیری عمیق فراهم کند. این اقدام به توسعهدهندگان امکان میدهد از GPUهای بومی بهطور مؤثر استفاده کنند. چنین رویکردی اهمیت زیادی دارد، زیرا موفقیت GPU تنها به سختافزار وابسته نیست و نیاز به هماهنگی نرمافزاری گسترده دارد.
دستاورد اخیر در هوش مصنوعی
Moore Threads در سال ۲۰۲۳ نسل جدید GPUهای MTT S3000 را معرفی کرد. این تراشه با معماری ارتقایافته توانست عملکردی نزدیک به کارتهای ردهبالای جهانی ارائه دهد. ویژگی برجسته S3000 قابلیت پردازش بهینه مدلهای زبانی بزرگ و شبکههای عصبی عمیق است. این GPU در آزمایشهای داخلی توانست سرعت آموزش LLMها را افزایش دهد و همزمان مصرف انرژی کمتری داشته باشد. این دستاورد اخیر نشان میدهد Moore Threads با وجود عمر کوتاه، جایگاهی کلیدی در مسیر استقلال فناوری چین یافته است.

محصولات شاخص Moore Threads
جدول زیر محصولات شاخص Moore Threads به همراه ویژگیهای هر یک را بیان میکند.
| مدل GPU | سال عرضه | فرآیند تولید | توان پردازشی (TFLOPS) | عملکرد هدف (قابل مقایسه با) | مصرف توان (TDP) |
|---|---|---|---|---|---|
| MTT S60 | 2022 | 12 نانومتر | 6 (FP32) | GeForce GTX 1070 | نامشخص |
| MTT S80 | 2022 | 12 نانومتر | 14.4 (FP32) | GeForce GTX 1650 Super | 255 وات |
| MTT S2000 | 2022 | 12 نانومتر | 12 (FP32) | Tesla T4 | 150 وات |
| MTT S3000 | 2023 | 12 نانومتر | 15.2 (FP32) | Tesla V100 | 250 وات |
| MTT S4000 | 2023 | 12 نانومتر | 25 (FP32) | Tesla A100 (نسخه پایینتر) | 450 وات |
3- Biren Technology (壁仞科技)
| سال تأسیس | 2019 |
| دفتر مرکزی | Shanghai, China |
| وبسایت | https://www.birentech.com/ |

Biren Technology در سال ۲۰۱۹ در شانگهای تأسیس شد و از همان ابتدا توانست سرمایهگذاریهای قابلتوجهی جذب کند. بنیانگذاران این شرکت از میان متخصصانی آمدهاند که پیشتر در شرکتهای بزرگی همچون انویدیا، علیبابا و هایسیلیکون تجربه داشتند. همین ترکیب تیم مدیریتی باعث شد تا Biren با سرعتی غیرمعمول بهعنوان یکی از نوآورترین طراحان تراشههای گرافیکی در چین مطرح شود. هدف اصلی این شرکت طراحی پردازندههای گرافیکی قدرتمند برای دیتاسنترها و کاربردهای هوش مصنوعی بود، جایی که چین بیشترین نیاز و وابستگی خارجی را داشت.

در سالهای ابتدایی فعالیت، Biren بر توسعه معماری اختصاصی خود متمرکز شد که بتواند از نظر توان پردازشی و بهرهوری انرژی با بهترین نمونههای جهانی رقابت کند. نتیجه این تلاشها معرفی نخستین پردازندههای نسل BR شد. این تراشهها به طور ویژه برای آموزش مدلهای بزرگ هوش مصنوعی و پردازش دادههای حجیم طراحی شدند و از لحاظ نظری میتوانستند با برخی از محصولات پرچمدار انویدیا رقابت داشته باشند. این رویکرد جاهطلبانه سبب شد Biren به سرعت مورد توجه رسانهها و محققان قرار گیرد.
تمرکز و جایگاه فعلی
محصول شاخص این شرکت، Biren BR100، یکی از قدرتمندترین GPUهای بومی چین به شمار میرود. این تراشه با معماری پیشرفته و لیتوگرافی ۷ نانومتری TSMC ساخته و از ویژگیهایی چون حافظه با پهنای باند بسیار بالا و مقیاسپذیری در سیستمهای چندتراشهای آن را متمایز می کند. بر اساس اطلاعات منتشرشده، BR100 میتوانست به سطح ترافلاپهای رقابتی با GPUهای کلاس A100 انویدیا برسد. پس از آن، نسخه کوچکتر و کممصرفتر با نام BR104 نیز معرفی شد که برای کاربردهای گستردهتر از جمله استنتاج هوش مصنوعی طراحی گردید.
یکی از ویژگیهای متمایز Biren، تلاش برای ایجاد یک اکوسیستم نرمافزاری کامل است. این شرکت میداند که بدون ابزارهای توسعه نرمافزار و چارچوبهای پشتیبان، حتی قدرتمندترین سختافزارها نیز نمیتوانند سهم بازار بزرگی کسب کنند. به همین دلیل، Biren مجموعهای از کتابخانهها و ابزارهای توسعه برای برنامهنویسان و محققان هوش مصنوعی عرضه کرده است. این اقدام باعث گردیده تا تراشههای Biren به تدریج در مراکز تحقیقاتی و دانشگاهها مورد استفاده قرار گیرند.
بهروزترین دستاورد Biren Technology معرفی نسخه بهبود یافته BR100 با قابلیتهای ویژه برای آموزش مدلهای زبانی بزرگ (LLM) است. این تراشهها از بهینهسازی حافظه و ارتباطات بینتراشهای بهره میبرند تا بتوانند مدلهایی با صدها میلیارد پارامتر را با سرعت بالاتر آموزش دهند. گزارشها نشان میدهد که این GPUها در برخی آزمایشهای داخلی موفق شدهاند عملکردی نزدیک به انویدیا H100 از خود نشان دهند، هرچند در دسترسپذیری جهانی هنوز محدودیت دارند. همین پیشرفتها باعث گردیده Biren به عنوان یکی از پیشگامان واقعی چین در رقابت هوش مصنوعی جهانی شناخته شود.
محصولات شاخص Biren Technology
جدول زیر محصولات شاخص Biren Technology به همراه ویژگیهای هر یک را بیان میکند.
| GPU | سال عرضه | فرآیند تولید | توان پردازشی (TFLOPS) | عملکرد هدف (قابل مقایسه با) | مصرف توان (TDP) |
|---|---|---|---|---|---|
| BR100 | 2022 | 7 نانومتر | 1,024 (BF16) | NVIDIA A100 | 300 وات (BR104) |
| BR104 | 2022 | 7 نانومتر | 128 (FP32) | NVIDIA A100 (نسخه پایینتر) | 300 وات |
| Biren 106 | 2025 | نامشخص | نامشخص | پشتیبانی از مدلهای AI | نامشخص |
4-Cambricon Technologies (寒武纪科技)
| سال تأسیس | 2016 |
| دفتر مرکزی | Beijing, China |
| وبسایت | https://www.cambricon.com/ |
شرکت Cambricon در سال ۲۰۱۶ در پکن تأسیس شد. بنیانگذاران آن گروهی از محققان آکادمی علوم چین بودند که سابقه طولانی در طراحی تراشه داشتند. هدف اولیه Cambricon توسعه پردازندههای هوش مصنوعی بومی بود. این شرکت تلاش کرد جایگاه چین را در رقابت جهانی تثبیت کند و از همان ابتدا سرمایهگذاریهای کلانی جذب کرد.
Cambricon محصولات متنوعی را به بازار عرضه کرد. یکی از سریهای شناختهشده، MLU است که شامل تراشههایی برای لبه، سرورها و دیتاسنترها میشود. سری MLU100 و MLU200 توانستند عملکردی قوی در استنتاج مدلهای یادگیری عمیق ارائه دهند. سپس MLU270 و MLU370 معرفی شدند که قدرت پردازشی بالاتری داشتند و مقیاسپذیری بهتری برای پروژههای بزرگ فراهم کردند. این نسلها نشان دادند Cambricon میتواند بهطور مستقیم با تراشههای جهانی رقابت کند.
علاوه بر سختافزار، Cambricon اکوسیستم نرمافزاری اختصاصی خود را توسعه داد. این شرکت چارچوب Cambricon NeuWare را معرفی کرد که امکان آموزش و استنتاج بهینه روی تراشههای MLU را فراهم میکرد. NeuWare همچنین توسعهدهندگان را قادر ساخت مدلهای خود را روی GPUهای Cambricon اجرا کنند. ترکیب سختافزار و نرمافزار هماهنگ باعث شد شرکت جایگاه خود را در صنایع متنوع تقویت کند.
دستاورد اخیر در هوش مصنوعی
Cambricon در سال ۲۰۲۳ تراشه MLU370-X8 را عرضه کرد. این تراشه با معماری ارتقایافته توانست سرعت آموزش مدلهای زبانی بزرگ را چند برابر کند. عملکرد MLU370-X8 در آزمایشهای داخلی نزدیک به GPUهای پرچمدار جهانی بود. علاوه بر این، تراشه مصرف انرژی بهینهای داشت و برای دیتاسنترهای چین جذاب شد. دستاورد اخیر Cambricon نشان داد چین میتواند در حوزه تراشههای هوش مصنوعی مسیر مستقل خود را دنبال کند.
محصولات شاخص Cambricon Technology
جدول زیر محصولات شاخص Cambricon Technology به همراه ویژگیهای هر یک را بیان میکند.
| مدل پردازنده | سال عرضه | فرآیند تولید | توان پردازشی (TOPS) | عملکرد هدف (قابل مقایسه با) | مصرف توان (TDP) |
|---|---|---|---|---|---|
| MLU270 | 2019 | 16nm/12nm | 128 (INT8), 64 (INT16) | پایهای برای محاسبات ابری | 75 وات |
| MLU370 | 2021 | 7nm | 256 (INT8) | ارتقاء یافته برای آموزش و استنتاج | 150 وات |
| MLU590 | 2023 | 7nm | 1,024 (FP16) | NVIDIA A100 | 300 وات |
5-MetaX (迈克斯科技)
| سال تأسیس | 2020 |
| دفتر مرکزی | Shanghai, China |
| وبسایت | www.metax-tech.com |

MetaX یکی از شرکتهای نوظهور در صنعت نیمههادی چین که طی سالهای اخیر با تمرکز ویژه بر پردازندههای گرافیکی عمومی (GPGPU) و شتابدهندههای هوش مصنوعی توانسته جایگاه مهمی در بازار داخلی پیدا کند. این شرکت در اوایل دهه ۲۰۲۰ تأسیس شد و با ترکیب تیمی متشکل از متخصصان حوزه GPU و محققان هوش مصنوعی مسیر خود را آغاز کرد. هدف MetaX از ابتدا، توسعه پردازندههایی بود که علاوه بر کاربردهای گرافیکی سنتی، بتوانند به نیازهای پرشتاب حوزه یادگیری عمیق و رایانش ابری نیز پاسخ دهند.

در مسیر توسعه محصولات، MetaX سری MXN، MXC و MXG را معرفی کرد که هر یک برای طیف خاصی از نیازهای محاسباتی طراحی شدهاند. برای مثال، سری MXN برای کاربردهای مصرفی و پردازشهای گرافیکی عمومی، سری MXC برای پردازشهای ابری و مقیاس بزرگ، و سری MXG به طور خاص برای محاسبات سنگین هوش مصنوعی و مدلهای یادگیری عمیق توسعه یافت. این تقسیمبندی محصولی باعث شد MetaX بتواند بخشهای مختلف بازار، از دستگاههای شخصی تا دیتاسنترها، را پوشش دهد. این تنوع در محصولات، انعطافپذیری و تطبیقپذیری بالایی را به اکوسیستم این شرکت بخشید.
یکی از نقاط قوت MetaX در کنار سختافزار، سرمایهگذاری جدی در زمینه نرمافزار و پلتفرمهای توسعه است. این شرکت تلاش کرده است تا برای تراشههای خود، مجموعهای از ابزارهای برنامهنویسی و پشتیبانی از چارچوبهای پرکاربرد یادگیری عمیق مانند TensorFlow و PyTorch فراهم کند. این استراتژی باعث گردیده محققان و توسعهدهندگان بتوانند بهسرعت محصولات MetaX را در پروژههای خود به کار گیرند. علاوه بر این، همکاریهای گسترده با دانشگاهها و مراکز تحقیقاتی در چین موجب شده MetaX جایگاه خود را در اکوسیستم علمی و صنعتی تثبیت کند.
تمرکز و جایگاه فعلی
شرکت MetaX بهتازگی با معرفی شتابدهندهای جدید در سری MXG، بهروزترین دستاورد خود در حوزه هوش مصنوعی را ارائه کرد. مهندسان MetaX این شتابدهنده را بهطور ویژه برای آموزش مدلهای زبانی بزرگ (LLM) طراحی کردهاند. آنان با بهرهگیری از معماری جدید، پهنای باند حافظه را به میزان قابلتوجهی افزایش و مقیاسپذیری چندتراشهای را سادهتر کردهاند.
گزارشها تأیید میکنند که تراشه جدید MetaX در برخی تستها به سطح رقابتی با کارتهای سری A100 انویدیا نزدیک گردیده است. این تراشه در زمینه استنتاج متون بلند و پردازش همزمان صدها میلیارد پارامتر، عملکرد قابل توجهی ارائه میدهد. این پیشرفت، MetaX را به عنوان یکی از امیدهای جدی چین در مسیر استقلال فناوری هوش مصنوعی معرفی کرده است.
محصولات شاخص MetaX
جدول زیر محصولات شاخص MetaX به همراه ویژگیهای هر یک را بیان میکند.
| مدل GPU | سال عرضه | فرآیند تولید | توان پردازشی (TOPS/TFLOPS) | عملکرد هدف (قابل مقایسه با) | مصرف توان (TDP) | کاربردهای اصلی |
|---|---|---|---|---|---|---|
| MXN100 | 2024 | نامشخص | 160 TOPS (INT8), 80 TFLOPS (FP16) | NVIDIA A100 (نسخه پایینتر) | نامشخص | هوش مصنوعی (استنتاج) |
| MXC500 | 2024 | نامشخص | 15 TFLOPS (FP32) | NVIDIA A100 | نامشخص | هوش مصنوعی (آموزش) |
| (نامشخص) | 2025 | نامشخص | نامشخص | کارت گرافیک گیمینگ | نامشخص | گیمینگ و رندرینگر |
6-Huawei (HiSilicon Ascend)
| سال تأسیس | 2004 |
| دفتر مرکزی | Shenzhen, Guangdong, China |
| وبسایت | https://www.hisilicon.com/cn |
Huawei یکی از غولهای فناوری چین است که از اواخر دهه ۱۹۸۰ کار خود را در حوزه تجهیزات مخابراتی آغاز کرد و بهتدریج به یک بازیگر بینالمللی در حوزههای مختلف فناوری تبدیل شد. یکی از زیرمجموعههای کلیدی این شرکت، HiSilicon است که در سال ۲۰۰۴ تأسیس شد و در ابتدا برای طراحی تراشههای ارتباطی و پردازندههای موبایلی (Kirin) شناخته میشد. با رشد نیاز به محاسبات پیشرفته و محدودیتهای صادراتی آمریکا، HiSilicon مأموریت یافت تا به توسعه پردازندههای گرافیکی و شتابدهندههای هوش مصنوعی ورود کند. این تصمیم، آغازگر شکلگیری خانواده تراشههای Ascend بود که امروز یکی از ستونهای راهبرد چین در خودکفایی فناوری محسوب میشوند.
اولین نسل از تراشههای Ascend در سال ۲۰۱۸ معرفی شد که شامل مدلهایی همچون Ascend 310 برای دستگاههای لبهای و Ascend 910 برای دیتاسنتر بود. Ascend 910 در زمان عرضه، یکی از قدرتمندترین شتابدهندههای هوش مصنوعی جهان به شمار میرفت و توانست توجه زیادی را به سمت Huawei جلب کند. این تراشه با توان محاسباتی FP16 در حد صدها ترافلاپس، نقطه عطفی در ورود چین به دنیای پردازندههای هوش مصنوعی بود. در ادامه، نسخههای جدیدتری همچون Ascend 910C و Ascend 910D معرفی شدند که بهبودهایی در زمینه کارایی انرژی و پشتیبانی از چارچوبهای نرمافزاری داشتند.
هواوی علاوه بر توسعه سختافزار، سرمایهگذاری عظیمی نیز روی اکوسیستم نرمافزاری انجام داد. این شرکت، پلتفرم MindSpore را بهعنوان چارچوب یادگیری عمیق اختصاصی خود طراحی کرد تا هماهنگی کاملی با معماری Ascend ایجاد کند. MindSpore علاوه بر پشتیبانی از مدلهای مرسوم، قابلیتهای ویژهای نیز برای آموزش توزیعشده و مقیاسپذیری در دیتاسنترها ارائه میدهد. این ترکیب سختافزار و نرمافزار به هواوی امکان داد تا بهطور کامل زنجیره محاسبات هوش مصنوعی را از تراشه تا ابزارهای توسعه تحت کنترل خود درآورد.
جایگاه فعلی در بازار جهانی
شرکت هواوی با وجود تحریمهای آمریکا، حضور خود را در بازار داخلی چین بهطور قابلتوجهی تقویت کرده است. گزارشها نشان میدهند که بسیاری از پروژههای ملی، مراکز تحقیقاتی و صنایع کلیدی اکنون از تراشههای Ascend استفاده میکنند. علاوه بر این، هواوی بهدنبال صادرات فناوری به کشورهای همپیمان چین است، اگرچه محدودیتهای زنجیره تأمین جهانی هنوز مانعی بزرگ به شمار میرود.
ترکیب قدرت سختافزاری و نرمافزاری هواوی باعث شده است که این شرکت یکی از معدود رقبای واقعی برای انویدیا در حوزه GPUهای هوش مصنوعی محسوب شود.
هواوی بهتازگی بهروزترین دستاورد خود در حوزه هوش مصنوعی، یعنی تراشه Ascend 910C را به همراه نسخه ارتقایافته چارچوب نرمافزاری MindSpore معرفی کرد. این مجموعه به طور خاص برای آموزش مدلهای زبانی بزرگ (LLM) طراحی شده است. این نسل جدید با استفاده از فناوری بستهبندی پیشرفته و بهینهسازی ارتباط میان تراشهها، سرعت آموزش مدلهای زبانی بزرگ را به طور چشمگیری افزایش داده است.
بر اساس آزمایشهای داخلی شرکت، تراشه Ascend 910C عملکردی نزدیک به پردازنده Nvidia A100 ارائه میدهد، در حالی که از لحاظ مصرف انرژی بهینهتر عمل میکند. این پیشرفت جدید، هواوی را در صف مقدم رقابت جهانی در حوزه هوش مصنوعی قرار داده و نشان میدهد که چین حتی در شرایط محدودیتهای شدید بینالمللی نیز میتواند فناوریهای پیشرفته خود را توسعه دهد.

محصولات شاخص HiSilicon Ascend
جدول زیر محصولات شاخص HiSilicon Ascend به همراه ویژگیهای هر یک را بیان میکند.
| مدل GPU | سال عرضه | فرایند تولید (نانومتر) | توان پردازشی (حدود) | عملکرد هدف (مقایسه با NVIDIA) | مصرف توان (حدود) | کاربردهای اصلی |
| Ascend 310 | 2018–2019 | 12 nm | ≈8 TFLOPS FP16 / 16 TOPS INT8 | Tesla T4 / Jetson Xavier (edge inference) | ~8 W | Edge AI، IoT، دوربین هوشمند |
| Ascend 910 | 2019 | 7 nm (TSMC) | ≈256 TFLOPS FP16 / 512 TOPS INT8 | NVIDIA V100 (training GPU همدوره) | ~350 W | دیتاسنتر، آموزش مدلهای بزرگ |
| Ascend 910B | 2023–2024 | 7 nm (SMIC) | مشابه یا کمی کمتر از 910 اصلی | نزدیک V100 / فاصله با A100 | ~300–350 W | دیتاسنتر داخلی چین (بدون وابستگی به TSMC) |
| Ascend 910C | 2025 | 7 nm (SMIC، چیپلت) | ≈60–80% توان H100 در برخی تستها | NVIDIA H100 | >350 W (بسته به ماژول) | آموزش و استقرار مدلهای LLM در چین |
| Ascend 910D | 2025 (آزمایشی) | 7 nm بهبود یافته | هدفگذاری بالاتر از 910C | بین H100 و نسل بعدی B100 | N/A (اطلاعات محدود) | دیتاسنتر، HPC، AI بزرگ |
| Ascend 920 | 2025 (اعلام) | 6 nm (SMIC) | هدف ~900 TFLOPS FP16 | NVIDIA H20 / GB200 کلاس | >400 W (پیشبینی) | HPC و آموزش مدلهای بسیار بزرگ |
7- Enflame Technology
| سال تأسیس | 2018 |
| دفتر مرکزی | Shanghai, China |
| وبسایت | https://www.enflame-tech.com/ |

Enflame Technology در سال ۲۰۱۸ در پکن تأسیس شد و هدف اصلی خود را توسعه شتابدهندههای هوش مصنوعی برای دیتاسنترها و کاربردهای ابری قرار داد. بنیانگذاران این شرکت از جمله مهندسان پیشین Huawei و Alibaba هستند که تجربه گستردهای در طراحی تراشههای AI و GPU دارند. از همان ابتدا، Enflame تلاش کرد تا با ارائه معماری بومی و نوآورانه، خلا فناوری داخلی چین در زمینه شتابدهندههای هوش مصنوعی را پر کند و وابستگی به محصولات خارجی را کاهش دهد.
محصولات شاخص Enflame شامل سری Flame است که از ابتدا برای پردازش موازی و محاسبات شبکههای عصبی طراحی شدند. نسل اول این تراشهها، با نام Flame-1، توانست عملکرد رقابتی با برخی GPUهای مرسوم ارائه دهد و در پروژههای تحقیقاتی و دیتاسنترهای داخلی به کار گرفته شود. سپس نسلهای بعدی شامل Flame-2 و Flame-3 عرضه شدند که بهبودهایی در زمینه کارایی انرژی، مقیاسپذیری چندتراشهای و پشتیبانی از مدلهای بزرگ یادگیری عمیق داشتند. این پیشرفتها باعث شد Enflame به سرعت در میان نوآوران صنعت نیمههادی چین شناخته شود.
بهروزترین دستاورد Enflame معرفی تراشه Flame-3X است که به طور ویژه برای آموزش مدلهای زبانی بزرگ (LLM) و استنتاج پیشرفته طراحی شده است. این تراشه با معماری ارتقایافته و پهنای باند حافظه بسیار بالا، قادر است پردازش دادههای عظیم را با سرعت بالا انجام دهد و مقیاسپذیری شبکههای عصبی را بهبود بخشد. آزمایشهای داخلی نشان میدهد Flame-3X توان رقابتی نزدیک به برخی GPUهای پرچمدار جهانی دارد و آن را به یکی از گزینههای کلیدی چین برای توسعه هوش مصنوعی مستقل تبدیل کرده است.
محصولات شاخص Inflame Technology
جدول زیر محصولات شاخص Inflame Technology به همراه ویژگیهای هر یک را بیان میکند.
| مدل محصول Enflame | سال عرضه / معرفی | فرایند تولید (نانومتر) | توان پردازشی (تقریبی) | عملکرد هدف (مقایسه با NVIDIA) | مصرف توان | کاربردهای اصلی |
| DTU 1.0 / CloudBlazer T10/T11 | ~ 2019–2020 (GlobalFoundries) | 12 nm FinFET (ServeTheHome) | ~20 TFLOPS FP32 ؛ ~80 TFLOPS FP16/BF16 (The Next Platform) | قابل مقایسه با NVIDIA V100 در کارهای FP32 / FP16 برای آموزش متوسط (The Next Platform) | بین ~225-300 وات | آموزش در دیتاسنتر؛ خوشههای بزرگ برای پردازش CNN/RNN و مدلهای معمول هوش مصنوعی |
| S60 | 2024 (TrendForce) | نامعلوم | نامعلوم | Infer/execution tasks — قابل مقایسه با NVIDIA A100 (برای inference) در کاریهایی با دقت نیمهدقیق و حجم زیاد داده ورودی | نامعلوم | کارت inference برای استنتاج سریع، مراکز ابری داخلی چین، تسکهای inference مدلهای بزرگ |
| L600 | 2025 (TrendForce) | نامعلوم | دارای حافظهٔ داخلی ~144 GB و پهنای باند حافظه ~3.6 TB/s (TrendForce) | طراحیشده تا عملکرد آموزشی + inference داشته باشه؛ تقریباً قابل مقایسه با NVIDIA H100 یا پایینتر در برخی تستها برای inference/training ترکیبی (TrendForce) | نامعلوم | جایگزین داخلی برای GPU های پیشرفته خارجی، مراکز داده، برای مدلهای بزرگ که هم آموزش و هم استنتاج نیاز دارد |
| Suisi 2.0 / Suisi 3.0 | Suisi 2.0: پیشرفتهتر در سالهای اخیر؛ Suisi 3.0 ≈ 2023 (Jon Peddie Research) | Suisi 2.0 بر پایهٔ 12 نانومتر TSMC اعلام شده در برخی گزارشها (Jon Peddie Research) | نامعلوم | قابل مقایسه با GPU های NVIDIA در رده متوسط-بهبالا آموزشی (مثلاً بین V100 / A100 بسته به مدل) (Jon Peddie Research) | نامعلوم | پروژههای AI cloud داخلی، سرویسدهندهها، مراکز داده داخلی چین |
8- Innosilicon (晶晨半导体)
| سال تأسیس | 2007 |
| دفتر مرکزی | Wuhan, Hubei Province, China |
| وبسایت | https://www.innosilicon.com/ |
![]()
Innosilicon در سال 2007 در چین تأسیس شد و یکی از قدیمیترین شرکتهای نیمههادی مستقل در این کشور به شمار میرود. این شرکت ابتدا با تمرکز بر طراحی GPU و پردازندههای گرافیکی برای کاربردهای مصرفی و سروری فعالیت میکرد و به سرعت توانست جایگاه خود را در بازار داخلی تثبیت کند. تیم تحقیق و توسعه Innosilicon شامل مهندسان با تجربه از بخشهای مختلف GPU و VLSI است که توانستهاند محصولات رقابتی با استانداردهای جهانی عرضه کنند.
محصولات شاخص این شرکت شامل سری Fantasy برای GPUهای عمومی و Dorado برای کاربردهای سروری و هوش مصنوعی است. نسلهای اولیه Fantasy بیشتر برای کاربران خانگی و گیمینگ طراحی شده بودند، در حالی که تراشههای Dorado توانایی پردازش موازی بالا و پشتیبانی از الگوریتمهای یادگیری عمیق را ارائه میدهند. Innosilicon با توسعه مستمر معماری داخلی خود، توانست عملکرد و بهرهوری انرژی تراشهها را در هر نسل بهبود بخشد و همزمان پشتیبانی از چارچوبهای نرمافزاری هوش مصنوعی را افزایش دهد.
این شرکت همچنین سرمایهگذاری گستردهای در توسعه نرمافزار و ابزارهای پشتیبانی انجام داده تا کاربران بتوانند از تراشههای آن برای مدلهای یادگیری عمیق و برنامههای محاسباتی پیچیده استفاده کنند. Innosilicon با همکاری دانشگاهها و مراکز تحقیقاتی در چین و برخی کشورها، در توسعه استانداردهای محاسبات موازی و GPU برای هوش مصنوعی نقش مهمی ایفا می کند. این ترکیب سختافزار و نرمافزار، به شرکت امکان میدهد در بازار رقابتی داخلی و منطقهای حضور داشته باشد.
جایگاه و دستاوردهای اخیر
Innosilicon بهتازگی با معرفی تراشه Dorado AI X1، بهروزترین دستاورد خود را ارائه کرده است. این تراشه را بهطور ویژه برای آموزش و استنتاج مدلهای بزرگ هوش مصنوعی طراحی کردهاند. Dorado AI X1 با بهرهگیری از معماری بهینهشده و پهنای باند حافظه بسیار بالا، میتواند پردازش میلیاردها پارامتر را با سرعت بالا انجام دهد. آزمایشها نشان میدهند که این تراشه عملکردی نزدیک به GPUهای پیشرفته جهانی ارائه میدهد و در عین حال مصرف انرژی بهینهتری دارد. این ویژگیها، Dorado AI X1 را به گزینهای جذاب برای مراکز داده و تحقیقات هوش مصنوعی در چین تبدیل کرده است.
محصولات شاخص Innosilicon
جدول زیر محصولات شاخص Innosilicon به همراه ویژگیهای هر یک را بیان میکند.
| مدل محصول Innosilicon | سال عرضه / معرفی | فرایند تولید (نانومتر) | توان پردازشی (تقریبی) | عملکرد هدف (مقایسه با NVIDIA) | مصرف توان (حدود) | کاربردهای اصلی |
|---|---|---|---|---|---|---|
| Fantasy One (Type A) | ~ 2021 | مشخص نشده دقیق؛ تراشه بر پایه IP BXT از Imagination Technologies | ≈ 5 TFLOPS FP32 برای Type A | قابل مقایسه با NVIDIA RTX 3060 برای پردازشهای عمومی گرافیکی / دسکتاپ سبک | ~۲۰ W برای رندر 4K / تا ~۵۰ W برای بارهای سنگینتر ابری (cloud rendering) | کارت گرافیک دسکتاپ / workstation برای کارهای گرافیکی، نمایش، دفتر، stream / cloud desktop / cloud rendering |
| Fantasy One (Type B) | ~ 2021 | همان پایه BXT، نسخهٔ دو GPU روی یک کارت مجزا | ≈ 10 TFLOPS FP32 (با دو GPU) | قابل مقایسه با بین RTX 3070-/RTX 3080 بسته به شرایط کار (گرافیک متوسط) | توان بیشتر از Type A؛ دقیقاً اعلام نشده اما قطعاً بالاتر از ~۵۰ W در بار سنگین و dual GPU | مراکز دادهٔ ابری، rendering، workstation سنگین، کارهایی نیازمند کارت با حافظه بیشتر و توان پردازشی بالاتر |
| Fantasy 2 | ~ 2022-2023 | اطلاعات دقیق پروسهٔ ساخت منتشر نشده؛ مدل low-power اعلام شده | توان FP32 منتشر شده ~۵ TFLOPS یا کمتر برای کاربرد روزمره گرافیک / نمایش سبک | قابل مقایسه با GPU گرافیکی ردهٔ پایین تا متوسط NVIDIA مثل RTX 3050 یا مشابه برای کارهای نمایش وینگرافیکی سبک | مصرف توان پایین (~۵-۱۵ W) برای کارهای سبک گرافیکی، سختتر برای بار سنگین بازی یا رندرینگ پیشرفته | کاربردهای گرافیکی سبک، نمایش، دسکتاپ، لپتاپ، دستگاههای کم مصرف، مصرف خانگی و office / multimedia |
9- Zhaoxin (兆芯)
| سال تأسیس | 2013 |
| دفتر مرکزی | Shanghai, China |
| وبسایت | http://www.zhaoxin.com |

Zhaoxin در سال 2013 با همکاری شرکت VIA Technologies تایوان و بخش تحقیق و توسعه صنایع نیمههادی چین تأسیس شد. هدف اولیه این شرکت توسعه پردازندههای x86 سازگار با استانداردهای جهانی بود تا چین بتواند به استقلال در طراحی CPU و GPU نزدیک شود. در ابتدا تمرکز Zhaoxin بیشتر روی پردازندههای دسکتاپ و سرور بود، اما با رشد نیاز به شتابدهندههای هوش مصنوعی، این شرکت مسیر خود را توسعه داده و وارد طراحی GPU و تراشههای محاسباتی شده است.
محصولات شاخص Zhaoxin شامل سریهای KaiXian و KX-6000 برای پردازندههای دسکتاپ و سرور است. این تراشهها با هدف ارائه عملکرد رقابتی و مصرف انرژی بهینه طراحی شدهاند و توانستهاند حضور خوبی در بازار داخلی چین پیدا کنند. نسلهای اخیر تراشههای Zhaoxin، بهبودهایی در زمینه پردازش موازی، پشتیبانی از دستورالعملهای SIMD و قابلیت ارتقای گرافیکی داشتهاند و زمینه را برای توسعه تراشههای هوش مصنوعی فراهم کردهاند.
علاوه بر تمرکز بر سختافزار، Zhaoxin سرمایهگذاری روی اکوسیستم نرمافزاری خود را نیز افزایش داده است. این شرکت ابزارهای توسعه و کتابخانههایی برای شتابدهی الگوریتمهای یادگیری ماشین ارائه کرده است تا توسعهدهندگان بتوانند از تراشههای Zhaoxin در پروژههای هوش مصنوعی و محاسبات پیشرفته استفاده کنند. همکاری با دانشگاهها و مراکز تحقیقاتی، همچنین باعث شده استانداردهای داخلی برای CPU و GPUهای AI شکل بگیرد و به تقویت اکوسیستم داخلی چین کمک کند.
جایگاه و دستاوردهای اخیر
در حال حاضر Zhaoxin بهعنوان یکی از بازیگران مهم بازار داخلی شناخته میشود و تراشههای این شرکت در مراکز داده، پروژههای تحقیقاتی و کاربردهای دولتی مورد استفاده قرار میگیرند. این شرکت با توسعه تراشههای نسل جدید، وارد رقابت با شرکتهای بزرگ بینالمللی در حوزه GPU و شتابدهندههای هوش مصنوعی شده و جایگاه خود را تثبیت نموده است.
Zhaoxin بهتازگی با معرفی سری ZX-AI 1000، بهروزترین دستاورد خود را ارائه کرده است. این تراشه را برای پردازش و آموزش مدلهای یادگیری عمیق طراحی کردهاند. ZX-AI 1000 با معماری بهینهشده و پهنای باند حافظه بالا، میتواند عملیات استنتاج و آموزش مدلهای LLM را با سرعت بالا و مصرف انرژی بهینه انجام دهد. آزمایشها نشان میدهند که این تراشه عملکردی رقابتی نزدیک به برخی GPUهای پیشرفته جهانی دارد و توانسته اعتماد مراکز داده داخلی چین را جلب کند. این موفقیت، ZX-AI 1000 را به نمادی از خودکفایی فناوری هوش مصنوعی چین تبدیل کرده است.
محصولات شاخص Zhaoxin
جدول زیر محصولات شاخص Zhaoxin به همراه ویژگیهای هر یک را بیان میکند.
| مدل محصول Zhaoxin | سال معرفی | فرایند تولید (نانومتر) | توان پردازشی (تقریبی) | عملکرد هدف (قابل مقایسه با NVIDIA) | مصرف توان تقریبی | کاربردهای اصلی |
| Glenfly Arise GT-10C0 (discrete GPU کمقدرت) | ~2022 | مشخص نیست دقیق (ظاهراً فرایند متوسط) | دارای 24 واحد محاسبه، فرکانس حدود 608 MHz، VRAM: 2GB (Tom’s Hardware) | بطور تقریبی قابل مقایسه با GTX 1030 یا حتی کمتر (در کارهای OpenCL عمومی) (Tom’s Hardware) | مصرف پایین، مناسب برای استفادهی دسکتاپ سبک / دفتر کار – دقیقاً اعلام نشده (HWCooling.net) | کاربردهای دفتر، نمایش ویدیو، وظایف گرافیکی سبک، مزاحمۀ بازی سنگین نیست |
| KX-6000G (APU با iGPU Glenfly / Genfly GT-10C0) | 2022 | 16 nm (Notebookcheck) | چهار هستهی CPU، فرکانس تا ~3.3 GHz، گرافیک داخلی با قابلیتهای OpenGL / DX12 و غیره (Notebookcheck) | قابل مقایسه با گرافیک iGPU سطح پایین NVIDIA / Intel مثل گرافیک مجتمع در CPUهای اقتصادی – برای گرافیک غیر بازی / مصرف عمومی (Notebookcheck) | TDP حدود 15 وات (Notebookcheck) | لپتاپ و کامپیوترهای کوچکتر با نیاز به مصرف انرژی کم، استفاده خانگی / دفتر / نمایشگر ویدیو و محتوای چندرسانهای |
| KX-7000 / KX-7000N (CPU با NPU یکپارچه برای AI PC) | 2025 | ساختار چیپلت، روند تولید گفته شده 7 nm برای برخی نسخهها (Wccftech) | هستههای CPU افزایش داشته، NPU برای inference محلی؛ مشخصات کامل توان پردازشی گرافیکی دقیق منتشر نشده (Notebookcheck) | هدف مقایسه با GPUهای مجتمع یا کارت گرافیکهای اقتصادی NVIDIA در وظایف inference و AI محلی، نه آموزش مدلهای بزرگ – تقریباً مقابل کارتهای پایین-رده / iGPUهای NVIDIA (igor´sLAB) | مصرف توان دقیق اعلام نشده، اما به احتمال زیاد بیشتر از نسخههای کممصرف؛ وابسته به پیکربندی دستگاه (desktop / AIPC) (Notebookcheck) | دسکتاپ AI-PCها، کارهای inference محلی، تولید محتوا، دستیارهای هوشمند، استفادهی عمومی با قابلیتهای AI داخلی |
10-ILUVATAR CoreX (天数智芯)
| سال تأسیس | 2015 |
| دفتر مرکزی | Shanghai, China |
| وبسایت | https://www.iluvatar.com/ |

شرکت ILUVATAR CoreX در سال 2015 در شانگهای تأسیس شد. بنیانگذاران آن گروهی از متخصصان حوزه نیمههادی و هوش مصنوعی بودند که سابقه فعالیت در شرکتهای بینالمللی داشتند. هدف اصلی شرکت توسعه پردازندههای گرافیکی و تراشههای هوش مصنوعی بومی بود تا چین بتواند جایگاهی مستقل در بازار جهانی بیابد. ILUVATAR با تمرکز بر نوآوری و سرمایهگذاری گسترده توانست بهسرعت توجه بازار را جلب کند.
از نخستین محصولات شاخص این شرکت میتوان به تراشههای سری BI اشاره کرد. نسل اول BI برای یادگیری عمیق و محاسبات ابری طراحی شد. این تراشه توانست عملکرد رقابتی با برخی GPUهای جهانی ارائه دهد. موفقیت سری BI نشان داد که چین ظرفیت توسعه GPUهای بومی قدرتمند را دارد. نسلهای بعدی BI با بهبودهای قابل توجه در معماری و مصرف انرژی عرضه شدند.
ILUVATAR علاوه بر سختافزار روی نرمافزار نیز سرمایهگذاری زیادی انجام داد. این شرکت ابزارها و کتابخانههایی برای یادگیری عمیق طراحی کرد که بهطور کامل با GPUهای خود هماهنگ بودند. چنین رویکردی امکان استفاده بهینه از توان پردازشی تراشهها را فراهم کرد. همچنین همکاری نزدیک با دانشگاهها و مراکز تحقیقاتی به شرکت کمک کرد محصولاتش را بر اساس نیازهای واقعی بازار توسعه دهد.
دستاورد اخیر در هوش مصنوعی
جدیدترین دستاورد ILUVATAR معرفی BI-V100 است. این GPU با معماری نوین توانست سرعت آموزش مدلهای زبانی بزرگ را به شکل چشمگیری افزایش دهد. BI-V100 علاوه بر قدرت بالا، مصرف انرژی بهینهای دارد که آن را برای مراکز داده جذاب کرده است. این تراشه در پروژههای ملی چین برای توسعه LLMها به کار گرفته شد. عملکرد آن نشان میدهد ILUVATAR توانسته یکی از جدیترین رقبای داخلی برای انویدیا و AMD باشد. این پیشرفت اخیر جایگاه شرکت را در نقشه جهانی هوش مصنوعی پررنگتر کرده است.
محصولات شاخص ILUVATAR CoreX
جدول زیر محصولات شاخص ILUVATAR CoreX به همراه ویژگیهای هر یک را بیان میکند.
| مدل محصول | سال عرضه | فرآیند تولید | توان پردازشی (محاسبات) | عملکرد هدف (قابل مقایسه با) | مصرف توان (TDP) | کاربردهای اصلی |
|---|---|---|---|---|---|---|
| TianGai-100 (Big Island) | 2021 | 7 نانومتر | نامشخص | NVIDIA A100, AMD Instinct MI100 | نامشخص | آموزش هوش مصنوعی (AI Training) |
| Zhikai-100 | 2022 | 7 نانومتر | نامشخص | استنتاج هوش مصنوعی (AI Inference) | نامشخص | استنتاج هوش مصنوعی |
| V100 (در مستندات H3C) | نامشخص | نامشخص | نامشخص | NVIDIA T4 | نامشخص | مراکز داده و ابری |




