āđāļĢāļ·āđāļāļāđāļĨāđāļēāļāļēāļāļāđāļēāļ§: Huawei CloudMatrix 384—AI āļāļđāđāļāļāļĢāđāļāļĨāļąāļŠāđāļāļāļĢāđāļāļĩāđāļāđāļēāļāļ Nvidia āļāđāļ§āļĒāļāļĨāļąāļāđāļŦāđāļāļāļēāļĢāļĢāļ§āļĄāļāļīāļ
āđāļāļāļēāļ World Artificial Intelligence Conference 2025 āļāļĩāđāđāļāļĩāđāļĒāļāđāļŪāđ Huawei āđāļāđāđāļāļīāļāļāļąāļ§āļĢāļ°āļāļ CloudMatrix 384 āļāļķāđāļāđāļāđāļāļāļđāđāļāļāļĢāđāļāļĨāļąāļŠāđāļāļāļĢāđ AI āļāļĩāđāļāļĢāļ°āļāļāļāļāđāļ§āļĒāļāļīāļ Ascend 910C āļāļģāļāļ§āļ 384 āļāļąāļ§ āđāļāļ·āđāļāļĄāļāđāļāļāļąāļāļāđāļ§āļĒāđāļāļĢāļāļŠāļĢāđāļēāļāđāļāļ “all-to-all mesh” āļāđāļēāļāļŠāļēāļĒāļāļāļāļāļīāļāļāļ§āļēāļĄāđāļĢāđāļ§āļŠāļđāļ
āđāļĄāđāļāļīāļāđāļāđāļĨāļ°āļāļąāļ§āļāļ°āļĄāļĩāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļāđāļģāļāļ§āđāļē Nvidia H100 āđāļāđ Huawei āđāļāđāļāļĨāļĒāļļāļāļāđ “āļāļģāļāļ§āļāļĄāļēāļ + āļāļēāļĢāļāļāļāđāļāļāļĢāļ°āļāļ” āđāļāļ·āđāļāļāļāđāļāļĒāļāđāļāđāļŠāļĩāļĒ āđāļĨāļ°āļŠāļēāļĄāļēāļĢāļāđāļŦāđāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļĢāļ§āļĄāļŠāļđāļāļāļ§āđāļēāļĢāļ°āļāļ Nvidia GB200 NVL72 āđāļāđāđāļāļŦāļĨāļēāļĒāļāđāļēāļ āđāļāđāļ:
- āļāļ§āļēāļĄāđāļĢāđāļ§āđāļāļāļēāļĢāļāļĢāļ°āļĄāļ§āļĨāļāļĨ BF16 āļŠāļđāļāļāļ§āđāļē 1.7 āđāļāđāļē
- āļāļ§āļēāļĄāļāļļāļŦāļāđāļ§āļĒāļāļ§āļēāļĄāļāļģāļŠāļđāļāļāļ§āđāļē 3.6 āđāļāđāļē
- āđāļāļāļāđāļ§āļīāļāļāđāļŦāļāđāļ§āļĒāļāļ§āļēāļĄāļāļģāļŠāļđāļāļāļ§āđāļē 2.1 āđāļāđāļē
āļāļĒāđāļēāļāđāļĢāļāđāļāļēāļĄ āļĢāļ°āļāļāļāļĩāđāđāļāđāļāļĨāļąāļāļāļēāļāļĄāļēāļāļāļ§āđāļēāļāļķāļ 3.9 āđāļāđāļē āđāļĨāļ°āļĄāļĩāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļāđāļāļ§āļąāļāļāđāļāđāļģāļāļ§āđāļēāļāļķāļ 2.3 āđāļāđāļē āļāļķāđāļāļāļēāļāđāļāđāļāļāđāļāļāļģāļāļąāļāļŠāļģāļāļąāļāđāļāļāļĨāļēāļāđāļĨāļ āđāļāđāļŠāļģāļŦāļĢāļąāļāļāļĩāļāļāļĩāđāļĄāļĩāđāļŦāļĨāđāļāļāļĨāļąāļāļāļēāļāļŦāļĨāļēāļāļŦāļĨāļēāļĒāđāļĨāļ°āļĢāļēāļāļēāļāļđāļ āļāļĩāđāļāļēāļāđāļĄāđāđāļāđāļāļąāļāļŦāļē
Huawei āđāļāļīāļāļāļąāļ§āļĢāļ°āļāļ CloudMatrix 384 āđāļāļāļēāļ WAIC 2025 āļāļĩāđāđāļāļĩāđāļĒāļāđāļŪāđ
āđāļāđāļāļīāļ Ascend 910C āļāļģāļāļ§āļ 384 āļāļąāļ§ āđāļāļ·āđāļāļĄāļāđāļāđāļāļ all-to-all mesh āļāđāļ§āļĒāļŠāļēāļĒāļāļāļāļāļīāļ
āļāļāļāđāļāļāļĄāļēāđāļāļ·āđāļāđāļāđāļāļāļąāļāļāļąāļ Nvidia GB200 NVL72
āļĢāļ°āļāļāļŠāļēāļĄāļēāļĢāļāļāļĢāļ°āļĄāļ§āļĨāļāļĨāđāļāđāļāļķāļ 300 PFLOPs āđāļāļ BF16
āļŠāļđāļāļāļ§āđāļē Nvidia GB200 NVL72 āļāļĩāđāļāļģāđāļāđ 180 PFLOPs
āđāļŦāļĄāļēāļ°āļŠāļģāļŦāļĢāļąāļāļāļēāļ inference āļāļāļāđāļĄāđāļāļĨāļāļāļēāļāđāļŦāļāđ
Ascend 910C āļĄāļĩāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļāļĢāļ°āļĄāļēāļ 60% āļāļāļ Nvidia H100 āđāļāļāļēāļ inference
āđāļāđāđāļāļāļāļīāļ dual-chiplet āđāļĨāļ°āļŦāļāđāļ§āļĒāļāļ§āļēāļĄāļāļģ HBM2E āļāļāļēāļ 128 GB
āļāļĨāļīāļāđāļāļĒ SMIC āļāđāļ§āļĒāđāļāļāđāļāđāļĨāļĒāļĩ 7nm āļĢāļļāđāļāđāļŦāļĄāđ
āļĢāļ°āļāļāļĄāļĩāļāļ§āļēāļĄāļāļļāļŦāļāđāļ§āļĒāļāļ§āļēāļĄāļāļģāļĢāļ§āļĄ 49.2 TB āđāļĨāļ°āđāļāļāļāđāļ§āļīāļāļāđāļĢāļ§āļĄ 1229 TB/s
āļŠāļđāļāļāļ§āđāļē Nvidia GB200 NVL72 āļāļķāļ 3.6 āđāļāđāļēāđāļāļāđāļēāļāļāļ§āļēāļĄāļāļļ āđāļĨāļ° 2.1 āđāļāđāļēāđāļāļāđāļēāļāđāļāļāļāđāļ§āļīāļāļāđ
āļĢāļāļāļĢāļąāļāļāļēāļĢāđāļāļ·āđāļāļĄāļāđāļāđāļāļ scale-out āđāļāđāļāļķāļ 165,000 NPU
āļĢāļ°āļāļ CloudMatrix 384 āļāļđāļāļāļīāļāļāļąāđāļāđāļĨāđāļ§āļāļ Huawei Cloud āđāļĨāļ°āļāļĢāđāļāļĄāđāļāđāļāļēāļāļāļĢāļīāļ
āđāļāđāđāļāļāļēāļ AI training āđāļĨāļ° inference āļĢāļ°āļāļąāļāļāļāļāđāļāļĢ
āđāļāđāļāļŠāđāļ§āļāļŦāļāļķāđāļāļāļāļāļĒāļļāļāļāļĻāļēāļŠāļāļĢāđāļĨāļāļāļēāļĢāļāļķāđāļāļāļēāđāļāļāđāļāđāļĨāļĒāļĩāļāđāļēāļāļāļēāļāļī
Nvidia GB200 NVL72 āđāļāđāļāļīāļ Grace CPU 36 āļāļąāļ§ āđāļĨāļ° Blackwell GPU 72 āļāļąāļ§
āļāļāļāđāļāļāđāļŦāđāļāļģāļāļēāļāļĢāđāļ§āļĄāļāļąāļāđāļāđāļ “GPU āļāļāļēāļāļĒāļąāļāļĐāđ” āļŠāļģāļŦāļĢāļąāļāđāļĄāđāļāļĨāļĢāļ°āļāļąāļāļĨāđāļēāļāļĨāđāļēāļāļāļēāļĢāļēāļĄāļīāđāļāļāļĢāđ
āļĄāļĩāļāđāļāļāļģāļāļąāļāļāđāļēāļāļāļēāļĢāļŠāđāļāļāļāļāđāļāļĒāļąāļāļāļĩāļ
Huawei āđāļāđāļŠāļēāļĒāļāļāļāļāļīāļ 800G LPO āļāļģāļāļ§āļ 6,912 āđāļŠāđāļāđāļāļāļēāļĢāđāļāļ·āđāļāļĄāļāđāļāļ āļēāļĒāđāļāļĢāļ°āļāļ
āļĨāļ latency āđāļĨāļ°āđāļāļīāđāļĄ bandwidth āđāļāđāļāļĒāđāļēāļāļĄāļŦāļēāļĻāļēāļĨ
āđāļāđāļāļāļēāļĢāļāļāļāđāļāļāļāļĩāđāđāļāđāļ “āļĢāļ°āļāļ” āļĄāļēāļāļāļ§āđāļēāļāļīāļāđāļāļĩāđāļĒāļ§
DeepSeek AI āđāļāđ Ascend 910C āļŠāļģāļŦāļĢāļąāļ inference āđāļĨāļ°āļāļāļ§āđāļēāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļ “āđāļāļīāļāļāļēāļ”
āđāļāđāđāļāļāļāļīāļāđāļāļĨāļ CUDA āđāļāđāļ CUNN āļāđāļ§āļĒāđāļāđāļāđāļāļĩāļĒāļāļāļĢāļĢāļāļąāļāđāļāļĩāļĒāļ§
āļāđāļ§āļĒāļĨāļāļāđāļāļāļļāļāđāļĨāļ°āļĨāļāļāļēāļĢāļāļķāđāļāļāļē Nvidia
āļāļĩāļāļāļģāļĨāļąāļāļāļĨāļąāļāļāļąāļ ecosystem āļāđāļēāļ AI āđāļāļāļāļĢāļāļ§āļāļāļĢ āļāļąāđāļāđāļāđāļāļīāļāļāļķāļāđāļĄāđāļāļĨ
āļĄāļĩāļāļēāļĢāļāļąāđāļāļāļąāļāļāļĄāļīāļāļĢāļĢāļ°āļŦāļ§āđāļēāļāļāļđāđāļāļĨāļīāļāļāļīāļāđāļĨāļ°āļāļąāļāļāļąāļāļāļē LLM
āđāļāđāļēāļŦāļĄāļēāļĒāļāļ·āļāļŠāļĢāđāļēāļāļĢāļ°āļāļ AI āļāļĩāđāđāļĄāđāļāđāļāļāļāļķāđāļāļāļēāļāļ°āļ§āļąāļāļāļ
āļĢāļ°āļāļ CloudMatrix 384 āđāļāđāļāļĨāļąāļāļāļēāļāļĄāļēāļāļāļ§āđāļēāļĢāļ°āļāļ Nvidia āļāļķāļ 3.9 āđāļāđāļē
āļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļāđāļāļ§āļąāļāļāđāļāđāļģāļāļ§āđāļē Nvidia āļāļķāļ 2.3 āđāļāđāļē
āļāļēāļāđāļĄāđāđāļŦāļĄāļēāļ°āļāļąāļāļāļĢāļ°āđāļāļĻāļāļĩāđāļĄāļĩāļāđāļāļāļģāļāļąāļāļāđāļēāļāļāļĨāļąāļāļāļēāļ
āļāļīāļ Ascend 910C āļĒāļąāļāđāļĄāđāļŠāļēāļĄāļēāļĢāļāđāļāļĩāļĒāļāđāļāđāļē Nvidia H100 āđāļāļāļēāļ training
āđāļŦāļĄāļēāļ°āļāļąāļ inference āļĄāļēāļāļāļ§āđāļē training āļāļĩāđāļāđāļāļāđāļāđāļāļ§āļēāļĄāđāļŠāļāļĩāļĒāļĢāļŠāļđāļ
āļĒāļąāļāļāļēāļ ecosystem āļāđāļēāļāļāļāļāļāđāđāļ§āļĢāđāļāļĩāđāđāļāļĩāļĒāļāđāļāđāļē CUDA
āļĢāļ°āļāļ CloudMatrix āļĒāļąāļāđāļĄāđāļĄāļĩ benchmark āļŠāļēāļāļēāļĢāļāļ°āļŦāļĢāļ·āļāļāļēāļĢāļāļāļŠāļāļāļāļēāļāļāļāļāđāļāļĢāļāļīāļŠāļĢāļ°
āļāđāļāļĄāļđāļĨāļŠāđāļ§āļāđāļŦāļāđāļĄāļēāļāļēāļ Huawei āđāļĨāļ° SemiAnalysis
āļāđāļāļāļĢāļāļāļēāļĢāļāļīāļŠāļđāļāļāđāļāļēāļāļāļēāļĢāđāļāđāļāļēāļāļāļĢāļīāļāđāļāļĢāļ°āļĒāļ°āļĒāļēāļ§
āļĢāļąāļāļāļēāļĨāļŠāļŦāļĢāļąāļāļŊ āđāļāļĢāļĩāļĒāļĄāļāļāļāļĄāļēāļāļĢāļāļēāļĢāļĨāļāđāļāļĐāļāļĢāļīāļĐāļąāļāļāļĩāđāđāļāđāļāļīāļ Ascend 910C āļāļąāđāļ§āđāļĨāļ
āļāđāļēāļāļ§āđāļēāđāļāđāđāļāļāđāļāđāļĨāļĒāļĩāļāļĩāđāļĄāļĩāļāđāļāļāļģāđāļāļīāļāļāļēāļāļŠāļŦāļĢāļąāļāļŊ
āļāļēāļāļŠāđāļāļāļĨāļāđāļāļāļĢāļīāļĐāļąāļāļāđāļēāļāļāļēāļāļīāļāļĩāđāļĢāđāļ§āļĄāđāļāđāļāļēāļāļĢāļ°āļāļāļāļĩāđ
https://www.techspot.com/news/108891-huawei-cloudmatrix-384-ai-system-poised-challenge-nvidia.html ðïļ āđāļĢāļ·āđāļāļāđāļĨāđāļēāļāļēāļāļāđāļēāļ§: Huawei CloudMatrix 384—AI āļāļđāđāļāļāļĢāđāļāļĨāļąāļŠāđāļāļāļĢāđāļāļĩāđāļāđāļēāļāļ Nvidia āļāđāļ§āļĒāļāļĨāļąāļāđāļŦāđāļāļāļēāļĢāļĢāļ§āļĄāļāļīāļ
āđāļāļāļēāļ World Artificial Intelligence Conference 2025 āļāļĩāđāđāļāļĩāđāļĒāļāđāļŪāđ Huawei āđāļāđāđāļāļīāļāļāļąāļ§āļĢāļ°āļāļ CloudMatrix 384 āļāļķāđāļāđāļāđāļāļāļđāđāļāļāļĢāđāļāļĨāļąāļŠāđāļāļāļĢāđ AI āļāļĩāđāļāļĢāļ°āļāļāļāļāđāļ§āļĒāļāļīāļ Ascend 910C āļāļģāļāļ§āļ 384 āļāļąāļ§ āđāļāļ·āđāļāļĄāļāđāļāļāļąāļāļāđāļ§āļĒāđāļāļĢāļāļŠāļĢāđāļēāļāđāļāļ “all-to-all mesh” āļāđāļēāļāļŠāļēāļĒāļāļāļāļāļīāļāļāļ§āļēāļĄāđāļĢāđāļ§āļŠāļđāļ
āđāļĄāđāļāļīāļāđāļāđāļĨāļ°āļāļąāļ§āļāļ°āļĄāļĩāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļāđāļģāļāļ§āđāļē Nvidia H100 āđāļāđ Huawei āđāļāđāļāļĨāļĒāļļāļāļāđ “āļāļģāļāļ§āļāļĄāļēāļ + āļāļēāļĢāļāļāļāđāļāļāļĢāļ°āļāļ” āđāļāļ·āđāļāļāļāđāļāļĒāļāđāļāđāļŠāļĩāļĒ āđāļĨāļ°āļŠāļēāļĄāļēāļĢāļāđāļŦāđāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļĢāļ§āļĄāļŠāļđāļāļāļ§āđāļēāļĢāļ°āļāļ Nvidia GB200 NVL72 āđāļāđāđāļāļŦāļĨāļēāļĒāļāđāļēāļ āđāļāđāļ:
- āļāļ§āļēāļĄāđāļĢāđāļ§āđāļāļāļēāļĢāļāļĢāļ°āļĄāļ§āļĨāļāļĨ BF16 āļŠāļđāļāļāļ§āđāļē 1.7 āđāļāđāļē
- āļāļ§āļēāļĄāļāļļāļŦāļāđāļ§āļĒāļāļ§āļēāļĄāļāļģāļŠāļđāļāļāļ§āđāļē 3.6 āđāļāđāļē
- āđāļāļāļāđāļ§āļīāļāļāđāļŦāļāđāļ§āļĒāļāļ§āļēāļĄāļāļģāļŠāļđāļāļāļ§āđāļē 2.1 āđāļāđāļē
āļāļĒāđāļēāļāđāļĢāļāđāļāļēāļĄ āļĢāļ°āļāļāļāļĩāđāđāļāđāļāļĨāļąāļāļāļēāļāļĄāļēāļāļāļ§āđāļēāļāļķāļ 3.9 āđāļāđāļē āđāļĨāļ°āļĄāļĩāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļāđāļāļ§āļąāļāļāđāļāđāļģāļāļ§āđāļēāļāļķāļ 2.3 āđāļāđāļē āļāļķāđāļāļāļēāļāđāļāđāļāļāđāļāļāļģāļāļąāļāļŠāļģāļāļąāļāđāļāļāļĨāļēāļāđāļĨāļ āđāļāđāļŠāļģāļŦāļĢāļąāļāļāļĩāļāļāļĩāđāļĄāļĩāđāļŦāļĨāđāļāļāļĨāļąāļāļāļēāļāļŦāļĨāļēāļāļŦāļĨāļēāļĒāđāļĨāļ°āļĢāļēāļāļēāļāļđāļ āļāļĩāđāļāļēāļāđāļĄāđāđāļāđāļāļąāļāļŦāļē
â
Huawei āđāļāļīāļāļāļąāļ§āļĢāļ°āļāļ CloudMatrix 384 āđāļāļāļēāļ WAIC 2025 āļāļĩāđāđāļāļĩāđāļĒāļāđāļŪāđ
âĄïļ āđāļāđāļāļīāļ Ascend 910C āļāļģāļāļ§āļ 384 āļāļąāļ§ āđāļāļ·āđāļāļĄāļāđāļāđāļāļ all-to-all mesh āļāđāļ§āļĒāļŠāļēāļĒāļāļāļāļāļīāļ
âĄïļ āļāļāļāđāļāļāļĄāļēāđāļāļ·āđāļāđāļāđāļāļāļąāļāļāļąāļ Nvidia GB200 NVL72
â
āļĢāļ°āļāļāļŠāļēāļĄāļēāļĢāļāļāļĢāļ°āļĄāļ§āļĨāļāļĨāđāļāđāļāļķāļ 300 PFLOPs āđāļāļ BF16
âĄïļ āļŠāļđāļāļāļ§āđāļē Nvidia GB200 NVL72 āļāļĩāđāļāļģāđāļāđ 180 PFLOPs
âĄïļ āđāļŦāļĄāļēāļ°āļŠāļģāļŦāļĢāļąāļāļāļēāļ inference āļāļāļāđāļĄāđāļāļĨāļāļāļēāļāđāļŦāļāđ
â
Ascend 910C āļĄāļĩāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļāļĢāļ°āļĄāļēāļ 60% āļāļāļ Nvidia H100 āđāļāļāļēāļ inference
âĄïļ āđāļāđāđāļāļāļāļīāļ dual-chiplet āđāļĨāļ°āļŦāļāđāļ§āļĒāļāļ§āļēāļĄāļāļģ HBM2E āļāļāļēāļ 128 GB
âĄïļ āļāļĨāļīāļāđāļāļĒ SMIC āļāđāļ§āļĒāđāļāļāđāļāđāļĨāļĒāļĩ 7nm āļĢāļļāđāļāđāļŦāļĄāđ
â
āļĢāļ°āļāļāļĄāļĩāļāļ§āļēāļĄāļāļļāļŦāļāđāļ§āļĒāļāļ§āļēāļĄāļāļģāļĢāļ§āļĄ 49.2 TB āđāļĨāļ°āđāļāļāļāđāļ§āļīāļāļāđāļĢāļ§āļĄ 1229 TB/s
âĄïļ āļŠāļđāļāļāļ§āđāļē Nvidia GB200 NVL72 āļāļķāļ 3.6 āđāļāđāļēāđāļāļāđāļēāļāļāļ§āļēāļĄāļāļļ āđāļĨāļ° 2.1 āđāļāđāļēāđāļāļāđāļēāļāđāļāļāļāđāļ§āļīāļāļāđ
âĄïļ āļĢāļāļāļĢāļąāļāļāļēāļĢāđāļāļ·āđāļāļĄāļāđāļāđāļāļ scale-out āđāļāđāļāļķāļ 165,000 NPU
â
āļĢāļ°āļāļ CloudMatrix 384 āļāļđāļāļāļīāļāļāļąāđāļāđāļĨāđāļ§āļāļ Huawei Cloud āđāļĨāļ°āļāļĢāđāļāļĄāđāļāđāļāļēāļāļāļĢāļīāļ
âĄïļ āđāļāđāđāļāļāļēāļ AI training āđāļĨāļ° inference āļĢāļ°āļāļąāļāļāļāļāđāļāļĢ
âĄïļ āđāļāđāļāļŠāđāļ§āļāļŦāļāļķāđāļāļāļāļāļĒāļļāļāļāļĻāļēāļŠāļāļĢāđāļĨāļāļāļēāļĢāļāļķāđāļāļāļēāđāļāļāđāļāđāļĨāļĒāļĩāļāđāļēāļāļāļēāļāļī
â
Nvidia GB200 NVL72 āđāļāđāļāļīāļ Grace CPU 36 āļāļąāļ§ āđāļĨāļ° Blackwell GPU 72 āļāļąāļ§
âĄïļ āļāļāļāđāļāļāđāļŦāđāļāļģāļāļēāļāļĢāđāļ§āļĄāļāļąāļāđāļāđāļ “GPU āļāļāļēāļāļĒāļąāļāļĐāđ” āļŠāļģāļŦāļĢāļąāļāđāļĄāđāļāļĨāļĢāļ°āļāļąāļāļĨāđāļēāļāļĨāđāļēāļāļāļēāļĢāļēāļĄāļīāđāļāļāļĢāđ
âĄïļ āļĄāļĩāļāđāļāļāļģāļāļąāļāļāđāļēāļāļāļēāļĢāļŠāđāļāļāļāļāđāļāļĒāļąāļāļāļĩāļ
â
Huawei āđāļāđāļŠāļēāļĒāļāļāļāļāļīāļ 800G LPO āļāļģāļāļ§āļ 6,912 āđāļŠāđāļāđāļāļāļēāļĢāđāļāļ·āđāļāļĄāļāđāļāļ āļēāļĒāđāļāļĢāļ°āļāļ
âĄïļ āļĨāļ latency āđāļĨāļ°āđāļāļīāđāļĄ bandwidth āđāļāđāļāļĒāđāļēāļāļĄāļŦāļēāļĻāļēāļĨ
âĄïļ āđāļāđāļāļāļēāļĢāļāļāļāđāļāļāļāļĩāđāđāļāđāļ “āļĢāļ°āļāļ” āļĄāļēāļāļāļ§āđāļēāļāļīāļāđāļāļĩāđāļĒāļ§
â
DeepSeek AI āđāļāđ Ascend 910C āļŠāļģāļŦāļĢāļąāļ inference āđāļĨāļ°āļāļāļ§āđāļēāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļ “āđāļāļīāļāļāļēāļ”
âĄïļ āđāļāđāđāļāļāļāļīāļāđāļāļĨāļ CUDA āđāļāđāļ CUNN āļāđāļ§āļĒāđāļāđāļāđāļāļĩāļĒāļāļāļĢāļĢāļāļąāļāđāļāļĩāļĒāļ§
âĄïļ āļāđāļ§āļĒāļĨāļāļāđāļāļāļļāļāđāļĨāļ°āļĨāļāļāļēāļĢāļāļķāđāļāļāļē Nvidia
â
āļāļĩāļāļāļģāļĨāļąāļāļāļĨāļąāļāļāļąāļ ecosystem āļāđāļēāļ AI āđāļāļāļāļĢāļāļ§āļāļāļĢ āļāļąāđāļāđāļāđāļāļīāļāļāļķāļāđāļĄāđāļāļĨ
âĄïļ āļĄāļĩāļāļēāļĢāļāļąāđāļāļāļąāļāļāļĄāļīāļāļĢāļĢāļ°āļŦāļ§āđāļēāļāļāļđāđāļāļĨāļīāļāļāļīāļāđāļĨāļ°āļāļąāļāļāļąāļāļāļē LLM
âĄïļ āđāļāđāļēāļŦāļĄāļēāļĒāļāļ·āļāļŠāļĢāđāļēāļāļĢāļ°āļāļ AI āļāļĩāđāđāļĄāđāļāđāļāļāļāļķāđāļāļāļēāļāļ°āļ§āļąāļāļāļ
âžïļ āļĢāļ°āļāļ CloudMatrix 384 āđāļāđāļāļĨāļąāļāļāļēāļāļĄāļēāļāļāļ§āđāļēāļĢāļ°āļāļ Nvidia āļāļķāļ 3.9 āđāļāđāļē
â āļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļāļāđāļāļ§āļąāļāļāđāļāđāļģāļāļ§āđāļē Nvidia āļāļķāļ 2.3 āđāļāđāļē
â āļāļēāļāđāļĄāđāđāļŦāļĄāļēāļ°āļāļąāļāļāļĢāļ°āđāļāļĻāļāļĩāđāļĄāļĩāļāđāļāļāļģāļāļąāļāļāđāļēāļāļāļĨāļąāļāļāļēāļ
âžïļ āļāļīāļ Ascend 910C āļĒāļąāļāđāļĄāđāļŠāļēāļĄāļēāļĢāļāđāļāļĩāļĒāļāđāļāđāļē Nvidia H100 āđāļāļāļēāļ training
â āđāļŦāļĄāļēāļ°āļāļąāļ inference āļĄāļēāļāļāļ§āđāļē training āļāļĩāđāļāđāļāļāđāļāđāļāļ§āļēāļĄāđāļŠāļāļĩāļĒāļĢāļŠāļđāļ
â āļĒāļąāļāļāļēāļ ecosystem āļāđāļēāļāļāļāļāļāđāđāļ§āļĢāđāļāļĩāđāđāļāļĩāļĒāļāđāļāđāļē CUDA
âžïļ āļĢāļ°āļāļ CloudMatrix āļĒāļąāļāđāļĄāđāļĄāļĩ benchmark āļŠāļēāļāļēāļĢāļāļ°āļŦāļĢāļ·āļāļāļēāļĢāļāļāļŠāļāļāļāļēāļāļāļāļāđāļāļĢāļāļīāļŠāļĢāļ°
â āļāđāļāļĄāļđāļĨāļŠāđāļ§āļāđāļŦāļāđāļĄāļēāļāļēāļ Huawei āđāļĨāļ° SemiAnalysis
â āļāđāļāļāļĢāļāļāļēāļĢāļāļīāļŠāļđāļāļāđāļāļēāļāļāļēāļĢāđāļāđāļāļēāļāļāļĢāļīāļāđāļāļĢāļ°āļĒāļ°āļĒāļēāļ§
âžïļ āļĢāļąāļāļāļēāļĨāļŠāļŦāļĢāļąāļāļŊ āđāļāļĢāļĩāļĒāļĄāļāļāļāļĄāļēāļāļĢāļāļēāļĢāļĨāļāđāļāļĐāļāļĢāļīāļĐāļąāļāļāļĩāđāđāļāđāļāļīāļ Ascend 910C āļāļąāđāļ§āđāļĨāļ
â āļāđāļēāļāļ§āđāļēāđāļāđāđāļāļāđāļāđāļĨāļĒāļĩāļāļĩāđāļĄāļĩāļāđāļāļāļģāđāļāļīāļāļāļēāļāļŠāļŦāļĢāļąāļāļŊ
â āļāļēāļāļŠāđāļāļāļĨāļāđāļāļāļĢāļīāļĐāļąāļāļāđāļēāļāļāļēāļāļīāļāļĩāđāļĢāđāļ§āļĄāđāļāđāļāļēāļāļĢāļ°āļāļāļāļĩāđ
https://www.techspot.com/news/108891-huawei-cloudmatrix-384-ai-system-poised-challenge-nvidia.html