Chinese AI company's AI model breakthrough highlights limits...

shared a link

2024-12-28 02:45:44 -

บริษัท DeepSeek ซึ่งเป็นสตาร์ทอัพด้าน AI ของจีนที่ได้พัฒนาโมเดล AI ที่มีประสิทธิภาพสูงแต่ใช้ทรัพยากรการประมวลผลน้อยลงถึง 11 เท่า!! เมื่อเทียบกับโมเดลชั้นนำอื่นๆ เช่น GPT-4x และ Claude-3.5-Sonnet

DeepSeek ใช้ GPU Nvidia H800 จำนวน 2,048 ตัวในการฝึกโมเดล DeepSeek-V3 ที่มีพารามิเตอร์ 671 พันล้านตัวในเวลาเพียงสองเดือน โมเดลนี้ใช้เทคนิคการฝึกที่มีความแม่นยำต่ำ (FP8) และการปรับแต่งการสื่อสารเพื่อเพิ่มประสิทธิภาพการประมวลผล

https://www.tomshardware.com/tech-industry/artificial-intelligence/chinese-ai-company-says-breakthroughs-enabled-creating-a-leading-edge-ai-model-with-11x-less-compute-deepseeks-optimizations-highlight-limits-of-us-sanctions

บริษัท DeepSeek ซึ่งเป็นสตาร์ทอัพด้าน AI ของจีนที่ได้พัฒนาโมเดล AI ที่มีประสิทธิภาพสูงแต่ใช้ทรัพยากรการประมวลผลน้อยลงถึง 11 เท่า!! เมื่อเทียบกับโมเดลชั้นนำอื่นๆ เช่น GPT-4x และ Claude-3.5-Sonnet DeepSeek ใช้ GPU Nvidia H800 จำนวน 2,048 ตัวในการฝึกโมเดล DeepSeek-V3 ที่มีพารามิเตอร์ 671 พันล้านตัวในเวลาเพียงสองเดือน โมเดลนี้ใช้เทคนิคการฝึกที่มีความแม่นยำต่ำ (FP8) และการปรับแต่งการสื่อสารเพื่อเพิ่มประสิทธิภาพการประมวลผล https://www.tomshardware.com/tech-industry/artificial-intelligence/chinese-ai-company-says-breakthroughs-enabled-creating-a-leading-edge-ai-model-with-11x-less-compute-deepseeks-optimizations-highlight-limits-of-us-sanctions

WWW.TOMSHARDWARE.COM

Chinese AI company's AI model breakthrough highlights limits of US sanctions

With a lot of optimizations and low-level programming.

0 Comments 0 Shares 255 Views 0 Reviews