บริษัท DeepSeek ซึ่งเป็นสตาร์ทอัพด้าน AI ของจีนที่ได้พัฒนาโมเดล AI ที่มีประสิทธิภาพสูงแต่ใช้ทรัพยากรการประมวลผลน้อยลงถึง 11 เท่า!! เมื่อเทียบกับโมเดลชั้นนำอื่นๆ เช่น GPT-4x และ Claude-3.5-Sonnet
DeepSeek ใช้ GPU Nvidia H800 จำนวน 2,048 ตัวในการฝึกโมเดล DeepSeek-V3 ที่มีพารามิเตอร์ 671 พันล้านตัวในเวลาเพียงสองเดือน โมเดลนี้ใช้เทคนิคการฝึกที่มีความแม่นยำต่ำ (FP8) และการปรับแต่งการสื่อสารเพื่อเพิ่มประสิทธิภาพการประมวลผล
https://www.tomshardware.com/tech-industry/artificial-intelligence/chinese-ai-company-says-breakthroughs-enabled-creating-a-leading-edge-ai-model-with-11x-less-compute-deepseeks-optimizations-highlight-limits-of-us-sanctions
DeepSeek ใช้ GPU Nvidia H800 จำนวน 2,048 ตัวในการฝึกโมเดล DeepSeek-V3 ที่มีพารามิเตอร์ 671 พันล้านตัวในเวลาเพียงสองเดือน โมเดลนี้ใช้เทคนิคการฝึกที่มีความแม่นยำต่ำ (FP8) และการปรับแต่งการสื่อสารเพื่อเพิ่มประสิทธิภาพการประมวลผล
https://www.tomshardware.com/tech-industry/artificial-intelligence/chinese-ai-company-says-breakthroughs-enabled-creating-a-leading-edge-ai-model-with-11x-less-compute-deepseeks-optimizations-highlight-limits-of-us-sanctions
บริษัท DeepSeek ซึ่งเป็นสตาร์ทอัพด้าน AI ของจีนที่ได้พัฒนาโมเดล AI ที่มีประสิทธิภาพสูงแต่ใช้ทรัพยากรการประมวลผลน้อยลงถึง 11 เท่า!! เมื่อเทียบกับโมเดลชั้นนำอื่นๆ เช่น GPT-4x และ Claude-3.5-Sonnet
DeepSeek ใช้ GPU Nvidia H800 จำนวน 2,048 ตัวในการฝึกโมเดล DeepSeek-V3 ที่มีพารามิเตอร์ 671 พันล้านตัวในเวลาเพียงสองเดือน โมเดลนี้ใช้เทคนิคการฝึกที่มีความแม่นยำต่ำ (FP8) และการปรับแต่งการสื่อสารเพื่อเพิ่มประสิทธิภาพการประมวลผล
https://www.tomshardware.com/tech-industry/artificial-intelligence/chinese-ai-company-says-breakthroughs-enabled-creating-a-leading-edge-ai-model-with-11x-less-compute-deepseeks-optimizations-highlight-limits-of-us-sanctions
0 ความคิดเห็น
0 การแบ่งปัน
120 มุมมอง
0 รีวิว