บริษัท DeepSeek ซึ่งเป็นสตาร์ทอัพด้าน AI ของจีนที่ได้พัฒนาโมเดล AI ที่มีประสิทธิภาพสูงแต่ใช้ทรัพยากรการประมวลผลน้อยลงถึง 11 เท่า!! เมื่อเทียบกับโมเดลชั้นนำอื่นๆ เช่น GPT-4x และ Claude-3.5-Sonnet

DeepSeek ใช้ GPU Nvidia H800 จำนวน 2,048 ตัวในการฝึกโมเดล DeepSeek-V3 ที่มีพารามิเตอร์ 671 พันล้านตัวในเวลาเพียงสองเดือน โมเดลนี้ใช้เทคนิคการฝึกที่มีความแม่นยำต่ำ (FP8) และการปรับแต่งการสื่อสารเพื่อเพิ่มประสิทธิภาพการประมวลผล

https://www.tomshardware.com/tech-industry/artificial-intelligence/chinese-ai-company-says-breakthroughs-enabled-creating-a-leading-edge-ai-model-with-11x-less-compute-deepseeks-optimizations-highlight-limits-of-us-sanctions
บริษัท DeepSeek ซึ่งเป็นสตาร์ทอัพด้าน AI ของจีนที่ได้พัฒนาโมเดล AI ที่มีประสิทธิภาพสูงแต่ใช้ทรัพยากรการประมวลผลน้อยลงถึง 11 เท่า!! เมื่อเทียบกับโมเดลชั้นนำอื่นๆ เช่น GPT-4x และ Claude-3.5-Sonnet DeepSeek ใช้ GPU Nvidia H800 จำนวน 2,048 ตัวในการฝึกโมเดล DeepSeek-V3 ที่มีพารามิเตอร์ 671 พันล้านตัวในเวลาเพียงสองเดือน โมเดลนี้ใช้เทคนิคการฝึกที่มีความแม่นยำต่ำ (FP8) และการปรับแต่งการสื่อสารเพื่อเพิ่มประสิทธิภาพการประมวลผล https://www.tomshardware.com/tech-industry/artificial-intelligence/chinese-ai-company-says-breakthroughs-enabled-creating-a-leading-edge-ai-model-with-11x-less-compute-deepseeks-optimizations-highlight-limits-of-us-sanctions
0 ความคิดเห็น 0 การแบ่งปัน 120 มุมมอง 0 รีวิว