ค้นหา | Thaitimes

ลุงบ้าคอม
2025-11-26 04:46:27 -

รวมข่าวจากเวบ TechRadar
#รวมข่าวIT #20251126 #TechRadar

Amazon ทุ่มงบ 50 พันล้านดอลลาร์เพื่อสร้างระบบ AI และ HPC สำหรับรัฐบาลสหรัฐฯ
เรื่องนี้เป็นการลงทุนครั้งใหญ่ของ Amazon ที่ต้องการยกระดับศักยภาพด้านการประมวลผลให้กับหน่วยงานรัฐบาลสหรัฐฯ โดยจะเน้นไปที่งานวิจัยทางวิทยาศาสตร์ ความมั่นคงไซเบอร์ พลังงาน และการแพทย์ การลงทุนนี้จะเพิ่มกำลังการประมวลผลกว่า 1.3 กิกะวัตต์ในระบบคลาวด์ของรัฐบาล ทำให้สามารถทำงานจำลองและวิเคราะห์ข้อมูลได้เร็วขึ้นมาก AWS CEO กล่าวว่านี่คือการเปิดทางให้หน่วยงานรัฐเข้าถึง AI ขั้นสูงเพื่อเร่งภารกิจสำคัญของประเทศ
https://www.techradar.com/pro/talk-about-an-upgrade-amazon-is-spending-usd50-billion-on-new-ai-and-hpc-hardware-for-the-us-government

ข่าวลือราคา iPhone พับได้ อาจสูงถึง $2,399 ทำให้ iPad Mini 8 ดูคุ้มกว่า
มีรายงานจาก Fubon Research ว่า iPhone รุ่นพับได้ที่คาดว่าจะเปิดตัวในปี 2026 อาจมีราคาสูงถึง $2,399 ซึ่งถือว่าแพงกว่าที่หลายคนคาดไว้ แม้จะมีข่าวดีว่าหน้าจออาจไร้รอยพับ แต่ราคาที่สูงขนาดนี้ทำให้หลายคนมองว่าซื้อ iPhone รุ่นปกติพร้อม iPad Mini 8 อาจจะคุ้มกว่า เพราะได้สองหน้าจอในราคาที่ใกล้เคียงกัน การเปิดตัวคาดว่าจะใช้ชื่อ “iPhone Fold” และอยู่ในขั้นตอนการทดสอบก่อนผลิตจริง
https://www.techradar.com/phones/iphone/if-the-latest-foldable-iphone-price-rumor-is-correct-the-ipad-mini-8-will-be-the-only-sensible-choice

ช่องโหว่ที่ซ่อนอยู่ในระบบ Cloud Security
บทความนี้ชี้ให้เห็นว่าการใช้ระบบคลาวด์หลายเจ้า (multicloud) และการนำ AI หรือ container มาใช้งาน ทำให้เกิดช่องโหว่ด้านความปลอดภัยที่องค์กรอาจมองไม่เห็น โดยเฉพาะการเคลื่อนย้ายข้อมูลภายใน (east-west traffic) และการส่งข้อมูลออกไปภายนอก (egress traffic) ที่มักไม่มีการควบคุมอย่างเข้มงวด ผู้เชี่ยวชาญเสนอแนวคิดใหม่ “Cloud Native Security Fabric” ที่ฝังระบบรักษาความปลอดภัยเข้าไปในโครงสร้างเครือข่ายโดยตรง เพื่อให้สามารถปรับตัวได้ตามการเปลี่ยนแปลงของ workload แบบเรียลไทม์
https://www.techradar.com/pro/the-hidden-gaps-in-your-cloud-security-fabric

Gemini 3 กับ Nano Banana Pro: AI ที่เปลี่ยนการแต่งภาพให้เหมือนงานศิลป์
Google เปิดตัวเครื่องมือแก้ไขภาพด้วย AI ที่ชื่อ Nano Banana Pro ซึ่งใช้พลังจาก Gemini 3 จุดเด่นคือสามารถปรับแสงเหมือนเปลี่ยนบรรยากาศจริง เช่น จากภาพธรรมดาให้กลายเป็นช่วง golden hour หรือเปลี่ยนฉากหลังโดยไม่ทำให้ตัวแบบดูหลุดออกจากภาพ นอกจากนี้ยังสามารถย้ายวัตถุหรือปรับโครงสร้างภาพได้อย่างสมจริง ทำให้การแก้ไขภาพซับซ้อนกลายเป็นเรื่องง่ายเพียงแค่บอกคำสั่งเหมือนเล่าให้คนเข้าใจ
https://www.techradar.com/ai-platforms-assistants/gemini/gemini-3s-nano-banana-pro-photo-editing-is-amazing-here-are-3-ways-to-make-the-most-of-it

สิ้นสุดการสนับสนุน vSphere 7: Broadcom ปรับโมเดลราคาใหม่จนลูกค้าหนักใจ
หลังจาก Broadcom เข้าซื้อ VMware ด้วยมูลค่า 61 พันล้านดอลลาร์ ก็มีการปรับเปลี่ยนครั้งใหญ่ ทั้งการยกเลิกการขายแบบ perpetual license และเปลี่ยนเป็น subscription bundles ทำให้ต้นทุนของลูกค้าเพิ่มขึ้นหลายเท่า การสิ้นสุดการสนับสนุน vSphere 7 ในเดือนตุลาคม 2025 ยิ่งสร้างแรงกดดันให้ธุรกิจต้องหาทางเลือกใหม่ หลายองค์กรเริ่มมองหาผู้ให้บริการรายอื่นหรือใช้ third-party support เพื่อคงระบบเดิมไว้โดยไม่ต้องจ่ายค่าใช้จ่ายสูงตามโมเดลใหม่
https://www.techradar.com/pro/vsphere-7-support-ends-the-challenges-of-broadcoms-new-licensing-and-pricing-models

Linux OS มียอดดาวน์โหลดทะลุหนึ่งล้านครั้งหลัง Windows 10 หมดการสนับสนุน
หลังจาก Microsoft ยุติการสนับสนุน Windows 10 ทำให้ผู้ใช้จำนวนมากหันไปหา Linux OS ทางเลือกใหม่ที่มีความปลอดภัยและเสถียร โดยมีรายงานว่ามียอดดาวน์โหลดทะลุหนึ่งล้านครั้งในเวลาไม่นาน ความนิยมนี้สะท้อนให้เห็นว่าผู้ใช้เริ่มมองหาทางเลือกที่ไม่ต้องพึ่งพา Windows และยังได้ฟีเจอร์ที่ทันสมัยพร้อมการอัปเดตต่อเนื่องจากชุมชนโอเพ่นซอร์ส
https://www.techradar.com/computing/windows/this-linux-os-has-got-a-million-downloads-since-windows-10-support-ended-should-microsoft-start-worrying-now

ChatGPT เปิดตัวฟีเจอร์ Agent ให้ผู้ใช้สั่งงานแล้วปล่อยให้ทำเอง
ฟีเจอร์ใหม่ของ ChatGPT ที่ชื่อว่า Agent ช่วยให้ผู้ใช้สามารถตั้งภารกิจ เช่น ค้นหาข้อมูลหรือจัดการงาน แล้วปล่อยให้ระบบทำงานต่อเองโดยไม่ต้องติดตามตลอดเวลา ถือเป็นการยกระดับจากการสนทนาแบบโต้ตอบไปสู่การทำงานอัตโนมัติเต็มรูปแบบ ทำให้ผู้ใช้สามารถโฟกัสกับงานอื่นได้ในขณะที่ AI ทำงานเบื้องหลัง
https://www.techradar.com/ai-platforms-assistants/chatgpt/chatgpts-agent-feature-lets-you-assign-tasks-and-walk-away-heres-how-it-works

มหาวิทยาลัย Harvard เผยข้อมูลรั่วไหลกระทบศิษย์เก่าและผู้บริจาค
Harvard University ประกาศว่ามีการโจมตีทางไซเบอร์ที่ทำให้ข้อมูลของศิษย์เก่าและผู้บริจาคถูกเข้าถึงโดยไม่ได้รับอนุญาต เหตุการณ์นี้สร้างความกังวลอย่างมากต่อความปลอดภัยของข้อมูลส่วนบุคคลและการเงินของผู้ที่เกี่ยวข้อง มหาวิทยาลัยกำลังดำเนินการตรวจสอบและเสริมมาตรการความปลอดภัยเพื่อป้องกันไม่ให้เกิดขึ้นอีก
https://www.techradar.com/pro/security/harvard-university-reveals-data-breach-hitting-alumni-and-donors

Zero Trust มี 3 ระดับความเร็วในการปรับใช้
แนวคิด Zero Trust ที่เน้นการตรวจสอบทุกการเข้าถึงระบบ ไม่ว่าจะมาจากภายในหรือภายนอกองค์กร ถูกแบ่งออกเป็น 3 ระดับความเร็วในการนำไปใช้ ได้แก่ ระดับเริ่มต้นที่เน้นการควบคุมพื้นฐาน ระดับกลางที่เริ่มใช้ระบบอัตโนมัติ และระดับสูงสุดที่ผสาน AI และการวิเคราะห์เชิงลึกเพื่อสร้างความปลอดภัยแบบครบวงจร องค์กรสามารถเลือกปรับใช้ตามความพร้อมและทรัพยากรที่มี
https://www.techradar.com/pro/the-three-speeds-of-zero-trust

iLamp พลังงานแสงอาทิตย์ เปลี่ยนเสาไฟให้กลายเป็นศูนย์กลาง AI
นวัตกรรมใหม่ที่ชื่อว่า iLamp ใช้พลังงานแสงอาทิตย์และติดตั้งระบบ AI ภายในเสาไฟ ทำให้สามารถทำหน้าที่มากกว่าแค่ให้แสงสว่าง เช่น การตรวจสอบสภาพแวดล้อม การเชื่อมต่อกับระบบเมืองอัจฉริยะ และการวิเคราะห์ข้อมูลแบบเรียลไทม์ ถือเป็นการเปลี่ยนเสาไฟธรรมดาให้กลายเป็นโครงสร้างพื้นฐานสำคัญของเมืองในอนาคต
https://www.techradar.com/ai-platforms-assistants/solar-powered-ilamp-turns-the-humble-lamppost-into-an-ai-hub

CEO Salesforce หันหลังให้ ChatGPT หันไปหา Gemini 3
Marc Benioff ซีอีโอของ Salesforce สร้างความฮือฮาเมื่อประกาศเลิกใช้ ChatGPT หลังจากได้ลอง Google Gemini 3 เพียงสองชั่วโมง เขายกย่อง Gemini 3 ว่าเหนือกว่าในด้านความเร็ว การให้เหตุผล และความสามารถแบบมัลติโหมดที่รองรับทั้งข้อความ ภาพ เสียง และวิดีโอ การเปลี่ยนใจครั้งนี้สะท้อนให้เห็นถึงการแข่งขันที่ดุเดือดในโลก AI และอาจส่งผลต่อทิศทางการใช้งาน AI ในองค์กรระดับโลก
https://www.techradar.com/ai-platforms-assistants/gemini/the-leap-is-insane-salesforce-ceo-swaps-chatgpt-for-gemini-3-and-says-hes-not-going-back

โน้ตบุ๊ก Geekom GeekBook X14 Pro เบาแต่แรง
Geekom เปิดตัวโน้ตบุ๊กใหม่ GeekBook X14 Pro ที่มีน้ำหนักไม่ถึงหนึ่งกิโลกรัม แต่สเปกจัดเต็มด้วย Intel Core Ultra 9 และ Intel Arc GPU ที่รองรับการเร่งผลกราฟิกด้วย AI หน้าจอ OLED ขนาด 14 นิ้ว ความละเอียด 2.8K พร้อมรีเฟรชเรต 120Hz ทำให้ภาพคมชัดและสดใส แบตเตอรี่ใช้งานได้ยาวนานถึง 16 ชั่วโมง และรองรับชาร์จเร็ว จุดเด่นคือความเบาและพกพาสะดวก แต่ยังคงประสิทธิภาพสูงสำหรับงานหนักและงานสร้างสรรค์
https://www.techradar.com/pro/geekoms-new-laptop-offers-a-bright-and-wide-screen-impressive-hardware-but-it-weighs-less-than-a-bag-of-sugar

บั๊ก Windows 11 เล่นงานการ์ดจอ Nvidia RTX 5090
การอัปเดต Windows 11 เดือนตุลาคมทำให้เกิดปัญหากับเกมเมอร์ โดยเฉพาะเกม Assassin’s Creed Shadows ที่เฟรมเรตตกลงถึง 50% แม้ใช้การ์ดจอระดับเทพ RTX 5090 Nvidia ต้องรีบออกแพตช์แก้ไขฉุกเฉิน แต่ยังไม่ชัดเจนว่าต้นเหตุจริง ๆ มาจาก Microsoft หรือ Nvidia เอง ปัญหานี้ทำให้ผู้ใช้หลายคนต้องหาทางแก้ชั่วคราว เช่น ปิดฟีเจอร์ Resizable Bar เพื่อให้เล่นเกมได้ลื่นขึ้น
https://www.techradar.com/computing/gpu/possible-windows-11-bug-with-nvidia-gpus-tanks-assassins-creed-shadows-performance-bringing-even-an-rtx-5090-to-its-knees

แฟนเทคโนโลยีย้อนยุคสร้างเครื่องอ่านเทปเจาะรู
นักประดิษฐ์สายเรโทรได้สร้างเครื่องอ่านเทปเจาะรูขึ้นใหม่ โดยใช้ไมโครคอนโทรลเลอร์และเซ็นเซอร์แสงสมัยใหม่แทนกลไกเก่า ๆ เครื่องนี้สามารถอ่านข้อมูลจากเทปกระดาษได้ แม้ความเร็วจะอยู่ที่ประมาณ 50 ไบต์ต่อวินาที ซึ่งถือว่าช้ามากเมื่อเทียบกับมาตรฐานปัจจุบัน แต่ก็เป็นการรื้อฟื้นเทคโนโลยีเก่าที่เคยมีบทบาทสำคัญในยุคแรกของคอมพิวเตอร์ จุดประสงค์หลักคือการทดลองและอนุรักษ์ ไม่ใช่การใช้งานจริง
https://www.techradar.com/pro/retro-computer-boffin-creates-a-freshly-created-perforated-tape-reader-just-dont-expect-high-data-reading-speeds

DeepSeek-R1 ผู้ช่วย AI จากจีนเริ่มสะดุด DeepSeek-R1 ที่เคยถูกยกย่องว่าเป็นดาวรุ่งแห่งวงการ AI ตอนนี้กลับถูกวิจารณ์หนัก เพราะไม่สามารถจัดการกับหัวข้ออ่อนไหวได้ดี แถมยังสร้างโค้ดที่ผิดพลาดและมีช่องโหว่ด้านความปลอดภัย นักพัฒนาองค์กรที่เคยหวังพึ่งพากลับต้องระวังมากขึ้น เพราะความผิดพลาดเหล่านี้อาจนำไปสู่หายนะด้านความปลอดภัยในระบบใหญ่ ๆ ได้ เรื่องนี้สะท้อนให้เห็นว่าการพัฒนา AI ไม่ใช่แค่เรื่องความฉลาด แต่ต้องมั่นคงและปลอดภัยด้วย https://www.techradar.com/pro/deepseek-took-off-as-an-ai-superstar-a-year-ago-but-could-it-also-be-a-major-security-risk-these-experts-think-so

แฮกเกอร์ปลอมตัวเป็นนักข่าว TechCrunch
มีการเปิดโปงว่าแฮกเกอร์จำนวนมากกำลังสวมรอยเป็นผู้สื่อข่าวจาก TechCrunch เพื่อหลอกบริษัทต่าง ๆ ให้เปิดเผยข้อมูลลับ ทั้งผ่านอีเมลและการโทรศัพท์ พวกเขาใช้ความน่าเชื่อถือของสื่อใหญ่เป็นเครื่องมือในการโจมตี ทำให้หลายองค์กรตกเป็นเหยื่อโดยไม่รู้ตัว เหตุการณ์นี้ตอกย้ำว่าการตรวจสอบแหล่งที่มาของการติดต่อเป็นสิ่งสำคัญอย่างยิ่งในยุคที่ข้อมูลคือทรัพย์สินล้ำค่า
https://www.techradar.com/pro/hackers-impersonate-techcrunch-reporters-to-steal-sensitive-information-but-you-can-always-trust-us

แผน AI ระดับโลกของรัฐบาล Trump
รัฐบาลสหรัฐภายใต้ Donald Trump ได้เปิดตัวแผนการครอบครองความเป็นผู้นำด้าน AI ระดับโลก โดยมีเป้าหมายผลักดันให้สหรัฐเป็นศูนย์กลางเทคโนโลยี AI ที่เหนือกว่าประเทศอื่น ๆ อย่างไรก็ตาม นักวิเคราะห์หลายคนตั้งคำถามว่าแผนนี้อาจมีช่องโหว่และความเสี่ยง ทั้งในด้านการเมือง เศรษฐกิจ และความปลอดภัย เพราะการเร่งรีบเพื่อครองความเป็นใหญ่ อาจนำไปสู่ผลลัพธ์ที่ไม่คาดคิด
https://www.techradar.com/ai-platforms-assistants/the-trump-administration-just-launched-its-own-plan-for-global-ai-dominance-and-what-could-go-wrong

Meta เปิดโปรแกรมแลกเปลี่ยน Ray-Ban Smart Glasses
Meta เปิดตัวโปรแกรมใหม่ที่ให้ผู้ใช้สามารถนำ AirPods มาแลกเป็นแว่นตาอัจฉริยะ Ray-Ban ได้ แต่มีเงื่อนไขบางอย่างที่ต้องระวัง เช่น รุ่นที่สามารถแลกได้ และข้อจำกัดในการใช้งาน แม้จะเป็นข้อเสนอที่น่าสนใจสำหรับคนที่อยากลองเทคโนโลยีใหม่ แต่ก็ไม่ใช่ทุกคนที่จะได้สิทธิ์นี้ทันที
https://www.techradar.com/computing/virtual-reality-augmented-reality/metas-new-ray-ban-trade-in-program-lets-you-swap-your-airpods-for-smart-glasses-but-theres-a-catch

📌📡🟢 รวมข่าวจากเวบ TechRadar 🟢📡📌 #รวมข่าวIT #20251126 #TechRadar 🖥️ Amazon ทุ่มงบ 50 พันล้านดอลลาร์เพื่อสร้างระบบ AI และ HPC สำหรับรัฐบาลสหรัฐฯ เรื่องนี้เป็นการลงทุนครั้งใหญ่ของ Amazon ที่ต้องการยกระดับศักยภาพด้านการประมวลผลให้กับหน่วยงานรัฐบาลสหรัฐฯ โดยจะเน้นไปที่งานวิจัยทางวิทยาศาสตร์ ความมั่นคงไซเบอร์ พลังงาน และการแพทย์ การลงทุนนี้จะเพิ่มกำลังการประมวลผลกว่า 1.3 กิกะวัตต์ในระบบคลาวด์ของรัฐบาล ทำให้สามารถทำงานจำลองและวิเคราะห์ข้อมูลได้เร็วขึ้นมาก AWS CEO กล่าวว่านี่คือการเปิดทางให้หน่วยงานรัฐเข้าถึง AI ขั้นสูงเพื่อเร่งภารกิจสำคัญของประเทศ 🔗 https://www.techradar.com/pro/talk-about-an-upgrade-amazon-is-spending-usd50-billion-on-new-ai-and-hpc-hardware-for-the-us-government 📱 ข่าวลือราคา iPhone พับได้ อาจสูงถึง $2,399 ทำให้ iPad Mini 8 ดูคุ้มกว่า มีรายงานจาก Fubon Research ว่า iPhone รุ่นพับได้ที่คาดว่าจะเปิดตัวในปี 2026 อาจมีราคาสูงถึง $2,399 ซึ่งถือว่าแพงกว่าที่หลายคนคาดไว้ แม้จะมีข่าวดีว่าหน้าจออาจไร้รอยพับ แต่ราคาที่สูงขนาดนี้ทำให้หลายคนมองว่าซื้อ iPhone รุ่นปกติพร้อม iPad Mini 8 อาจจะคุ้มกว่า เพราะได้สองหน้าจอในราคาที่ใกล้เคียงกัน การเปิดตัวคาดว่าจะใช้ชื่อ “iPhone Fold” และอยู่ในขั้นตอนการทดสอบก่อนผลิตจริง 🔗 https://www.techradar.com/phones/iphone/if-the-latest-foldable-iphone-price-rumor-is-correct-the-ipad-mini-8-will-be-the-only-sensible-choice 🔒 ช่องโหว่ที่ซ่อนอยู่ในระบบ Cloud Security บทความนี้ชี้ให้เห็นว่าการใช้ระบบคลาวด์หลายเจ้า (multicloud) และการนำ AI หรือ container มาใช้งาน ทำให้เกิดช่องโหว่ด้านความปลอดภัยที่องค์กรอาจมองไม่เห็น โดยเฉพาะการเคลื่อนย้ายข้อมูลภายใน (east-west traffic) และการส่งข้อมูลออกไปภายนอก (egress traffic) ที่มักไม่มีการควบคุมอย่างเข้มงวด ผู้เชี่ยวชาญเสนอแนวคิดใหม่ “Cloud Native Security Fabric” ที่ฝังระบบรักษาความปลอดภัยเข้าไปในโครงสร้างเครือข่ายโดยตรง เพื่อให้สามารถปรับตัวได้ตามการเปลี่ยนแปลงของ workload แบบเรียลไทม์ 🔗 https://www.techradar.com/pro/the-hidden-gaps-in-your-cloud-security-fabric 🎨 Gemini 3 กับ Nano Banana Pro: AI ที่เปลี่ยนการแต่งภาพให้เหมือนงานศิลป์ Google เปิดตัวเครื่องมือแก้ไขภาพด้วย AI ที่ชื่อ Nano Banana Pro ซึ่งใช้พลังจาก Gemini 3 จุดเด่นคือสามารถปรับแสงเหมือนเปลี่ยนบรรยากาศจริง เช่น จากภาพธรรมดาให้กลายเป็นช่วง golden hour หรือเปลี่ยนฉากหลังโดยไม่ทำให้ตัวแบบดูหลุดออกจากภาพ นอกจากนี้ยังสามารถย้ายวัตถุหรือปรับโครงสร้างภาพได้อย่างสมจริง ทำให้การแก้ไขภาพซับซ้อนกลายเป็นเรื่องง่ายเพียงแค่บอกคำสั่งเหมือนเล่าให้คนเข้าใจ 🔗 https://www.techradar.com/ai-platforms-assistants/gemini/gemini-3s-nano-banana-pro-photo-editing-is-amazing-here-are-3-ways-to-make-the-most-of-it 💸 สิ้นสุดการสนับสนุน vSphere 7: Broadcom ปรับโมเดลราคาใหม่จนลูกค้าหนักใจ หลังจาก Broadcom เข้าซื้อ VMware ด้วยมูลค่า 61 พันล้านดอลลาร์ ก็มีการปรับเปลี่ยนครั้งใหญ่ ทั้งการยกเลิกการขายแบบ perpetual license และเปลี่ยนเป็น subscription bundles ทำให้ต้นทุนของลูกค้าเพิ่มขึ้นหลายเท่า การสิ้นสุดการสนับสนุน vSphere 7 ในเดือนตุลาคม 2025 ยิ่งสร้างแรงกดดันให้ธุรกิจต้องหาทางเลือกใหม่ หลายองค์กรเริ่มมองหาผู้ให้บริการรายอื่นหรือใช้ third-party support เพื่อคงระบบเดิมไว้โดยไม่ต้องจ่ายค่าใช้จ่ายสูงตามโมเดลใหม่ 🔗 https://www.techradar.com/pro/vsphere-7-support-ends-the-challenges-of-broadcoms-new-licensing-and-pricing-models 🐧 Linux OS มียอดดาวน์โหลดทะลุหนึ่งล้านครั้งหลัง Windows 10 หมดการสนับสนุน หลังจาก Microsoft ยุติการสนับสนุน Windows 10 ทำให้ผู้ใช้จำนวนมากหันไปหา Linux OS ทางเลือกใหม่ที่มีความปลอดภัยและเสถียร โดยมีรายงานว่ามียอดดาวน์โหลดทะลุหนึ่งล้านครั้งในเวลาไม่นาน ความนิยมนี้สะท้อนให้เห็นว่าผู้ใช้เริ่มมองหาทางเลือกที่ไม่ต้องพึ่งพา Windows และยังได้ฟีเจอร์ที่ทันสมัยพร้อมการอัปเดตต่อเนื่องจากชุมชนโอเพ่นซอร์ส 🔗 https://www.techradar.com/computing/windows/this-linux-os-has-got-a-million-downloads-since-windows-10-support-ended-should-microsoft-start-worrying-now 🤖 ChatGPT เปิดตัวฟีเจอร์ Agent ให้ผู้ใช้สั่งงานแล้วปล่อยให้ทำเอง ฟีเจอร์ใหม่ของ ChatGPT ที่ชื่อว่า Agent ช่วยให้ผู้ใช้สามารถตั้งภารกิจ เช่น ค้นหาข้อมูลหรือจัดการงาน แล้วปล่อยให้ระบบทำงานต่อเองโดยไม่ต้องติดตามตลอดเวลา ถือเป็นการยกระดับจากการสนทนาแบบโต้ตอบไปสู่การทำงานอัตโนมัติเต็มรูปแบบ ทำให้ผู้ใช้สามารถโฟกัสกับงานอื่นได้ในขณะที่ AI ทำงานเบื้องหลัง 🔗 https://www.techradar.com/ai-platforms-assistants/chatgpt/chatgpts-agent-feature-lets-you-assign-tasks-and-walk-away-heres-how-it-works 🏫 มหาวิทยาลัย Harvard เผยข้อมูลรั่วไหลกระทบศิษย์เก่าและผู้บริจาค Harvard University ประกาศว่ามีการโจมตีทางไซเบอร์ที่ทำให้ข้อมูลของศิษย์เก่าและผู้บริจาคถูกเข้าถึงโดยไม่ได้รับอนุญาต เหตุการณ์นี้สร้างความกังวลอย่างมากต่อความปลอดภัยของข้อมูลส่วนบุคคลและการเงินของผู้ที่เกี่ยวข้อง มหาวิทยาลัยกำลังดำเนินการตรวจสอบและเสริมมาตรการความปลอดภัยเพื่อป้องกันไม่ให้เกิดขึ้นอีก 🔗 https://www.techradar.com/pro/security/harvard-university-reveals-data-breach-hitting-alumni-and-donors 🛡️ Zero Trust มี 3 ระดับความเร็วในการปรับใช้ แนวคิด Zero Trust ที่เน้นการตรวจสอบทุกการเข้าถึงระบบ ไม่ว่าจะมาจากภายในหรือภายนอกองค์กร ถูกแบ่งออกเป็น 3 ระดับความเร็วในการนำไปใช้ ได้แก่ ระดับเริ่มต้นที่เน้นการควบคุมพื้นฐาน ระดับกลางที่เริ่มใช้ระบบอัตโนมัติ และระดับสูงสุดที่ผสาน AI และการวิเคราะห์เชิงลึกเพื่อสร้างความปลอดภัยแบบครบวงจร องค์กรสามารถเลือกปรับใช้ตามความพร้อมและทรัพยากรที่มี 🔗 https://www.techradar.com/pro/the-three-speeds-of-zero-trust 🌞 iLamp พลังงานแสงอาทิตย์ เปลี่ยนเสาไฟให้กลายเป็นศูนย์กลาง AI นวัตกรรมใหม่ที่ชื่อว่า iLamp ใช้พลังงานแสงอาทิตย์และติดตั้งระบบ AI ภายในเสาไฟ ทำให้สามารถทำหน้าที่มากกว่าแค่ให้แสงสว่าง เช่น การตรวจสอบสภาพแวดล้อม การเชื่อมต่อกับระบบเมืองอัจฉริยะ และการวิเคราะห์ข้อมูลแบบเรียลไทม์ ถือเป็นการเปลี่ยนเสาไฟธรรมดาให้กลายเป็นโครงสร้างพื้นฐานสำคัญของเมืองในอนาคต 🔗 https://www.techradar.com/ai-platforms-assistants/solar-powered-ilamp-turns-the-humble-lamppost-into-an-ai-hub 🤖 CEO Salesforce หันหลังให้ ChatGPT หันไปหา Gemini 3 Marc Benioff ซีอีโอของ Salesforce สร้างความฮือฮาเมื่อประกาศเลิกใช้ ChatGPT หลังจากได้ลอง Google Gemini 3 เพียงสองชั่วโมง เขายกย่อง Gemini 3 ว่าเหนือกว่าในด้านความเร็ว การให้เหตุผล และความสามารถแบบมัลติโหมดที่รองรับทั้งข้อความ ภาพ เสียง และวิดีโอ การเปลี่ยนใจครั้งนี้สะท้อนให้เห็นถึงการแข่งขันที่ดุเดือดในโลก AI และอาจส่งผลต่อทิศทางการใช้งาน AI ในองค์กรระดับโลก 🔗 https://www.techradar.com/ai-platforms-assistants/gemini/the-leap-is-insane-salesforce-ceo-swaps-chatgpt-for-gemini-3-and-says-hes-not-going-back 💻 โน้ตบุ๊ก Geekom GeekBook X14 Pro เบาแต่แรง Geekom เปิดตัวโน้ตบุ๊กใหม่ GeekBook X14 Pro ที่มีน้ำหนักไม่ถึงหนึ่งกิโลกรัม แต่สเปกจัดเต็มด้วย Intel Core Ultra 9 และ Intel Arc GPU ที่รองรับการเร่งผลกราฟิกด้วย AI หน้าจอ OLED ขนาด 14 นิ้ว ความละเอียด 2.8K พร้อมรีเฟรชเรต 120Hz ทำให้ภาพคมชัดและสดใส แบตเตอรี่ใช้งานได้ยาวนานถึง 16 ชั่วโมง และรองรับชาร์จเร็ว จุดเด่นคือความเบาและพกพาสะดวก แต่ยังคงประสิทธิภาพสูงสำหรับงานหนักและงานสร้างสรรค์ 🔗 https://www.techradar.com/pro/geekoms-new-laptop-offers-a-bright-and-wide-screen-impressive-hardware-but-it-weighs-less-than-a-bag-of-sugar 🎮 บั๊ก Windows 11 เล่นงานการ์ดจอ Nvidia RTX 5090 การอัปเดต Windows 11 เดือนตุลาคมทำให้เกิดปัญหากับเกมเมอร์ โดยเฉพาะเกม Assassin’s Creed Shadows ที่เฟรมเรตตกลงถึง 50% แม้ใช้การ์ดจอระดับเทพ RTX 5090 Nvidia ต้องรีบออกแพตช์แก้ไขฉุกเฉิน แต่ยังไม่ชัดเจนว่าต้นเหตุจริง ๆ มาจาก Microsoft หรือ Nvidia เอง ปัญหานี้ทำให้ผู้ใช้หลายคนต้องหาทางแก้ชั่วคราว เช่น ปิดฟีเจอร์ Resizable Bar เพื่อให้เล่นเกมได้ลื่นขึ้น 🔗 https://www.techradar.com/computing/gpu/possible-windows-11-bug-with-nvidia-gpus-tanks-assassins-creed-shadows-performance-bringing-even-an-rtx-5090-to-its-knees 📼 แฟนเทคโนโลยีย้อนยุคสร้างเครื่องอ่านเทปเจาะรู นักประดิษฐ์สายเรโทรได้สร้างเครื่องอ่านเทปเจาะรูขึ้นใหม่ โดยใช้ไมโครคอนโทรลเลอร์และเซ็นเซอร์แสงสมัยใหม่แทนกลไกเก่า ๆ เครื่องนี้สามารถอ่านข้อมูลจากเทปกระดาษได้ แม้ความเร็วจะอยู่ที่ประมาณ 50 ไบต์ต่อวินาที ซึ่งถือว่าช้ามากเมื่อเทียบกับมาตรฐานปัจจุบัน แต่ก็เป็นการรื้อฟื้นเทคโนโลยีเก่าที่เคยมีบทบาทสำคัญในยุคแรกของคอมพิวเตอร์ จุดประสงค์หลักคือการทดลองและอนุรักษ์ ไม่ใช่การใช้งานจริง 🔗 https://www.techradar.com/pro/retro-computer-boffin-creates-a-freshly-created-perforated-tape-reader-just-dont-expect-high-data-reading-speeds 🧠 DeepSeek-R1 ผู้ช่วย AI จากจีนเริ่มสะดุด DeepSeek-R1 ที่เคยถูกยกย่องว่าเป็นดาวรุ่งแห่งวงการ AI ตอนนี้กลับถูกวิจารณ์หนัก เพราะไม่สามารถจัดการกับหัวข้ออ่อนไหวได้ดี แถมยังสร้างโค้ดที่ผิดพลาดและมีช่องโหว่ด้านความปลอดภัย นักพัฒนาองค์กรที่เคยหวังพึ่งพากลับต้องระวังมากขึ้น เพราะความผิดพลาดเหล่านี้อาจนำไปสู่หายนะด้านความปลอดภัยในระบบใหญ่ ๆ ได้ เรื่องนี้สะท้อนให้เห็นว่าการพัฒนา AI ไม่ใช่แค่เรื่องความฉลาด แต่ต้องมั่นคงและปลอดภัยด้วย 🔗 https://www.techradar.com/pro/deepseek-took-off-as-an-ai-superstar-a-year-ago-but-could-it-also-be-a-major-security-risk-these-experts-think-so 🕵️‍♂️ แฮกเกอร์ปลอมตัวเป็นนักข่าว TechCrunch มีการเปิดโปงว่าแฮกเกอร์จำนวนมากกำลังสวมรอยเป็นผู้สื่อข่าวจาก TechCrunch เพื่อหลอกบริษัทต่าง ๆ ให้เปิดเผยข้อมูลลับ ทั้งผ่านอีเมลและการโทรศัพท์ พวกเขาใช้ความน่าเชื่อถือของสื่อใหญ่เป็นเครื่องมือในการโจมตี ทำให้หลายองค์กรตกเป็นเหยื่อโดยไม่รู้ตัว เหตุการณ์นี้ตอกย้ำว่าการตรวจสอบแหล่งที่มาของการติดต่อเป็นสิ่งสำคัญอย่างยิ่งในยุคที่ข้อมูลคือทรัพย์สินล้ำค่า 🔗 https://www.techradar.com/pro/hackers-impersonate-techcrunch-reporters-to-steal-sensitive-information-but-you-can-always-trust-us 🌍 แผน AI ระดับโลกของรัฐบาล Trump รัฐบาลสหรัฐภายใต้ Donald Trump ได้เปิดตัวแผนการครอบครองความเป็นผู้นำด้าน AI ระดับโลก โดยมีเป้าหมายผลักดันให้สหรัฐเป็นศูนย์กลางเทคโนโลยี AI ที่เหนือกว่าประเทศอื่น ๆ อย่างไรก็ตาม นักวิเคราะห์หลายคนตั้งคำถามว่าแผนนี้อาจมีช่องโหว่และความเสี่ยง ทั้งในด้านการเมือง เศรษฐกิจ และความปลอดภัย เพราะการเร่งรีบเพื่อครองความเป็นใหญ่ อาจนำไปสู่ผลลัพธ์ที่ไม่คาดคิด 🔗 https://www.techradar.com/ai-platforms-assistants/the-trump-administration-just-launched-its-own-plan-for-global-ai-dominance-and-what-could-go-wrong 👓 Meta เปิดโปรแกรมแลกเปลี่ยน Ray-Ban Smart Glasses Meta เปิดตัวโปรแกรมใหม่ที่ให้ผู้ใช้สามารถนำ AirPods มาแลกเป็นแว่นตาอัจฉริยะ Ray-Ban ได้ แต่มีเงื่อนไขบางอย่างที่ต้องระวัง เช่น รุ่นที่สามารถแลกได้ และข้อจำกัดในการใช้งาน แม้จะเป็นข้อเสนอที่น่าสนใจสำหรับคนที่อยากลองเทคโนโลยีใหม่ แต่ก็ไม่ใช่ทุกคนที่จะได้สิทธิ์นี้ทันที 🔗 https://www.techradar.com/computing/virtual-reality-augmented-reality/metas-new-ray-ban-trade-in-program-lets-you-swap-your-airpods-for-smart-glasses-but-theres-a-catch

0 ความคิดเห็น 0 การแบ่งปัน 184 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-11-12 05:52:08 -

หัวข้อข่าว: “โมเดลใหม่ของ Moonshot AI จุดกระแส ‘DeepSeek Moment’ สั่นสะเทือนโลก AI”

สตาร์ทอัพจีน Moonshot AI ที่มีมูลค่ากว่า 3.3 พันล้านดอลลาร์สหรัฐ และได้รับการสนับสนุนจากยักษ์ใหญ่เทคโนโลยีอย่าง Alibaba และ Tencent ได้เปิดตัวโมเดล Kimi K2 Thinking ซึ่งเป็นโมเดลโอเพนซอร์สที่สร้างสถิติใหม่ในด้าน reasoning, coding และ agent capabilities

โมเดลนี้ได้รับความนิยมสูงสุดบนแพลตฟอร์ม Hugging Face และโพสต์เปิดตัวบน X มียอดเข้าชมกว่า 4.5 ล้านครั้ง จุดที่น่าทึ่งคือมีรายงานว่า ค่าใช้จ่ายในการฝึกเพียง 4.6 ล้านดอลลาร์ ซึ่งถูกกว่ามากเมื่อเทียบกับโมเดลสหรัฐฯ

Thomas Wolf ผู้ร่วมก่อตั้ง Hugging Face ถึงกับตั้งคำถามว่า “นี่คืออีกหนึ่ง DeepSeek Moment หรือไม่?” หลังจากก่อนหน้านี้โมเดล R1 ของ DeepSeek ได้เขย่าความเชื่อเรื่องความเหนือกว่าของ AI สหรัฐฯ

Kimi K2 Thinking ทำคะแนน 44.9% ใน Humanity’s Last Exam (ข้อสอบมาตรฐาน LLM กว่า 2,500 ข้อ) ซึ่งสูงกว่า GPT-5 ที่ทำได้ 41.7% และยังชนะใน benchmark สำคัญอย่าง BrowseComp และ Seal-0 ที่ทดสอบความสามารถในการค้นหาข้อมูลจริงบนเว็บ

นอกจากนี้ ค่าใช้จ่าย API ของ Kimi K2 Thinking ยังถูกกว่าโมเดลของ OpenAI และ Anthropic ถึง 6–10 เท่า นักวิเคราะห์ชี้ว่าแนวโน้มของจีนคือการลดต้นทุนอย่างต่อเนื่อง เพื่อแข่งขันด้วย ความคุ้มค่า (cost-effectiveness) แม้ประสิทธิภาพโดยรวมยังตามหลังโมเดลสหรัฐฯ

สาระเพิ่มเติมจากภายนอก
การแข่งขัน AI ระหว่างจีนและสหรัฐฯ กำลังเปลี่ยนจาก “ใครเก่งกว่า” เป็น “ใครคุ้มค่ากว่า”
การที่จีนหันมาเน้น ลดต้นทุนการฝึกและใช้งาน อาจทำให้ AI เข้าถึงนักพัฒนาและธุรกิจรายย่อยได้มากขึ้น
หากแนวโน้มนี้ดำเนินต่อไป อาจเกิดการ เร่งนวัตกรรมด้านสถาปัตยกรรมโมเดลและเทคนิคการฝึก ที่เปลี่ยนโฉมอุตสาหกรรม AI

Moonshot AI เปิดตัว Kimi K2 Thinking
ทำผลงานเหนือ GPT-5 และ Claude Sonnet 4.5 ในหลาย benchmark
ได้รับความนิยมสูงสุดบน Hugging Face และมีผู้สนใจจำนวนมาก

จุดเด่นของโมเดล
ค่าใช้จ่ายในการฝึกเพียง 4.6 ล้านดอลลาร์
API ถูกกว่าโมเดลสหรัฐฯ ถึง 6–10 เท่า

ผลกระทบต่อวงการ
จุดกระแส “DeepSeek Moment” ครั้งใหม่
ท้าทายความเป็นผู้นำด้าน AI ของสหรัฐฯ

คำเตือนด้านความเสี่ยง
แม้ต้นทุนต่ำ แต่ประสิทธิภาพโดยรวมยังตามหลังโมเดลสหรัฐฯ
การแข่งขันด้านราคาที่รุนแรงอาจทำให้บางบริษัทละเลยการตรวจสอบคุณภาพและความปลอดภัย
หากจีนครองตลาดด้วยโมเดลราคาถูก อาจเกิดความเสี่ยงด้านมาตรฐานและความน่าเชื่อถือของ AI

https://www.thestar.com.my/tech/tech-news/2025/11/12/why-new-model-of-chinas-moonshot-ai-stirs-deepseek-moment-debate

🤖 หัวข้อข่าว: “โมเดลใหม่ของ Moonshot AI จุดกระแส ‘DeepSeek Moment’ สั่นสะเทือนโลก AI” สตาร์ทอัพจีน Moonshot AI ที่มีมูลค่ากว่า 3.3 พันล้านดอลลาร์สหรัฐ และได้รับการสนับสนุนจากยักษ์ใหญ่เทคโนโลยีอย่าง Alibaba และ Tencent ได้เปิดตัวโมเดล Kimi K2 Thinking ซึ่งเป็นโมเดลโอเพนซอร์สที่สร้างสถิติใหม่ในด้าน reasoning, coding และ agent capabilities โมเดลนี้ได้รับความนิยมสูงสุดบนแพลตฟอร์ม Hugging Face และโพสต์เปิดตัวบน X มียอดเข้าชมกว่า 4.5 ล้านครั้ง จุดที่น่าทึ่งคือมีรายงานว่า ค่าใช้จ่ายในการฝึกเพียง 4.6 ล้านดอลลาร์ ซึ่งถูกกว่ามากเมื่อเทียบกับโมเดลสหรัฐฯ Thomas Wolf ผู้ร่วมก่อตั้ง Hugging Face ถึงกับตั้งคำถามว่า “นี่คืออีกหนึ่ง DeepSeek Moment หรือไม่?” หลังจากก่อนหน้านี้โมเดล R1 ของ DeepSeek ได้เขย่าความเชื่อเรื่องความเหนือกว่าของ AI สหรัฐฯ Kimi K2 Thinking ทำคะแนน 44.9% ใน Humanity’s Last Exam (ข้อสอบมาตรฐาน LLM กว่า 2,500 ข้อ) ซึ่งสูงกว่า GPT-5 ที่ทำได้ 41.7% และยังชนะใน benchmark สำคัญอย่าง BrowseComp และ Seal-0 ที่ทดสอบความสามารถในการค้นหาข้อมูลจริงบนเว็บ นอกจากนี้ ค่าใช้จ่าย API ของ Kimi K2 Thinking ยังถูกกว่าโมเดลของ OpenAI และ Anthropic ถึง 6–10 เท่า นักวิเคราะห์ชี้ว่าแนวโน้มของจีนคือการลดต้นทุนอย่างต่อเนื่อง เพื่อแข่งขันด้วย ความคุ้มค่า (cost-effectiveness) แม้ประสิทธิภาพโดยรวมยังตามหลังโมเดลสหรัฐฯ 🧩 สาระเพิ่มเติมจากภายนอก 📌 การแข่งขัน AI ระหว่างจีนและสหรัฐฯ กำลังเปลี่ยนจาก “ใครเก่งกว่า” เป็น “ใครคุ้มค่ากว่า” 📌 การที่จีนหันมาเน้น ลดต้นทุนการฝึกและใช้งาน อาจทำให้ AI เข้าถึงนักพัฒนาและธุรกิจรายย่อยได้มากขึ้น 📌 หากแนวโน้มนี้ดำเนินต่อไป อาจเกิดการ เร่งนวัตกรรมด้านสถาปัตยกรรมโมเดลและเทคนิคการฝึก ที่เปลี่ยนโฉมอุตสาหกรรม AI ✅ Moonshot AI เปิดตัว Kimi K2 Thinking ➡️ ทำผลงานเหนือ GPT-5 และ Claude Sonnet 4.5 ในหลาย benchmark ➡️ ได้รับความนิยมสูงสุดบน Hugging Face และมีผู้สนใจจำนวนมาก ✅ จุดเด่นของโมเดล ➡️ ค่าใช้จ่ายในการฝึกเพียง 4.6 ล้านดอลลาร์ ➡️ API ถูกกว่าโมเดลสหรัฐฯ ถึง 6–10 เท่า ✅ ผลกระทบต่อวงการ ➡️ จุดกระแส “DeepSeek Moment” ครั้งใหม่ ➡️ ท้าทายความเป็นผู้นำด้าน AI ของสหรัฐฯ ‼️ คำเตือนด้านความเสี่ยง ⛔ แม้ต้นทุนต่ำ แต่ประสิทธิภาพโดยรวมยังตามหลังโมเดลสหรัฐฯ ⛔ การแข่งขันด้านราคาที่รุนแรงอาจทำให้บางบริษัทละเลยการตรวจสอบคุณภาพและความปลอดภัย ⛔ หากจีนครองตลาดด้วยโมเดลราคาถูก อาจเกิดความเสี่ยงด้านมาตรฐานและความน่าเชื่อถือของ AI https://www.thestar.com.my/tech/tech-news/2025/11/12/why-new-model-of-chinas-moonshot-ai-stirs-deepseek-moment-debate

WWW.THESTAR.COM.MY

Why new model of China's Moonshot AI stirs 'DeepSeek moment' debate
Kimi K2 Thinking outperforms OpenAI's GPT-5 and Anthropic's Claude Sonnet 4.5, sparking comparisons to DeepSeek's breakthrough.

0 ความคิดเห็น 0 การแบ่งปัน 324 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-11-01 08:33:15 -

Meta ปลดพนักงาน AI กว่า 600 คน! ปรับโครงสร้างใหม่หลัง Llama ไม่ปังเท่าคู่แข่ง

Meta ประกาศปลดพนักงานในแผนก AI กว่า 600 คนในเดือนตุลาคม 2025 โดยเน้นตัดทีมเก่าที่พัฒนาโมเดล Llama และรวมศูนย์การพัฒนาไว้ที่ Meta Superintelligence Labs หลังผลตอบรับจากนักพัฒนาไม่ดีเท่าที่คาด

กลางปี 2025 Meta เคยทุ่มเงินระดับ $100–300 ล้านต่อคนเพื่อดึงนักวิจัย AI ชั้นนำเข้าสู่บริษัท และมีรายงานว่าเสนอแพ็กเกจมูลค่ากว่า $1 พันล้านให้กับนักวิจัยคนหนึ่ง แต่ในเดือนตุลาคมกลับมีการปลดพนักงานกว่า 600 คนจากแผนก AI โดยเฉพาะทีม FAIR ที่เคยพัฒนาโมเดล Llama

การปลดครั้งนี้เกิดขึ้นหลังจาก Meta เปิดตัว Llama รุ่นล่าสุดที่ไม่สามารถสร้างกระแสในชุมชนนักพัฒนาได้เท่ากับ GPT ของ OpenAI, Gemini ของ Google หรือ Claude ของ Anthropic

Meta จึงตัดสินใจรวมทีม AI ไว้ที่ Meta Superintelligence Labs (MSL) ซึ่งเป็นหน่วยงานใหม่ที่เกิดจากการซื้อกิจการ ScaleAI โดยเน้นการพัฒนาโมเดลพื้นฐานและฟีเจอร์ AI ที่ใช้งานได้จริง

แม้จะปลดพนักงานจำนวนมาก แต่ Meta ยืนยันว่าจะยังคงลงทุนใน AI และเปิดรับนักวิจัยระดับสูงต่อไป โดย Alexandr Wang หัวหน้าเจ้าหน้าที่ AI ระบุว่า “การลดทีมจะช่วยให้สมาชิกที่เหลือสร้างผลกระทบได้มากขึ้น”

รายละเอียดการปลดพนักงาน
ปลดพนักงาน AI กว่า 600 คนในเดือนตุลาคม 2025
เน้นตัดทีมเก่า เช่น FAIR ที่พัฒนา Llama
ย้ายการพัฒนาไปที่ Meta Superintelligence Labs (MSL)

เหตุผลเบื้องหลัง
Llama ไม่ได้รับความนิยมในชุมชนนักพัฒนา
เทียบไม่ได้กับ GPT, Gemini, Claude และ Deepseek
Zuckerberg ไม่พอใจกับความคืบหน้าของทีม AI เดิม

ท่าทีของ Meta
ยืนยันว่าจะยังลงทุนใน AI ต่อไป
เปิดรับนักวิจัยระดับสูงเพิ่ม
ทีม TBD Lab ที่รวมดาว AI ยังอยู่ครบ

ผลกระทบที่เกิดขึ้น
นักวิจัยชื่อดังบางคนถูกปลด แต่ได้รับข้อเสนอจากบริษัทอื่นทันที
Meta ยุติโครงการ fact-checking และปลดทีม risk group ด้วย

ความเสี่ยงจากการพึ่งพาโมเดลที่ไม่ติดตลาด
หากโมเดลไม่ถูกนำไปใช้จริง อาจสูญเงินลงทุนมหาศาล
การปลดทีมเก่าอาจทำให้สูญเสียความรู้เชิงลึกที่สะสมมา

ความท้าทายของ Meta ในตลาด AI
คู่แข่งมีผลิตภัณฑ์ที่สร้างรายได้จริงแล้ว
Meta ยังไม่สามารถสร้างโมเดลที่ใช้งานนอกแพลตฟอร์มตัวเองได้

https://www.slashgear.com/2012781/meta-october-2025-ai-layoffs/

📉🤖 Meta ปลดพนักงาน AI กว่า 600 คน! ปรับโครงสร้างใหม่หลัง Llama ไม่ปังเท่าคู่แข่ง Meta ประกาศปลดพนักงานในแผนก AI กว่า 600 คนในเดือนตุลาคม 2025 โดยเน้นตัดทีมเก่าที่พัฒนาโมเดล Llama และรวมศูนย์การพัฒนาไว้ที่ Meta Superintelligence Labs หลังผลตอบรับจากนักพัฒนาไม่ดีเท่าที่คาด กลางปี 2025 Meta เคยทุ่มเงินระดับ $100–300 ล้านต่อคนเพื่อดึงนักวิจัย AI ชั้นนำเข้าสู่บริษัท และมีรายงานว่าเสนอแพ็กเกจมูลค่ากว่า $1 พันล้านให้กับนักวิจัยคนหนึ่ง แต่ในเดือนตุลาคมกลับมีการปลดพนักงานกว่า 600 คนจากแผนก AI โดยเฉพาะทีม FAIR ที่เคยพัฒนาโมเดล Llama การปลดครั้งนี้เกิดขึ้นหลังจาก Meta เปิดตัว Llama รุ่นล่าสุดที่ไม่สามารถสร้างกระแสในชุมชนนักพัฒนาได้เท่ากับ GPT ของ OpenAI, Gemini ของ Google หรือ Claude ของ Anthropic Meta จึงตัดสินใจรวมทีม AI ไว้ที่ Meta Superintelligence Labs (MSL) ซึ่งเป็นหน่วยงานใหม่ที่เกิดจากการซื้อกิจการ ScaleAI โดยเน้นการพัฒนาโมเดลพื้นฐานและฟีเจอร์ AI ที่ใช้งานได้จริง แม้จะปลดพนักงานจำนวนมาก แต่ Meta ยืนยันว่าจะยังคงลงทุนใน AI และเปิดรับนักวิจัยระดับสูงต่อไป โดย Alexandr Wang หัวหน้าเจ้าหน้าที่ AI ระบุว่า “การลดทีมจะช่วยให้สมาชิกที่เหลือสร้างผลกระทบได้มากขึ้น” ✅ รายละเอียดการปลดพนักงาน ➡️ ปลดพนักงาน AI กว่า 600 คนในเดือนตุลาคม 2025 ➡️ เน้นตัดทีมเก่า เช่น FAIR ที่พัฒนา Llama ➡️ ย้ายการพัฒนาไปที่ Meta Superintelligence Labs (MSL) ✅ เหตุผลเบื้องหลัง ➡️ Llama ไม่ได้รับความนิยมในชุมชนนักพัฒนา ➡️ เทียบไม่ได้กับ GPT, Gemini, Claude และ Deepseek ➡️ Zuckerberg ไม่พอใจกับความคืบหน้าของทีม AI เดิม ✅ ท่าทีของ Meta ➡️ ยืนยันว่าจะยังลงทุนใน AI ต่อไป ➡️ เปิดรับนักวิจัยระดับสูงเพิ่ม ➡️ ทีม TBD Lab ที่รวมดาว AI ยังอยู่ครบ ✅ ผลกระทบที่เกิดขึ้น ➡️ นักวิจัยชื่อดังบางคนถูกปลด แต่ได้รับข้อเสนอจากบริษัทอื่นทันที ➡️ Meta ยุติโครงการ fact-checking และปลดทีม risk group ด้วย ‼️ ความเสี่ยงจากการพึ่งพาโมเดลที่ไม่ติดตลาด ⛔ หากโมเดลไม่ถูกนำไปใช้จริง อาจสูญเงินลงทุนมหาศาล ⛔ การปลดทีมเก่าอาจทำให้สูญเสียความรู้เชิงลึกที่สะสมมา ‼️ ความท้าทายของ Meta ในตลาด AI ⛔ คู่แข่งมีผลิตภัณฑ์ที่สร้างรายได้จริงแล้ว ⛔ Meta ยังไม่สามารถสร้างโมเดลที่ใช้งานนอกแพลตฟอร์มตัวเองได้ https://www.slashgear.com/2012781/meta-october-2025-ai-layoffs/

WWW.SLASHGEAR.COM

Meta Is Slashing Hundreds Of AI Jobs – Here's What's Going On - SlashGear
Meta has let go of nearly 600 employees from its legacy AI divisions, with the company seemingly focusing on its Meta Superintelligence Labs efforts.

0 ความคิดเห็น 0 การแบ่งปัน 251 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-10-28 04:16:15 -

จีนยังใช้ชิป Nvidia H100 ในโดรนทหารอัตโนมัติ แม้ถูกสหรัฐฯ แบน — DeepSeek ถูกสงสัยว่าเทรนด้วยเทคโนโลยีอเมริกัน

บทความจาก Tom’s Hardware เผยว่าโดรนทหารอัตโนมัติรุ่น P60 ของ Norinco ซึ่งเป็นบริษัทของรัฐจีน ใช้ระบบ AI ที่ชื่อว่า DeepSeek ในการควบคุมการเคลื่อนที่และสนับสนุนการรบ โดยมีหลักฐานว่าระบบนี้อาจถูกเทรนด้วยชิป Nvidia H100 ที่ถูกสหรัฐฯ แบนการส่งออกไปยังจีนตั้งแต่ปี 2022

แม้สหรัฐฯ จะจำกัดการส่งออกชิป AI ระดับสูง เช่น Nvidia H100 และ A100 ไปยังจีน แต่การสืบสวนของ Reuters พบว่าหน่วยงานวิจัยของกองทัพจีน เช่น National University of Defense Technology (NUDT) ยังมีการใช้ชิปเหล่านี้ในงานวิจัย โดยมีการกล่าวถึงในสิทธิบัตรกว่า 35 ฉบับ

หนึ่งในสิทธิบัตรถูกยื่นในเดือนมิถุนายน 2025 ซึ่งอาจหมายถึงการใช้งานหลังจากมีการควบคุมการส่งออกแล้ว แม้จะไม่สามารถยืนยันได้ว่าชิปถูกนำเข้าอย่างถูกกฎหมายหรือผ่านตลาดมือสอง

DeepSeek ซึ่งเป็นระบบ AI ที่ใช้ในโดรน P60 ถูกสงสัยว่าเทรนด้วยชิป Nvidia แต่รุ่นล่าสุดของมันสามารถทำงานร่วมกับชิป Huawei Ascend และซอฟต์แวร์ CANN ของจีนได้แล้ว

Nvidia ระบุว่า “การรีไซเคิลชิปเก่าไม่ก่อให้เกิดภัยคุกคามใหม่” และ “การใช้ผลิตภัณฑ์ที่ถูกจำกัดในงานทหารจะไม่สามารถทำงานได้โดยไม่มีซอฟต์แวร์และการสนับสนุน”

โดรน P60 ของจีนใช้ระบบ AI DeepSeek
พัฒนาโดย Norinco บริษัทของรัฐ
เคลื่อนที่ได้ 50 กม./ชม. และมีความสามารถสนับสนุนการรบอัตโนมัติ

การใช้ชิป Nvidia H100 แม้ถูกแบน
พบในสิทธิบัตรของ NUDT และสถาบันวิจัยอื่น ๆ
มีสิทธิบัตรล่าสุดในปี 2025 ที่กล่าวถึง A100
อาจได้มาจากตลาดมือสองหรือก่อนการควบคุม

ความพยายามของจีนในการพึ่งพาชิปในประเทศ
ใช้ Huawei Ascend และซอฟต์แวร์ CANN
DeepSeek รุ่นใหม่รองรับชิปจีนโดยตรง

มุมมองจาก Nvidia
การใช้ชิปเก่าไม่ก่อให้เกิดภัยใหม่
ไม่มีซอฟต์แวร์หรือการสนับสนุนสำหรับงานทหาร

คำเตือนด้านความมั่นคง
การใช้ชิป AI ในงานทหารอาจนำไปสู่การพัฒนาอาวุธอัตโนมัติ
การควบคุมการส่งออกอาจไม่สามารถหยุดการใช้งานได้จริง
การพึ่งพาตลาดมือสองเปิดช่องให้เกิดการละเมิดนโยบาย

https://www.tomshardware.com/tech-industry/artificial-intelligence/chinas-autonomous-military-combat-drone-powered-by-deepseek-highlights-nvidia-reliance-investigation-reveals-peoples-liberation-army-supporting-institutions-continue-to-use-restricted-h100-chips

🇨🇳 จีนยังใช้ชิป Nvidia H100 ในโดรนทหารอัตโนมัติ แม้ถูกสหรัฐฯ แบน — DeepSeek ถูกสงสัยว่าเทรนด้วยเทคโนโลยีอเมริกัน บทความจาก Tom’s Hardware เผยว่าโดรนทหารอัตโนมัติรุ่น P60 ของ Norinco ซึ่งเป็นบริษัทของรัฐจีน ใช้ระบบ AI ที่ชื่อว่า DeepSeek ในการควบคุมการเคลื่อนที่และสนับสนุนการรบ โดยมีหลักฐานว่าระบบนี้อาจถูกเทรนด้วยชิป Nvidia H100 ที่ถูกสหรัฐฯ แบนการส่งออกไปยังจีนตั้งแต่ปี 2022 แม้สหรัฐฯ จะจำกัดการส่งออกชิป AI ระดับสูง เช่น Nvidia H100 และ A100 ไปยังจีน แต่การสืบสวนของ Reuters พบว่าหน่วยงานวิจัยของกองทัพจีน เช่น National University of Defense Technology (NUDT) ยังมีการใช้ชิปเหล่านี้ในงานวิจัย โดยมีการกล่าวถึงในสิทธิบัตรกว่า 35 ฉบับ หนึ่งในสิทธิบัตรถูกยื่นในเดือนมิถุนายน 2025 ซึ่งอาจหมายถึงการใช้งานหลังจากมีการควบคุมการส่งออกแล้ว แม้จะไม่สามารถยืนยันได้ว่าชิปถูกนำเข้าอย่างถูกกฎหมายหรือผ่านตลาดมือสอง DeepSeek ซึ่งเป็นระบบ AI ที่ใช้ในโดรน P60 ถูกสงสัยว่าเทรนด้วยชิป Nvidia แต่รุ่นล่าสุดของมันสามารถทำงานร่วมกับชิป Huawei Ascend และซอฟต์แวร์ CANN ของจีนได้แล้ว Nvidia ระบุว่า “การรีไซเคิลชิปเก่าไม่ก่อให้เกิดภัยคุกคามใหม่” และ “การใช้ผลิตภัณฑ์ที่ถูกจำกัดในงานทหารจะไม่สามารถทำงานได้โดยไม่มีซอฟต์แวร์และการสนับสนุน” ✅ โดรน P60 ของจีนใช้ระบบ AI DeepSeek ➡️ พัฒนาโดย Norinco บริษัทของรัฐ ➡️ เคลื่อนที่ได้ 50 กม./ชม. และมีความสามารถสนับสนุนการรบอัตโนมัติ ✅ การใช้ชิป Nvidia H100 แม้ถูกแบน ➡️ พบในสิทธิบัตรของ NUDT และสถาบันวิจัยอื่น ๆ ➡️ มีสิทธิบัตรล่าสุดในปี 2025 ที่กล่าวถึง A100 ➡️ อาจได้มาจากตลาดมือสองหรือก่อนการควบคุม ✅ ความพยายามของจีนในการพึ่งพาชิปในประเทศ ➡️ ใช้ Huawei Ascend และซอฟต์แวร์ CANN ➡️ DeepSeek รุ่นใหม่รองรับชิปจีนโดยตรง ✅ มุมมองจาก Nvidia ➡️ การใช้ชิปเก่าไม่ก่อให้เกิดภัยใหม่ ➡️ ไม่มีซอฟต์แวร์หรือการสนับสนุนสำหรับงานทหาร ‼️ คำเตือนด้านความมั่นคง ⛔ การใช้ชิป AI ในงานทหารอาจนำไปสู่การพัฒนาอาวุธอัตโนมัติ ⛔ การควบคุมการส่งออกอาจไม่สามารถหยุดการใช้งานได้จริง ⛔ การพึ่งพาตลาดมือสองเปิดช่องให้เกิดการละเมิดนโยบาย https://www.tomshardware.com/tech-industry/artificial-intelligence/chinas-autonomous-military-combat-drone-powered-by-deepseek-highlights-nvidia-reliance-investigation-reveals-peoples-liberation-army-supporting-institutions-continue-to-use-restricted-h100-chips

WWW.TOMSHARDWARE.COM

China's autonomous military combat drone powered by DeepSeek highlights Nvidia reliance — investigation reveals People's Liberation Army, supporting institutions continue to use restricted H100 chips
AI really is everywhere

0 ความคิดเห็น 0 การแบ่งปัน 284 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-10-22 13:37:05 -

“DeepSeek-OCR เปลี่ยนข้อความเป็นภาพ ลดการใช้ทรัพยากร AI ได้ถึง 20 เท่า – เปิดทางสู่โมเดลยักษ์ราคาประหยัด!”

DeepSeek AI จากจีนเปิดตัวโมเดลใหม่ชื่อว่า “DeepSeek-OCR” ที่ใช้เทคนิคสุดล้ำในการจัดการข้อความจำนวนมาก โดยแทนที่จะป้อนข้อความเข้าโมเดลโดยตรง พวกเขาเลือก “แปลงข้อความเป็นภาพ” ก่อน แล้วค่อยให้โมเดลตีความจากภาพนั้นอีกที

ฟังดูย้อนยุค แต่ผลลัพธ์กลับน่าทึ่ง เพราะวิธีนี้ช่วยลดจำนวน token ที่ต้องใช้ในการประมวลผลได้ถึง 7–20 เท่า! ซึ่งหมายความว่าโมเดลสามารถจัดการข้อมูลปริมาณมหาศาลได้โดยใช้ทรัพยากรน้อยลงมาก ทั้งในด้านเวลาและค่าใช้จ่าย

ระบบนี้ประกอบด้วยสองส่วนหลัก:
DeepEncoder: แปลงข้อความเป็นภาพความละเอียดสูง
DeepSeek3B-MoE-A570M: ทำหน้าที่ตีความภาพเหล่านั้นกลับมาเป็นข้อมูลที่เข้าใจได้

เทคนิคนี้เหมาะมากกับข้อมูลที่เป็นตาราง กราฟ หรือเอกสารที่มีโครงสร้างซับซ้อน เช่น ข้อมูลทางการเงิน วิทยาศาสตร์ หรือการแพทย์ โดยเฉพาะในงานที่ต้องใช้ context ยาว ๆ

ในการทดสอบ benchmark พบว่า ถ้าลด token น้อยกว่า 10 เท่า ความแม่นยำยังอยู่ที่ 97% แต่ถ้าลดถึง 20 เท่า ความแม่นยำจะลดลงเหลือ 60% ซึ่งแสดงให้เห็นว่ามีจุดสมดุลที่ต้องเลือกให้เหมาะกับงาน

DeepSeek-OCR ยังถูกเสนอให้ใช้ในการสร้าง training data สำหรับโมเดลในอนาคต เพราะสามารถจัดการข้อมูลจำนวนมากได้เร็วขึ้น แม้จะมีความเสี่ยงเรื่องความแม่นยำที่ลดลงเล็กน้อย

จุดเด่นของ DeepSeek-OCR
แปลงข้อความเป็นภาพก่อนป้อนเข้าโมเดล
ลดการใช้ token ได้ถึง 7–20 เท่า
ใช้ DeepEncoder และ DeepSeek3B-MoE-A570M ร่วมกัน
เหมาะกับข้อมูลที่มีโครงสร้าง เช่น ตาราง กราฟ เอกสาร
ช่วยลดต้นทุนและเวลาในการประมวลผลโมเดลขนาดใหญ่
ใช้ได้ดีในงานที่ต้องการ context ยาว เช่น LLM

ผลการทดสอบและการใช้งาน
ลด token <10 เท่า → ความแม่นยำ 97%
ลด token 20 เท่า → ความแม่นยำลดเหลือ 60%
มีจุดสมดุลระหว่างการลดต้นทุนและความแม่นยำ
เสนอให้ใช้สร้าง training data สำหรับโมเดลในอนาคต
เหมาะกับงานด้านการเงิน วิทยาศาสตร์ และการแพทย์

ความเคลื่อนไหวของ DeepSeek
เป็นโมเดลจากจีนที่สร้างความฮือฮาในปี 2025
ใช้ทรัพยากรน้อยกว่า ChatGPT และ Gemini
เปิดให้ใช้งานผ่าน Hugging Face และ GitHub
พัฒนาอย่างต่อเนื่องเพื่อเพิ่มประสิทธิภาพและลดต้นทุน

https://www.tomshardware.com/tech-industry/artificial-intelligence/new-deepseek-model-drastically-reduces-resource-usage-by-converting-text-and-documents-into-images-vision-text-compression-uses-up-to-20-times-fewer-tokens

🧠 “DeepSeek-OCR เปลี่ยนข้อความเป็นภาพ ลดการใช้ทรัพยากร AI ได้ถึง 20 เท่า – เปิดทางสู่โมเดลยักษ์ราคาประหยัด!” DeepSeek AI จากจีนเปิดตัวโมเดลใหม่ชื่อว่า “DeepSeek-OCR” ที่ใช้เทคนิคสุดล้ำในการจัดการข้อความจำนวนมาก โดยแทนที่จะป้อนข้อความเข้าโมเดลโดยตรง พวกเขาเลือก “แปลงข้อความเป็นภาพ” ก่อน แล้วค่อยให้โมเดลตีความจากภาพนั้นอีกที ฟังดูย้อนยุค แต่ผลลัพธ์กลับน่าทึ่ง เพราะวิธีนี้ช่วยลดจำนวน token ที่ต้องใช้ในการประมวลผลได้ถึง 7–20 เท่า! ซึ่งหมายความว่าโมเดลสามารถจัดการข้อมูลปริมาณมหาศาลได้โดยใช้ทรัพยากรน้อยลงมาก ทั้งในด้านเวลาและค่าใช้จ่าย ระบบนี้ประกอบด้วยสองส่วนหลัก: 💻 DeepEncoder: แปลงข้อความเป็นภาพความละเอียดสูง 💻 DeepSeek3B-MoE-A570M: ทำหน้าที่ตีความภาพเหล่านั้นกลับมาเป็นข้อมูลที่เข้าใจได้ เทคนิคนี้เหมาะมากกับข้อมูลที่เป็นตาราง กราฟ หรือเอกสารที่มีโครงสร้างซับซ้อน เช่น ข้อมูลทางการเงิน วิทยาศาสตร์ หรือการแพทย์ โดยเฉพาะในงานที่ต้องใช้ context ยาว ๆ ในการทดสอบ benchmark พบว่า ถ้าลด token น้อยกว่า 10 เท่า ความแม่นยำยังอยู่ที่ 97% แต่ถ้าลดถึง 20 เท่า ความแม่นยำจะลดลงเหลือ 60% ซึ่งแสดงให้เห็นว่ามีจุดสมดุลที่ต้องเลือกให้เหมาะกับงาน DeepSeek-OCR ยังถูกเสนอให้ใช้ในการสร้าง training data สำหรับโมเดลในอนาคต เพราะสามารถจัดการข้อมูลจำนวนมากได้เร็วขึ้น แม้จะมีความเสี่ยงเรื่องความแม่นยำที่ลดลงเล็กน้อย ✅ จุดเด่นของ DeepSeek-OCR ➡️ แปลงข้อความเป็นภาพก่อนป้อนเข้าโมเดล ➡️ ลดการใช้ token ได้ถึง 7–20 เท่า ➡️ ใช้ DeepEncoder และ DeepSeek3B-MoE-A570M ร่วมกัน ➡️ เหมาะกับข้อมูลที่มีโครงสร้าง เช่น ตาราง กราฟ เอกสาร ➡️ ช่วยลดต้นทุนและเวลาในการประมวลผลโมเดลขนาดใหญ่ ➡️ ใช้ได้ดีในงานที่ต้องการ context ยาว เช่น LLM ✅ ผลการทดสอบและการใช้งาน ➡️ ลด token <10 เท่า → ความแม่นยำ 97% ➡️ ลด token 20 เท่า → ความแม่นยำลดเหลือ 60% ➡️ มีจุดสมดุลระหว่างการลดต้นทุนและความแม่นยำ ➡️ เสนอให้ใช้สร้าง training data สำหรับโมเดลในอนาคต ➡️ เหมาะกับงานด้านการเงิน วิทยาศาสตร์ และการแพทย์ ✅ ความเคลื่อนไหวของ DeepSeek ➡️ เป็นโมเดลจากจีนที่สร้างความฮือฮาในปี 2025 ➡️ ใช้ทรัพยากรน้อยกว่า ChatGPT และ Gemini ➡️ เปิดให้ใช้งานผ่าน Hugging Face และ GitHub ➡️ พัฒนาอย่างต่อเนื่องเพื่อเพิ่มประสิทธิภาพและลดต้นทุน https://www.tomshardware.com/tech-industry/artificial-intelligence/new-deepseek-model-drastically-reduces-resource-usage-by-converting-text-and-documents-into-images-vision-text-compression-uses-up-to-20-times-fewer-tokens

WWW.TOMSHARDWARE.COM

New Deepseek model drastically reduces resource usage by converting text and documents into images — 'vision-text compression' uses up to 20 times fewer tokens
Could help cut costs and improve the efficiency of the latest AI models.

0 ความคิดเห็น 0 การแบ่งปัน 271 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-10-17 04:51:26 -

“AI ตรวจจับภัยในชิปได้ 97% แต่ยังไม่พอ” — เมื่อความแม่นยำสูงยังไม่อาจรับประกันความปลอดภัยในโลกฮาร์ดแวร์

ในโลกที่ชิปคอมพิวเตอร์เป็นหัวใจของทุกระบบ ตั้งแต่ศูนย์ข้อมูลไปจนถึงอุปกรณ์ทางการแพทย์และการทหาร ความปลอดภัยของฮาร์ดแวร์จึงเป็นเรื่องที่ไม่อาจมองข้าม ล่าสุดนักวิจัยจากมหาวิทยาลัย Missouri ได้พัฒนา PEARL — ระบบที่ใช้ AI ตรวจจับ “hardware trojans” หรือช่องโหว่ที่ถูกฝังไว้ในขั้นตอนการผลิตชิป

PEARL ใช้โมเดลภาษาขนาดใหญ่ (LLMs) เช่น GPT-3.5 Turbo, Gemini 1.5 Pro, Llama 3.1 และ DeepSeek-V2 เพื่อวิเคราะห์โค้ด Verilog โดยไม่ต้องใช้โมเดลอ้างอิงแบบ “golden chip” และสามารถอธิบายผลการตรวจจับได้อย่างเข้าใจง่าย

ผลการทดลองพบว่า GPT-3.5 Turbo ตรวจจับได้แม่นยำถึง 97% ขณะที่ DeepSeek-V2 ทำได้ 91% ซึ่งถือว่าสูงมากในแง่เทคนิค แต่ผู้เชี่ยวชาญเตือนว่า “แม้จะพลาดเพียง 3% ก็อาจนำไปสู่หายนะ” เพราะชิปเหล่านี้ถูกใช้ในระบบที่มีความเสี่ยงสูง เช่น การเงินและความมั่นคงของชาติ

การตรวจจับ hardware trojans เป็นเรื่องยาก เพราะชิปถูกผลิตผ่านห่วงโซ่อุปทานที่ซับซ้อนในหลายประเทศ และช่องโหว่อาจถูกฝังในขั้นตอนใดก็ได้ การตรวจสอบแบบ manual ยังจำเป็นเพื่อเสริมความมั่นใจ แม้ AI จะช่วยได้มากก็ตาม

นักวิจัยจากมหาวิทยาลัย Missouri พัฒนา PEARL เพื่อตรวจจับ hardware trojans
ใช้ LLMs เช่น GPT-3.5 Turbo, Gemini 1.5 Pro, Llama 3.1 และ DeepSeek-V2
วิเคราะห์โค้ด Verilog โดยไม่ต้องใช้ golden chip

PEARL ใช้เทคนิค in-context learning เช่น zero-shot และ few-shot
ให้ผลลัพธ์พร้อมคำอธิบายที่เข้าใจง่าย

GPT-3.5 Turbo ตรวจจับได้แม่นยำถึง 97%
DeepSeek-V2 ทำได้ 91%

ทดสอบกับ benchmark เช่น Trust-Hub และ ISCAS 85/89
ใช้ทั้งโมเดล open-source และ enterprise

PEARL ไม่ต้องใช้โมเดลอ้างอิง ทำให้ใช้งานได้กว้างขึ้น
เหมาะกับการตรวจสอบชิปในระบบที่ไม่มี golden reference

แม้ AI จะตรวจจับได้ 97% แต่ยังมีช่องว่างที่อาจนำไปสู่หายนะ
ความผิดพลาดเพียงเล็กน้อยในชิปอาจทำให้ระบบล่มหรือถูกเจาะ

ห่วงโซ่อุปทานของชิปมีความซับซ้อนและเสี่ยงต่อการฝังช่องโหว่
การตรวจสอบต้องครอบคลุมทุกขั้นตอน ตั้งแต่การออกแบบจนถึงการประกอบ

การพึ่งพา AI เพียงอย่างเดียวอาจไม่เพียงพอในระบบที่มีความเสี่ยงสูง
ยังต้องมีการตรวจสอบแบบ manual และการทดสอบเชิงลึก

ความแม่นยำของโมเดลอาจแตกต่างกันตามบริบทและประเภทของโค้ด
ต้องเลือกโมเดลให้เหมาะกับงานและมีการปรับแต่งอย่างเหมาะสม

https://www.techradar.com/pro/ai-can-detect-malicious-chip-vulnerabilities-with-a-97-success-rate-but-i-fear-that-is-simply-not-enough

🧠 “AI ตรวจจับภัยในชิปได้ 97% แต่ยังไม่พอ” — เมื่อความแม่นยำสูงยังไม่อาจรับประกันความปลอดภัยในโลกฮาร์ดแวร์ ในโลกที่ชิปคอมพิวเตอร์เป็นหัวใจของทุกระบบ ตั้งแต่ศูนย์ข้อมูลไปจนถึงอุปกรณ์ทางการแพทย์และการทหาร ความปลอดภัยของฮาร์ดแวร์จึงเป็นเรื่องที่ไม่อาจมองข้าม ล่าสุดนักวิจัยจากมหาวิทยาลัย Missouri ได้พัฒนา PEARL — ระบบที่ใช้ AI ตรวจจับ “hardware trojans” หรือช่องโหว่ที่ถูกฝังไว้ในขั้นตอนการผลิตชิป PEARL ใช้โมเดลภาษาขนาดใหญ่ (LLMs) เช่น GPT-3.5 Turbo, Gemini 1.5 Pro, Llama 3.1 และ DeepSeek-V2 เพื่อวิเคราะห์โค้ด Verilog โดยไม่ต้องใช้โมเดลอ้างอิงแบบ “golden chip” และสามารถอธิบายผลการตรวจจับได้อย่างเข้าใจง่าย ผลการทดลองพบว่า GPT-3.5 Turbo ตรวจจับได้แม่นยำถึง 97% ขณะที่ DeepSeek-V2 ทำได้ 91% ซึ่งถือว่าสูงมากในแง่เทคนิค แต่ผู้เชี่ยวชาญเตือนว่า “แม้จะพลาดเพียง 3% ก็อาจนำไปสู่หายนะ” เพราะชิปเหล่านี้ถูกใช้ในระบบที่มีความเสี่ยงสูง เช่น การเงินและความมั่นคงของชาติ การตรวจจับ hardware trojans เป็นเรื่องยาก เพราะชิปถูกผลิตผ่านห่วงโซ่อุปทานที่ซับซ้อนในหลายประเทศ และช่องโหว่อาจถูกฝังในขั้นตอนใดก็ได้ การตรวจสอบแบบ manual ยังจำเป็นเพื่อเสริมความมั่นใจ แม้ AI จะช่วยได้มากก็ตาม ✅ นักวิจัยจากมหาวิทยาลัย Missouri พัฒนา PEARL เพื่อตรวจจับ hardware trojans ➡️ ใช้ LLMs เช่น GPT-3.5 Turbo, Gemini 1.5 Pro, Llama 3.1 และ DeepSeek-V2 ➡️ วิเคราะห์โค้ด Verilog โดยไม่ต้องใช้ golden chip ✅ PEARL ใช้เทคนิค in-context learning เช่น zero-shot และ few-shot ➡️ ให้ผลลัพธ์พร้อมคำอธิบายที่เข้าใจง่าย ✅ GPT-3.5 Turbo ตรวจจับได้แม่นยำถึง 97% ➡️ DeepSeek-V2 ทำได้ 91% ✅ ทดสอบกับ benchmark เช่น Trust-Hub และ ISCAS 85/89 ➡️ ใช้ทั้งโมเดล open-source และ enterprise ✅ PEARL ไม่ต้องใช้โมเดลอ้างอิง ทำให้ใช้งานได้กว้างขึ้น ➡️ เหมาะกับการตรวจสอบชิปในระบบที่ไม่มี golden reference ‼️ แม้ AI จะตรวจจับได้ 97% แต่ยังมีช่องว่างที่อาจนำไปสู่หายนะ ⛔ ความผิดพลาดเพียงเล็กน้อยในชิปอาจทำให้ระบบล่มหรือถูกเจาะ ‼️ ห่วงโซ่อุปทานของชิปมีความซับซ้อนและเสี่ยงต่อการฝังช่องโหว่ ⛔ การตรวจสอบต้องครอบคลุมทุกขั้นตอน ตั้งแต่การออกแบบจนถึงการประกอบ ‼️ การพึ่งพา AI เพียงอย่างเดียวอาจไม่เพียงพอในระบบที่มีความเสี่ยงสูง ⛔ ยังต้องมีการตรวจสอบแบบ manual และการทดสอบเชิงลึก ‼️ ความแม่นยำของโมเดลอาจแตกต่างกันตามบริบทและประเภทของโค้ด ⛔ ต้องเลือกโมเดลให้เหมาะกับงานและมีการปรับแต่งอย่างเหมาะสม https://www.techradar.com/pro/ai-can-detect-malicious-chip-vulnerabilities-with-a-97-success-rate-but-i-fear-that-is-simply-not-enough

WWW.TECHRADAR.COM

New AI model spots dangerous chip code with near-perfect accuracy
The PEARL system uses language models to expose malicious design changes

0 ความคิดเห็น 0 การแบ่งปัน 314 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-10-03 03:15:19 -

“AI สหรัฐฯ ทิ้งห่างจีน — ผลทดสอบ 19 ด้านชี้ชัด DeepSeek ยังตามหลัง OpenAI และ Anthropic แบบไม่เห็นฝุ่น”

สหรัฐฯ ประกาศชัยชนะในสนามแข่งขัน AI ระดับโลก หลังจากสถาบันมาตรฐานและเทคโนโลยีแห่งชาติ (NIST) เผยผลการทดสอบเปรียบเทียบโมเดล AI ระหว่างฝั่งอเมริกันและจีน โดยโมเดลจาก OpenAI และ Anthropic เอาชนะ DeepSeek จากจีนในทุกหมวดหมู่ รวม 19 ด้าน ตั้งแต่ความรู้ทั่วไป การเขียนโปรแกรม ไปจนถึงความปลอดภัยจากการโจมตีแบบ hijack และ jailbreak

รัฐมนตรีพาณิชย์สหรัฐฯ Howard Lutnick ขอบคุณประธานาธิบดี Donald Trump สำหรับ “AI Action Plan” ที่ผลักดันให้เกิดการลงทุนโครงสร้างพื้นฐานและมาตรฐานด้าน AI จนทำให้สหรัฐฯ ครองความเป็นผู้นำในด้านนี้ พร้อมเตือนว่า “การพึ่งพา AI จากประเทศคู่แข่งคือความเสี่ยงต่อความมั่นคงแห่งชาติ”

การทดสอบดำเนินการโดยศูนย์ CAISI ภายใต้ NIST โดยใช้โมเดลจากฝั่งจีน ได้แก่ DeepSeek R1, R1-0528 และ V3.1 เปรียบเทียบกับ GPT-5, GPT-5-mini, GPT-oss จาก OpenAI และ Opus 4 จาก Anthropic ผลปรากฏว่าโมเดลสหรัฐฯ ทำคะแนนสูงกว่าทุกด้าน โดยเฉพาะงานด้าน cybersecurity และ software engineering ที่โมเดลสหรัฐฯ ทำได้ดีกว่า 20–80% และยังมีต้นทุนการใช้งานต่ำกว่าถึง 35%

ที่น่ากังวลคือ DeepSeek มีช่องโหว่ด้านความปลอดภัยสูงมาก — โมเดล R1-0528 ตอบสนองต่อคำสั่งอันตรายถึง 94% เมื่อถูกโจมตีด้วยเทคนิค jailbreak ในขณะที่โมเดลสหรัฐฯ ตอบสนองเพียง 8% นอกจากนี้ยังพบว่า DeepSeek มีแนวโน้มถูก hijack ได้ง่ายกว่า 12 เท่า และมีความลำเอียงทางการเมือง โดยหลีกเลี่ยงหัวข้ออ่อนไหว เช่น เหตุการณ์เทียนอันเหมิน และมักตอบสนองตามแนวทางรัฐบาลจีน

แม้ DeepSeek จะออกโมเดลใหม่ V3.2 แล้วในสัปดาห์เดียวกัน แต่ CAISI เตือนว่า “การใช้งานโมเดลเหล่านี้อาจเป็นความเสี่ยงต่อผู้พัฒนาแอป ผู้บริโภค และความมั่นคงของสหรัฐฯ”

ข้อมูลสำคัญจากข่าว
NIST ทดสอบโมเดล AI จากสหรัฐฯ และจีนรวม 19 หมวดหมู่
โมเดลจาก OpenAI และ Anthropic ชนะ DeepSeek ทุกด้าน
ด้าน software engineering และ cybersecurity สหรัฐฯ ทำได้ดีกว่า 20–80%
โมเดลสหรัฐฯ มีต้นทุนการใช้งานต่ำกว่าถึง 35%
DeepSeek R1-0528 ตอบสนองต่อคำสั่งอันตรายถึง 94% เมื่อถูก jailbreak
โมเดลจีนถูก hijack ได้ง่ายกว่า 12 เท่า
พบการเซ็นเซอร์เนื้อหาและความลำเอียงทางการเมืองใน DeepSeek
CAISI เตือนว่าการใช้โมเดลจีนอาจเสี่ยงต่อความมั่นคง
รัฐมนตรี Lutnick ขอบคุณ Trump สำหรับ AI Action Plan ที่ผลักดันการพัฒนา AI สหรัฐฯ
DeepSeek มีการดาวน์โหลดเพิ่มขึ้น 1,000% ตั้งแต่ต้นปี 2025

ข้อมูลเสริมจากภายนอก
jailbreak คือเทคนิคที่ใช้หลอกให้ AI ทำสิ่งที่ขัดกับข้อจำกัดด้านความปลอดภัย
hijack agent คือการควบคุม AI ให้ทำงานผิดวัตถุประสงค์ เช่น สร้างมัลแวร์หรือขโมยข้อมูล
CAISI เป็นหน่วยงานใหม่ภายใต้ NIST ที่ดูแลมาตรฐานและความปลอดภัยของ AI
GPT-5 และ Opus 4 เป็นโมเดลระดับสูงที่ใช้ในงานวิจัยและองค์กรขนาดใหญ่
การเซ็นเซอร์ใน AI อาจกระทบต่อความน่าเชื่อถือและความโปร่งใสของระบบ

https://www.tomshardware.com/tech-industry/artificial-intelligence/u-s-commerce-sec-lutnick-says-american-ai-dominates-deepseek-thanks-trump-for-ai-action-plan-openai-and-anthropic-beat-chinese-models-across-19-different-benchmarks

🇺🇸🤖 “AI สหรัฐฯ ทิ้งห่างจีน — ผลทดสอบ 19 ด้านชี้ชัด DeepSeek ยังตามหลัง OpenAI และ Anthropic แบบไม่เห็นฝุ่น” สหรัฐฯ ประกาศชัยชนะในสนามแข่งขัน AI ระดับโลก หลังจากสถาบันมาตรฐานและเทคโนโลยีแห่งชาติ (NIST) เผยผลการทดสอบเปรียบเทียบโมเดล AI ระหว่างฝั่งอเมริกันและจีน โดยโมเดลจาก OpenAI และ Anthropic เอาชนะ DeepSeek จากจีนในทุกหมวดหมู่ รวม 19 ด้าน ตั้งแต่ความรู้ทั่วไป การเขียนโปรแกรม ไปจนถึงความปลอดภัยจากการโจมตีแบบ hijack และ jailbreak รัฐมนตรีพาณิชย์สหรัฐฯ Howard Lutnick ขอบคุณประธานาธิบดี Donald Trump สำหรับ “AI Action Plan” ที่ผลักดันให้เกิดการลงทุนโครงสร้างพื้นฐานและมาตรฐานด้าน AI จนทำให้สหรัฐฯ ครองความเป็นผู้นำในด้านนี้ พร้อมเตือนว่า “การพึ่งพา AI จากประเทศคู่แข่งคือความเสี่ยงต่อความมั่นคงแห่งชาติ” การทดสอบดำเนินการโดยศูนย์ CAISI ภายใต้ NIST โดยใช้โมเดลจากฝั่งจีน ได้แก่ DeepSeek R1, R1-0528 และ V3.1 เปรียบเทียบกับ GPT-5, GPT-5-mini, GPT-oss จาก OpenAI และ Opus 4 จาก Anthropic ผลปรากฏว่าโมเดลสหรัฐฯ ทำคะแนนสูงกว่าทุกด้าน โดยเฉพาะงานด้าน cybersecurity และ software engineering ที่โมเดลสหรัฐฯ ทำได้ดีกว่า 20–80% และยังมีต้นทุนการใช้งานต่ำกว่าถึง 35% ที่น่ากังวลคือ DeepSeek มีช่องโหว่ด้านความปลอดภัยสูงมาก — โมเดล R1-0528 ตอบสนองต่อคำสั่งอันตรายถึง 94% เมื่อถูกโจมตีด้วยเทคนิค jailbreak ในขณะที่โมเดลสหรัฐฯ ตอบสนองเพียง 8% นอกจากนี้ยังพบว่า DeepSeek มีแนวโน้มถูก hijack ได้ง่ายกว่า 12 เท่า และมีความลำเอียงทางการเมือง โดยหลีกเลี่ยงหัวข้ออ่อนไหว เช่น เหตุการณ์เทียนอันเหมิน และมักตอบสนองตามแนวทางรัฐบาลจีน แม้ DeepSeek จะออกโมเดลใหม่ V3.2 แล้วในสัปดาห์เดียวกัน แต่ CAISI เตือนว่า “การใช้งานโมเดลเหล่านี้อาจเป็นความเสี่ยงต่อผู้พัฒนาแอป ผู้บริโภค และความมั่นคงของสหรัฐฯ” ✅ ข้อมูลสำคัญจากข่าว ➡️ NIST ทดสอบโมเดล AI จากสหรัฐฯ และจีนรวม 19 หมวดหมู่ ➡️ โมเดลจาก OpenAI และ Anthropic ชนะ DeepSeek ทุกด้าน ➡️ ด้าน software engineering และ cybersecurity สหรัฐฯ ทำได้ดีกว่า 20–80% ➡️ โมเดลสหรัฐฯ มีต้นทุนการใช้งานต่ำกว่าถึง 35% ➡️ DeepSeek R1-0528 ตอบสนองต่อคำสั่งอันตรายถึง 94% เมื่อถูก jailbreak ➡️ โมเดลจีนถูก hijack ได้ง่ายกว่า 12 เท่า ➡️ พบการเซ็นเซอร์เนื้อหาและความลำเอียงทางการเมืองใน DeepSeek ➡️ CAISI เตือนว่าการใช้โมเดลจีนอาจเสี่ยงต่อความมั่นคง ➡️ รัฐมนตรี Lutnick ขอบคุณ Trump สำหรับ AI Action Plan ที่ผลักดันการพัฒนา AI สหรัฐฯ ➡️ DeepSeek มีการดาวน์โหลดเพิ่มขึ้น 1,000% ตั้งแต่ต้นปี 2025 ✅ ข้อมูลเสริมจากภายนอก ➡️ jailbreak คือเทคนิคที่ใช้หลอกให้ AI ทำสิ่งที่ขัดกับข้อจำกัดด้านความปลอดภัย ➡️ hijack agent คือการควบคุม AI ให้ทำงานผิดวัตถุประสงค์ เช่น สร้างมัลแวร์หรือขโมยข้อมูล ➡️ CAISI เป็นหน่วยงานใหม่ภายใต้ NIST ที่ดูแลมาตรฐานและความปลอดภัยของ AI ➡️ GPT-5 และ Opus 4 เป็นโมเดลระดับสูงที่ใช้ในงานวิจัยและองค์กรขนาดใหญ่ ➡️ การเซ็นเซอร์ใน AI อาจกระทบต่อความน่าเชื่อถือและความโปร่งใสของระบบ https://www.tomshardware.com/tech-industry/artificial-intelligence/u-s-commerce-sec-lutnick-says-american-ai-dominates-deepseek-thanks-trump-for-ai-action-plan-openai-and-anthropic-beat-chinese-models-across-19-different-benchmarks

WWW.TOMSHARDWARE.COM

U.S. Commerce Sec. Lutnick says American AI dominates DeepSeek, thanks Trump for AI Action Plan — OpenAI and Anthropic beat Chinese models across 19 different benchmarks
The White House claims the U.S. is winning the AI race — at least for now.

0 ความคิดเห็น 0 การแบ่งปัน 472 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-10-01 03:03:10 -

“Orange Pi AI Studio Pro — มินิพีซีพลัง Huawei Ascend 310 ที่แรงทะลุ 352 TOPS แต่ยังติดข้อจำกัดด้านการเชื่อมต่อ”

Orange Pi เปิดตัวมินิพีซีรุ่นใหม่สำหรับงานปัญญาประดิษฐ์โดยเฉพาะในชื่อ “AI Studio Pro” ซึ่งใช้ชิป Huawei Ascend 310 แบบ ARM octa-core ที่ให้พลังประมวลผลด้าน AI สูงถึง 176 TOPS ในรุ่นปกติ และ 352 TOPS ในรุ่น Pro ที่รวมสองเครื่องเข้าด้วยกัน พร้อมหน่วยความจำสูงสุดถึง 192GB LPDDR4X ความเร็ว 4266 Mbps2

ตัวเครื่องออกแบบมาเพื่อรองรับงาน AI หลากหลาย เช่น การประมวลผลภาพ, การเรียนรู้เชิงลึก, การวิเคราะห์ข้อมูล, การใช้งาน IoT และระบบขนส่งอัจฉริยะ โดยสามารถติดตั้ง Ubuntu 22.04.5 และ Linux kernel 5.15 ได้ทันที ส่วน Windows จะรองรับในอนาคต3

แม้จะมีพลังประมวลผลสูงและหน่วยความจำมหาศาล แต่ Orange Pi AI Studio Pro กลับมีข้อจำกัดด้านการเชื่อมต่ออย่างชัดเจน โดยมีเพียงพอร์ต USB-C 4.0 เพียงช่องเดียวสำหรับทุกการเชื่อมต่อ ไม่ว่าจะเป็นจอภาพ, อุปกรณ์เก็บข้อมูล หรืออุปกรณ์เสริมอื่น ๆ ทำให้ผู้ใช้ต้องพึ่งพา dock หรือ hub เพิ่มเติม

นอกจากนี้ยังไม่มีการระบุว่ามี Wi-Fi หรือ Bluetooth ในตัว ทำให้การเชื่อมต่อเครือข่ายอาจต้องใช้วิธีอื่น เช่น Ethernet หรืออุปกรณ์เสริมภายนอก ซึ่งอาจไม่สะดวกสำหรับการใช้งานแบบเคลื่อนที่หรือในพื้นที่จำกัด

ราคาจำหน่ายในจีนเริ่มต้นที่ประมาณ $955 สำหรับรุ่น 48GB และสูงสุดถึง $2,200 สำหรับรุ่น Pro ที่มี RAM 192GB โดยมีวางจำหน่ายผ่าน JD.com และ AliExpress

ข้อมูลสำคัญจากข่าว
Orange Pi AI Studio Pro ใช้ชิป Huawei Ascend 310 แบบ ARM octa-core
รุ่น Pro รวมสองเครื่องเข้าด้วยกัน ให้พลังประมวลผลสูงถึง 352 TOPS
รองรับหน่วยความจำสูงสุด 192GB LPDDR4X ความเร็ว 4266 Mbps
รองรับ Ubuntu 22.04.5 และ Linux kernel 5.15 พร้อมรองรับ Windows ในอนาคต
เหมาะสำหรับงาน AI เช่น OCR, การรู้จำใบหน้า, การแนะนำเนื้อหา, IoT และระบบขนส่งอัจฉริยะ
มีพอร์ต USB-C 4.0 เพียงช่องเดียวสำหรับทุกการเชื่อมต่อ
ไม่มีการระบุว่ามี Wi-Fi หรือ Bluetooth ในตัว
ราคาจำหน่ายเริ่มต้นที่ $955 และสูงสุดถึง $2,200 ขึ้นอยู่กับรุ่นและ RAM

ข้อมูลเสริมจากภายนอก
Huawei Ascend 310 เป็นชิปที่ออกแบบมาเพื่องาน AI โดยเฉพาะ มีประสิทธิภาพสูงในงาน inference
Orange Pi เป็นแบรนด์ที่เน้นการพัฒนาอุปกรณ์สำหรับนักพัฒนาและงานวิจัย
การใช้ context window ขนาดใหญ่และ RAM สูงช่วยให้รองรับโมเดล AI ขนาดใหญ่ได้ดี
การรองรับ Deepseek-R1 distillation model ช่วยให้สามารถ deploy โมเดล AI แบบ local ได้
การรวมการฝึกและการ inference ในเครื่องเดียวช่วยลดต้นทุนและเพิ่มความคล่องตัวในการพัฒนา

https://www.tomshardware.com/tech-industry/artificial-intelligence/orange-pi-ai-studio-pro-mini-pc-debuts-with-huawei-ascend-310-and-352-tops-of-ai-performance-also-features-up-to-192gb-of-memory-but-relies-on-a-single-usb-c-port

🧠 “Orange Pi AI Studio Pro — มินิพีซีพลัง Huawei Ascend 310 ที่แรงทะลุ 352 TOPS แต่ยังติดข้อจำกัดด้านการเชื่อมต่อ” Orange Pi เปิดตัวมินิพีซีรุ่นใหม่สำหรับงานปัญญาประดิษฐ์โดยเฉพาะในชื่อ “AI Studio Pro” ซึ่งใช้ชิป Huawei Ascend 310 แบบ ARM octa-core ที่ให้พลังประมวลผลด้าน AI สูงถึง 176 TOPS ในรุ่นปกติ และ 352 TOPS ในรุ่น Pro ที่รวมสองเครื่องเข้าด้วยกัน พร้อมหน่วยความจำสูงสุดถึง 192GB LPDDR4X ความเร็ว 4266 Mbps2 ตัวเครื่องออกแบบมาเพื่อรองรับงาน AI หลากหลาย เช่น การประมวลผลภาพ, การเรียนรู้เชิงลึก, การวิเคราะห์ข้อมูล, การใช้งาน IoT และระบบขนส่งอัจฉริยะ โดยสามารถติดตั้ง Ubuntu 22.04.5 และ Linux kernel 5.15 ได้ทันที ส่วน Windows จะรองรับในอนาคต3 แม้จะมีพลังประมวลผลสูงและหน่วยความจำมหาศาล แต่ Orange Pi AI Studio Pro กลับมีข้อจำกัดด้านการเชื่อมต่ออย่างชัดเจน โดยมีเพียงพอร์ต USB-C 4.0 เพียงช่องเดียวสำหรับทุกการเชื่อมต่อ ไม่ว่าจะเป็นจอภาพ, อุปกรณ์เก็บข้อมูล หรืออุปกรณ์เสริมอื่น ๆ ทำให้ผู้ใช้ต้องพึ่งพา dock หรือ hub เพิ่มเติม นอกจากนี้ยังไม่มีการระบุว่ามี Wi-Fi หรือ Bluetooth ในตัว ทำให้การเชื่อมต่อเครือข่ายอาจต้องใช้วิธีอื่น เช่น Ethernet หรืออุปกรณ์เสริมภายนอก ซึ่งอาจไม่สะดวกสำหรับการใช้งานแบบเคลื่อนที่หรือในพื้นที่จำกัด ราคาจำหน่ายในจีนเริ่มต้นที่ประมาณ $955 สำหรับรุ่น 48GB และสูงสุดถึง $2,200 สำหรับรุ่น Pro ที่มี RAM 192GB โดยมีวางจำหน่ายผ่าน JD.com และ AliExpress ✅ ข้อมูลสำคัญจากข่าว ➡️ Orange Pi AI Studio Pro ใช้ชิป Huawei Ascend 310 แบบ ARM octa-core ➡️ รุ่น Pro รวมสองเครื่องเข้าด้วยกัน ให้พลังประมวลผลสูงถึง 352 TOPS ➡️ รองรับหน่วยความจำสูงสุด 192GB LPDDR4X ความเร็ว 4266 Mbps ➡️ รองรับ Ubuntu 22.04.5 และ Linux kernel 5.15 พร้อมรองรับ Windows ในอนาคต ➡️ เหมาะสำหรับงาน AI เช่น OCR, การรู้จำใบหน้า, การแนะนำเนื้อหา, IoT และระบบขนส่งอัจฉริยะ ➡️ มีพอร์ต USB-C 4.0 เพียงช่องเดียวสำหรับทุกการเชื่อมต่อ ➡️ ไม่มีการระบุว่ามี Wi-Fi หรือ Bluetooth ในตัว ➡️ ราคาจำหน่ายเริ่มต้นที่ $955 และสูงสุดถึง $2,200 ขึ้นอยู่กับรุ่นและ RAM ✅ ข้อมูลเสริมจากภายนอก ➡️ Huawei Ascend 310 เป็นชิปที่ออกแบบมาเพื่องาน AI โดยเฉพาะ มีประสิทธิภาพสูงในงาน inference ➡️ Orange Pi เป็นแบรนด์ที่เน้นการพัฒนาอุปกรณ์สำหรับนักพัฒนาและงานวิจัย ➡️ การใช้ context window ขนาดใหญ่และ RAM สูงช่วยให้รองรับโมเดล AI ขนาดใหญ่ได้ดี ➡️ การรองรับ Deepseek-R1 distillation model ช่วยให้สามารถ deploy โมเดล AI แบบ local ได้ ➡️ การรวมการฝึกและการ inference ในเครื่องเดียวช่วยลดต้นทุนและเพิ่มความคล่องตัวในการพัฒนา https://www.tomshardware.com/tech-industry/artificial-intelligence/orange-pi-ai-studio-pro-mini-pc-debuts-with-huawei-ascend-310-and-352-tops-of-ai-performance-also-features-up-to-192gb-of-memory-but-relies-on-a-single-usb-c-port

WWW.TOMSHARDWARE.COM

Huawei-powered mini-PC debuts with Huawei AI chip and 192GB of memory — Orange Pi AI Studio Pro wields Ascend 310 chip with 352 TOPS of AI performance, but relies on a single USB-C port
Powered by the ARM-based Huawei Ascend 310 SoC

0 ความคิดเห็น 0 การแบ่งปัน 333 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-30 02:38:24 -

“DeepSeek-V3.2-Exp เปิดตัวแล้ว — โมเดล AI จีนที่ท้าชน OpenAI ด้วยประสิทธิภาพสูงและต้นทุนต่ำ”

DeepSeek บริษัท AI จากเมืองหางโจว ประเทศจีน ได้เปิดตัวโมเดลใหม่ชื่อว่า DeepSeek-V3.2-Exp ซึ่งถูกระบุว่าเป็น “ขั้นกลาง” ก่อนเข้าสู่สถาปัตยกรรมรุ่นถัดไปที่บริษัทกำลังพัฒนาอยู่ โมเดลนี้ถูกปล่อยผ่านแพลตฟอร์ม Hugging Face และถือเป็นการทดลองเชิงเทคนิคที่มุ่งเน้นการเพิ่มประสิทธิภาพในการฝึกและการประมวลผลข้อความยาว โดยไม่เน้นการไล่คะแนนบน leaderboard แบบเดิม

จุดเด่นของ V3.2-Exp คือการใช้กลไกใหม่ที่เรียกว่า DeepSeek Sparse Attention (DSA) ซึ่งช่วยลดต้นทุนการคำนวณอย่างมาก และยังคงคุณภาพของผลลัพธ์ไว้ใกล้เคียงกับรุ่นก่อนหน้าอย่าง V3.1-Terminus โดยทีมงานได้ตั้งค่าการฝึกให้เหมือนกันทุกประการ เพื่อพิสูจน์ว่า “ความเร็วและประสิทธิภาพ” คือสิ่งที่พัฒนาได้จริง โดยไม่ต้องแลกกับคุณภาพ

นอกจากนี้ DeepSeek ยังประกาศลดราคาการใช้งาน API ลงกว่า 50% เพื่อแข่งขันกับคู่แข่งทั้งในประเทศ เช่น Alibaba Qwen และระดับโลกอย่าง OpenAI ซึ่งถือเป็นการเปิดศึกด้านราคาในตลาดโมเดลภาษาอย่างชัดเจน

แม้โมเดลนี้จะยังไม่ใช่รุ่น “next-gen” ที่หลายคนรอคอย แต่ก็ถือเป็นการกลับมาอย่างมั่นใจของ DeepSeek หลังจากโมเดล R2 ถูกเลื่อนออกไปอย่างไม่มีกำหนด เนื่องจากปัญหาด้านฮาร์ดแวร์ โดยเฉพาะการฝึกบนชิป Ascend ของ Huawei ที่ไม่สามารถทำงานได้ตามเป้า ทำให้ต้องกลับมาใช้ Nvidia อีกครั้ง

ข้อมูลสำคัญจากข่าว
DeepSeek เปิดตัวโมเดลใหม่ชื่อ DeepSeek-V3.2-Exp บน Hugging Face
เป็นการทดลองเพื่อเตรียมเข้าสู่สถาปัตยกรรมรุ่นถัดไปของบริษัท
ใช้กลไก DeepSeek Sparse Attention (DSA) เพื่อเพิ่มประสิทธิภาพการประมวลผลข้อความยาว
ตั้งค่าการฝึกเหมือนกับ V3.1-Terminus เพื่อพิสูจน์ว่า DSA ให้ผลลัพธ์เทียบเท่าแต่เร็วกว่า
ลดราคาการใช้งาน API ลงกว่า 50% เพื่อแข่งขันกับ Alibaba และ OpenAI
ไม่เน้นการไล่คะแนน benchmark แต่เน้นการพิสูจน์ประสิทธิภาพจริง
โมเดลเปิดให้ใช้งานแบบ open-source ภายใต้ MIT License
มีการปล่อย kernel สำหรับงานวิจัยและการใช้งานประสิทธิภาพสูง
เป็นการกลับมาอีกครั้งหลังจากโมเดล R2 ถูกเลื่อนออกไปอย่างไม่มีกำหนด

ข้อมูลเสริมจากภายนอก
Sparse Attention เป็นเทคนิคที่ช่วยลดการคำนวณในโมเดล Transformer โดยเลือกเฉพาะข้อมูลสำคัญ
Hugging Face เป็นแพลตฟอร์มที่นักพัฒนา AI ทั่วโลกใช้ในการเผยแพร่และทดลองโมเดล
การลดราคาการใช้งาน API เป็นกลยุทธ์ที่ใช้บ่อยในการเปิดตลาดใหม่หรือแย่งส่วนแบ่งจากคู่แข่ง
DeepSeek เคยสร้างความฮือฮาใน Silicon Valley ด้วยโมเดล V3 และ R1 ที่มีประสิทธิภาพสูง
ปัญหาการฝึกบนชิป Ascend ของ Huawei สะท้อนความท้าทายของจีนในการพึ่งพาฮาร์ดแวร์ภายในประเทศ

https://www.thestar.com.my/tech/tech-news/2025/09/29/deepseek-releases-model-it-calls-039intermediate-step039-towards-039next-generation-architecture039

🧠 “DeepSeek-V3.2-Exp เปิดตัวแล้ว — โมเดล AI จีนที่ท้าชน OpenAI ด้วยประสิทธิภาพสูงและต้นทุนต่ำ” DeepSeek บริษัท AI จากเมืองหางโจว ประเทศจีน ได้เปิดตัวโมเดลใหม่ชื่อว่า DeepSeek-V3.2-Exp ซึ่งถูกระบุว่าเป็น “ขั้นกลาง” ก่อนเข้าสู่สถาปัตยกรรมรุ่นถัดไปที่บริษัทกำลังพัฒนาอยู่ โมเดลนี้ถูกปล่อยผ่านแพลตฟอร์ม Hugging Face และถือเป็นการทดลองเชิงเทคนิคที่มุ่งเน้นการเพิ่มประสิทธิภาพในการฝึกและการประมวลผลข้อความยาว โดยไม่เน้นการไล่คะแนนบน leaderboard แบบเดิม จุดเด่นของ V3.2-Exp คือการใช้กลไกใหม่ที่เรียกว่า DeepSeek Sparse Attention (DSA) ซึ่งช่วยลดต้นทุนการคำนวณอย่างมาก และยังคงคุณภาพของผลลัพธ์ไว้ใกล้เคียงกับรุ่นก่อนหน้าอย่าง V3.1-Terminus โดยทีมงานได้ตั้งค่าการฝึกให้เหมือนกันทุกประการ เพื่อพิสูจน์ว่า “ความเร็วและประสิทธิภาพ” คือสิ่งที่พัฒนาได้จริง โดยไม่ต้องแลกกับคุณภาพ นอกจากนี้ DeepSeek ยังประกาศลดราคาการใช้งาน API ลงกว่า 50% เพื่อแข่งขันกับคู่แข่งทั้งในประเทศ เช่น Alibaba Qwen และระดับโลกอย่าง OpenAI ซึ่งถือเป็นการเปิดศึกด้านราคาในตลาดโมเดลภาษาอย่างชัดเจน แม้โมเดลนี้จะยังไม่ใช่รุ่น “next-gen” ที่หลายคนรอคอย แต่ก็ถือเป็นการกลับมาอย่างมั่นใจของ DeepSeek หลังจากโมเดล R2 ถูกเลื่อนออกไปอย่างไม่มีกำหนด เนื่องจากปัญหาด้านฮาร์ดแวร์ โดยเฉพาะการฝึกบนชิป Ascend ของ Huawei ที่ไม่สามารถทำงานได้ตามเป้า ทำให้ต้องกลับมาใช้ Nvidia อีกครั้ง ✅ ข้อมูลสำคัญจากข่าว ➡️ DeepSeek เปิดตัวโมเดลใหม่ชื่อ DeepSeek-V3.2-Exp บน Hugging Face ➡️ เป็นการทดลองเพื่อเตรียมเข้าสู่สถาปัตยกรรมรุ่นถัดไปของบริษัท ➡️ ใช้กลไก DeepSeek Sparse Attention (DSA) เพื่อเพิ่มประสิทธิภาพการประมวลผลข้อความยาว ➡️ ตั้งค่าการฝึกเหมือนกับ V3.1-Terminus เพื่อพิสูจน์ว่า DSA ให้ผลลัพธ์เทียบเท่าแต่เร็วกว่า ➡️ ลดราคาการใช้งาน API ลงกว่า 50% เพื่อแข่งขันกับ Alibaba และ OpenAI ➡️ ไม่เน้นการไล่คะแนน benchmark แต่เน้นการพิสูจน์ประสิทธิภาพจริง ➡️ โมเดลเปิดให้ใช้งานแบบ open-source ภายใต้ MIT License ➡️ มีการปล่อย kernel สำหรับงานวิจัยและการใช้งานประสิทธิภาพสูง ➡️ เป็นการกลับมาอีกครั้งหลังจากโมเดล R2 ถูกเลื่อนออกไปอย่างไม่มีกำหนด ✅ ข้อมูลเสริมจากภายนอก ➡️ Sparse Attention เป็นเทคนิคที่ช่วยลดการคำนวณในโมเดล Transformer โดยเลือกเฉพาะข้อมูลสำคัญ ➡️ Hugging Face เป็นแพลตฟอร์มที่นักพัฒนา AI ทั่วโลกใช้ในการเผยแพร่และทดลองโมเดล ➡️ การลดราคาการใช้งาน API เป็นกลยุทธ์ที่ใช้บ่อยในการเปิดตลาดใหม่หรือแย่งส่วนแบ่งจากคู่แข่ง ➡️ DeepSeek เคยสร้างความฮือฮาใน Silicon Valley ด้วยโมเดล V3 และ R1 ที่มีประสิทธิภาพสูง ➡️ ปัญหาการฝึกบนชิป Ascend ของ Huawei สะท้อนความท้าทายของจีนในการพึ่งพาฮาร์ดแวร์ภายในประเทศ https://www.thestar.com.my/tech/tech-news/2025/09/29/deepseek-releases-model-it-calls-039intermediate-step039-towards-039next-generation-architecture039

WWW.THESTAR.COM.MY

DeepSeek releases model it calls 'intermediate step' towards 'next-generation architecture'
BEIJING (Reuters) -Chinese AI developer DeepSeek has released its latest model which it said was an "experimental release" that was more efficient to train and better at processing long sequences of text than previous iterations.

0 ความคิดเห็น 0 การแบ่งปัน 405 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-29 03:42:35 -

“Jensen Huang ชี้จีนตามหลังแค่ ‘นาโนวินาที’ — เรียกร้องให้สหรัฐฯ ผ่อนคลายข้อจำกัดการส่งออกชิป AI”

Jensen Huang ซีอีโอของ Nvidia ออกมาแสดงความเห็นอย่างตรงไปตรงมาในรายการ BG2 Podcast ว่า “จีนตามหลังสหรัฐฯ ในด้านการผลิตชิปแค่ไม่กี่นาโนวินาที” พร้อมเรียกร้องให้รัฐบาลสหรัฐฯ ลดข้อจำกัดการส่งออกชิป AI ไปยังจีน โดยให้เหตุผลว่าการเปิดตลาดจะช่วยขยายอิทธิพลเทคโนโลยีของสหรัฐฯ และรักษาความเป็นผู้นำในระดับโลก

คำพูดของ Huang เกิดขึ้นในช่วงที่ Nvidia กำลังพยายามกลับมาขายชิป H20 ให้กับลูกค้าในจีน หลังจากถูกระงับการส่งออกหลายเดือนจากข้อจำกัดของกระทรวงพาณิชย์สหรัฐฯ ซึ่งเพิ่งเริ่มออกใบอนุญาตให้ส่งออกอีกครั้งในเดือนสิงหาคม 2025

อย่างไรก็ตาม จีนเองก็ไม่ได้รอให้ Nvidia กลับมา เพราะ Huawei ได้เปิดตัวระบบ Atlas 900 A3 SuperPoD ที่ใช้ชิป Ascend 910B ซึ่งไม่พึ่งพา CUDA และออกแบบมาเพื่อซอฟต์แวร์จีนโดยเฉพาะ พร้อมวางแผนพัฒนาชิปรุ่นใหม่ให้เทียบเท่าหรือเหนือกว่าชิปของ Nvidia ภายในปี 2027

Huang ยอมรับว่าจีนเป็นคู่แข่งที่ “หิวโหย เคลื่อนไหวเร็ว และมีวัฒนธรรมการทำงานแบบ 9-9-6” ซึ่งทำให้การพัฒนาเทคโนโลยีในจีนก้าวหน้าอย่างรวดเร็ว โดยเฉพาะเมื่อบริษัทใหญ่อย่าง Baidu, Alibaba, Tencent และ ByteDance ต่างลงทุนในทีมพัฒนาชิปของตัวเองและสนับสนุนสตาร์ทอัพด้านเซมิคอนดักเตอร์

แม้ Nvidia จะพยายามรักษาตลาดจีนด้วยการออกแบบชิปเฉพาะ เช่น H20 และ RTX Pro 6000D แต่ก็ยังถูกจีนสั่งห้ามซื้อในเดือนกันยายน 2025 โดยหน่วยงาน CAC ของจีนให้เหตุผลว่า “ชิปจีนตอนนี้เทียบเท่าหรือดีกว่าชิปที่ Nvidia อนุญาตให้ขายในจีนแล้ว” และเรียกร้องให้บริษัทในประเทศหันไปใช้ชิปภายในประเทศแทน

ข้อมูลสำคัญจากข่าว
Jensen Huang ระบุว่าจีนตามหลังสหรัฐฯ ในการผลิตชิปแค่ “นาโนวินาที”
เรียกร้องให้สหรัฐฯ ลดข้อจำกัดการส่งออกชิป AI เพื่อรักษาอิทธิพลทางเทคโนโลยี
Nvidia หวังกลับมาขายชิป H20 ให้จีนหลังถูกระงับหลายเดือน
กระทรวงพาณิชย์สหรัฐฯ เริ่มออกใบอนุญาตส่งออก H20 ในเดือนสิงหาคม 2025
Huawei เปิดตัว Atlas 900 A3 SuperPoD ที่ใช้ชิป Ascend 910B ไม่พึ่ง CUDA
จีนวางแผนพัฒนาชิป Ascend รุ่นใหม่ให้เทียบเท่าหรือเหนือกว่า Nvidia ภายในปี 2027
บริษัทจีนใหญ่ลงทุนในชิปภายในประเทศ เช่น Baidu, Alibaba, Tencent และ ByteDance
Nvidia เคยครองตลาดจีนถึง 95% แต่ลดลงอย่างรวดเร็วจากข้อจำกัดการส่งออก
CAC ของจีนสั่งห้ามบริษัทในประเทศซื้อชิป H20 และ RTX Pro 6000D

ข้อมูลเสริมจากภายนอก
ชิป H20 และ RTX Pro 6000D ถูกออกแบบมาเพื่อให้ผ่านข้อจำกัดของสหรัฐฯ โดยเฉพาะ
จีนกำลังสร้างระบบ AI ที่ไม่พึ่งพาเทคโนโลยีสหรัฐฯ เช่น CUDA หรือ TensorRT
การพัฒนา AI ในจีนเติบโตเร็วที่สุดในโลก โดยเฉพาะในเมืองใหญ่ เช่น เซินเจิ้นและปักกิ่ง
DeepSeek เป็นโมเดล AI จากจีนที่เทียบเคียงกับ OpenAI และ Anthropic
การแข่งขันด้านชิปส่งผลต่ออุตสาหกรรมอื่น เช่น บล็อกเชนและอินเทอร์เน็ตดาวเทียม

https://www.tomshardware.com/jensen-huang-says-china-is-nanoseconds-behind-in-chips

🇨🇳⚙️ “Jensen Huang ชี้จีนตามหลังแค่ ‘นาโนวินาที’ — เรียกร้องให้สหรัฐฯ ผ่อนคลายข้อจำกัดการส่งออกชิป AI” Jensen Huang ซีอีโอของ Nvidia ออกมาแสดงความเห็นอย่างตรงไปตรงมาในรายการ BG2 Podcast ว่า “จีนตามหลังสหรัฐฯ ในด้านการผลิตชิปแค่ไม่กี่นาโนวินาที” พร้อมเรียกร้องให้รัฐบาลสหรัฐฯ ลดข้อจำกัดการส่งออกชิป AI ไปยังจีน โดยให้เหตุผลว่าการเปิดตลาดจะช่วยขยายอิทธิพลเทคโนโลยีของสหรัฐฯ และรักษาความเป็นผู้นำในระดับโลก คำพูดของ Huang เกิดขึ้นในช่วงที่ Nvidia กำลังพยายามกลับมาขายชิป H20 ให้กับลูกค้าในจีน หลังจากถูกระงับการส่งออกหลายเดือนจากข้อจำกัดของกระทรวงพาณิชย์สหรัฐฯ ซึ่งเพิ่งเริ่มออกใบอนุญาตให้ส่งออกอีกครั้งในเดือนสิงหาคม 2025 อย่างไรก็ตาม จีนเองก็ไม่ได้รอให้ Nvidia กลับมา เพราะ Huawei ได้เปิดตัวระบบ Atlas 900 A3 SuperPoD ที่ใช้ชิป Ascend 910B ซึ่งไม่พึ่งพา CUDA และออกแบบมาเพื่อซอฟต์แวร์จีนโดยเฉพาะ พร้อมวางแผนพัฒนาชิปรุ่นใหม่ให้เทียบเท่าหรือเหนือกว่าชิปของ Nvidia ภายในปี 2027 Huang ยอมรับว่าจีนเป็นคู่แข่งที่ “หิวโหย เคลื่อนไหวเร็ว และมีวัฒนธรรมการทำงานแบบ 9-9-6” ซึ่งทำให้การพัฒนาเทคโนโลยีในจีนก้าวหน้าอย่างรวดเร็ว โดยเฉพาะเมื่อบริษัทใหญ่อย่าง Baidu, Alibaba, Tencent และ ByteDance ต่างลงทุนในทีมพัฒนาชิปของตัวเองและสนับสนุนสตาร์ทอัพด้านเซมิคอนดักเตอร์ แม้ Nvidia จะพยายามรักษาตลาดจีนด้วยการออกแบบชิปเฉพาะ เช่น H20 และ RTX Pro 6000D แต่ก็ยังถูกจีนสั่งห้ามซื้อในเดือนกันยายน 2025 โดยหน่วยงาน CAC ของจีนให้เหตุผลว่า “ชิปจีนตอนนี้เทียบเท่าหรือดีกว่าชิปที่ Nvidia อนุญาตให้ขายในจีนแล้ว” และเรียกร้องให้บริษัทในประเทศหันไปใช้ชิปภายในประเทศแทน ✅ ข้อมูลสำคัญจากข่าว ➡️ Jensen Huang ระบุว่าจีนตามหลังสหรัฐฯ ในการผลิตชิปแค่ “นาโนวินาที” ➡️ เรียกร้องให้สหรัฐฯ ลดข้อจำกัดการส่งออกชิป AI เพื่อรักษาอิทธิพลทางเทคโนโลยี ➡️ Nvidia หวังกลับมาขายชิป H20 ให้จีนหลังถูกระงับหลายเดือน ➡️ กระทรวงพาณิชย์สหรัฐฯ เริ่มออกใบอนุญาตส่งออก H20 ในเดือนสิงหาคม 2025 ➡️ Huawei เปิดตัว Atlas 900 A3 SuperPoD ที่ใช้ชิป Ascend 910B ไม่พึ่ง CUDA ➡️ จีนวางแผนพัฒนาชิป Ascend รุ่นใหม่ให้เทียบเท่าหรือเหนือกว่า Nvidia ภายในปี 2027 ➡️ บริษัทจีนใหญ่ลงทุนในชิปภายในประเทศ เช่น Baidu, Alibaba, Tencent และ ByteDance ➡️ Nvidia เคยครองตลาดจีนถึง 95% แต่ลดลงอย่างรวดเร็วจากข้อจำกัดการส่งออก ➡️ CAC ของจีนสั่งห้ามบริษัทในประเทศซื้อชิป H20 และ RTX Pro 6000D ✅ ข้อมูลเสริมจากภายนอก ➡️ ชิป H20 และ RTX Pro 6000D ถูกออกแบบมาเพื่อให้ผ่านข้อจำกัดของสหรัฐฯ โดยเฉพาะ ➡️ จีนกำลังสร้างระบบ AI ที่ไม่พึ่งพาเทคโนโลยีสหรัฐฯ เช่น CUDA หรือ TensorRT ➡️ การพัฒนา AI ในจีนเติบโตเร็วที่สุดในโลก โดยเฉพาะในเมืองใหญ่ เช่น เซินเจิ้นและปักกิ่ง ➡️ DeepSeek เป็นโมเดล AI จากจีนที่เทียบเคียงกับ OpenAI และ Anthropic ➡️ การแข่งขันด้านชิปส่งผลต่ออุตสาหกรรมอื่น เช่น บล็อกเชนและอินเทอร์เน็ตดาวเทียม https://www.tomshardware.com/jensen-huang-says-china-is-nanoseconds-behind-in-chips

WWW.TOMSHARDWARE.COM

Jensen Huang says China is ‘nanoseconds behind’ the US in chipmaking, calls for reducing US export restrictions on Nvidia's AI chips
As Chinese firms scale and U.S. export rules tighten, Nvidia is fighting to keep a foothold in China.

0 ความคิดเห็น 0 การแบ่งปัน 505 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-24 03:44:35 -

“Fenghua No.3 GPU จากจีนเปิดตัวแรง — เคลมรองรับ CUDA, Ray Tracing, และมี HBM กว่า 112GB สำหรับ AI ขนาดใหญ่”

Innosilicon บริษัทผู้ผลิตชิปจากจีนเปิดตัวกราฟิกการ์ดรุ่นใหม่ “Fenghua No.3” ซึ่งถือเป็นก้าวกระโดดครั้งสำคัญของอุตสาหกรรม GPU ในประเทศ โดยชูจุดเด่นว่าเป็น GPU แบบ “all-function” ที่รองรับทั้งงาน AI, การประมวลผลทางวิทยาศาสตร์, CAD, การแพทย์ และเกม พร้อมเคลมว่า “รองรับ CUDA” ซึ่งเป็นแพลตฟอร์มเฉพาะของ Nvidia — หากเป็นจริง จะถือเป็นครั้งแรกที่ GPU จากจีนสามารถใช้งานซอฟต์แวร์ที่พัฒนาบน CUDA ได้โดยตรง

Fenghua No.3 ใช้สถาปัตยกรรม RISC-V แบบ open-source แทน PowerVR ที่เคยใช้ในรุ่นก่อนหน้า และมีการออกแบบใหม่ทั้งหมดจากภายในประเทศ โดยอ้างว่าใช้เทคโนโลยีจากโครงการ Nanhu V3 ของ OpenCore Institute

ด้านการเล่นเกม Fenghua No.3 รองรับ API สมัยใหม่อย่าง DirectX 12, Vulkan 1.2 และ OpenGL 4.6 พร้อมฟีเจอร์ Ray Tracing และสามารถรันเกมอย่าง Tomb Raider, Delta Force และ Valorant ได้อย่างลื่นไหลในการสาธิต แม้จะไม่มีข้อมูลเฟรมเรตหรือความละเอียดที่ใช้ในการทดสอบ

สำหรับงาน AI Fenghua No.3 มาพร้อมหน่วยความจำ HBM มากกว่า 112GB ซึ่งสามารถรันโมเดลขนาด 32B และ 72B ได้ด้วยการ์ดเดียว และสามารถรันโมเดลขนาด 671B และ 685B ได้เมื่อใช้การ์ด 8 ใบร่วมกัน โดยรองรับโมเดล DeepSeek V3, R1, V3.1 และ Qwen 2.5, Qwen 3 อย่างเต็มรูปแบบ

นอกจากนี้ยังเป็น GPU ตัวแรกของจีนที่รองรับฟอร์แมต YUV444 สำหรับงานภาพละเอียดสูง และสามารถแสดงผลบนจอ 8K ได้พร้อมกันถึง 6 จอที่ 30Hz อีกทั้งยังรองรับ DICOM สำหรับการแสดงผลภาพทางการแพทย์ เช่น MRI และ CT scan โดยไม่ต้องใช้จอ grayscale เฉพาะทาง

ข้อมูลสำคัญจากข่าว
Fenghua No.3 เป็น GPU รุ่นใหม่จาก Innosilicon ประเทศจีน
ใช้สถาปัตยกรรม RISC-V และออกแบบใหม่ทั้งหมดภายในประเทศ
เคลมว่ารองรับ CUDA ซึ่งเป็นแพลตฟอร์มเฉพาะของ Nvidia
รองรับ DirectX 12, Vulkan 1.2, OpenGL 4.6 และ Ray Tracing
รันเกม Tomb Raider, Delta Force, Valorant ได้ในการสาธิต
มาพร้อม HBM มากกว่า 112GB สำหรับงาน AI ขนาดใหญ่
รองรับโมเดล DeepSeek และ Qwen หลายเวอร์ชัน
รองรับ YUV444 สำหรับงาน CAD และวิดีโอ
แสดงผล 8K ได้พร้อมกัน 6 จอที่ 30Hz
รองรับ DICOM สำหรับภาพทางการแพทย์โดยไม่ต้องใช้จอเฉพาะ

ข้อมูลเสริมจากภายนอก
CUDA เป็นแพลตฟอร์มที่ Nvidia ใช้สำหรับงาน AI และ HPC โดยทั่วไปไม่เปิดให้ GPU อื่นใช้งาน
RISC-V เป็นสถาปัตยกรรมแบบเปิดที่กำลังได้รับความนิยมในจีนเพื่อหลีกเลี่ยงการพึ่งพา IP จากตะวันตก
HBM (High Bandwidth Memory) เป็นหน่วยความจำที่เร็วและเหมาะกับงาน AI มากกว่า GDDR
YUV444 ให้ความละเอียดสีสูงกว่าฟอร์แมตทั่วไป เช่น YUV420 ซึ่งใช้ในวิดีโอสตรีมมิ่ง
DICOM เป็นมาตรฐานภาพทางการแพทย์ที่ใช้ในโรงพยาบาลทั่วโลก

https://www.tomshardware.com/pc-components/gpus/chinas-latest-gpu-arrives-with-claims-of-cuda-compatibility-and-rt-support-fenghua-no-3-also-boasts-112gb-of-hbm-memory-for-ai

🚀 “Fenghua No.3 GPU จากจีนเปิดตัวแรง — เคลมรองรับ CUDA, Ray Tracing, และมี HBM กว่า 112GB สำหรับ AI ขนาดใหญ่” Innosilicon บริษัทผู้ผลิตชิปจากจีนเปิดตัวกราฟิกการ์ดรุ่นใหม่ “Fenghua No.3” ซึ่งถือเป็นก้าวกระโดดครั้งสำคัญของอุตสาหกรรม GPU ในประเทศ โดยชูจุดเด่นว่าเป็น GPU แบบ “all-function” ที่รองรับทั้งงาน AI, การประมวลผลทางวิทยาศาสตร์, CAD, การแพทย์ และเกม พร้อมเคลมว่า “รองรับ CUDA” ซึ่งเป็นแพลตฟอร์มเฉพาะของ Nvidia — หากเป็นจริง จะถือเป็นครั้งแรกที่ GPU จากจีนสามารถใช้งานซอฟต์แวร์ที่พัฒนาบน CUDA ได้โดยตรง Fenghua No.3 ใช้สถาปัตยกรรม RISC-V แบบ open-source แทน PowerVR ที่เคยใช้ในรุ่นก่อนหน้า และมีการออกแบบใหม่ทั้งหมดจากภายในประเทศ โดยอ้างว่าใช้เทคโนโลยีจากโครงการ Nanhu V3 ของ OpenCore Institute ด้านการเล่นเกม Fenghua No.3 รองรับ API สมัยใหม่อย่าง DirectX 12, Vulkan 1.2 และ OpenGL 4.6 พร้อมฟีเจอร์ Ray Tracing และสามารถรันเกมอย่าง Tomb Raider, Delta Force และ Valorant ได้อย่างลื่นไหลในการสาธิต แม้จะไม่มีข้อมูลเฟรมเรตหรือความละเอียดที่ใช้ในการทดสอบ สำหรับงาน AI Fenghua No.3 มาพร้อมหน่วยความจำ HBM มากกว่า 112GB ซึ่งสามารถรันโมเดลขนาด 32B และ 72B ได้ด้วยการ์ดเดียว และสามารถรันโมเดลขนาด 671B และ 685B ได้เมื่อใช้การ์ด 8 ใบร่วมกัน โดยรองรับโมเดล DeepSeek V3, R1, V3.1 และ Qwen 2.5, Qwen 3 อย่างเต็มรูปแบบ นอกจากนี้ยังเป็น GPU ตัวแรกของจีนที่รองรับฟอร์แมต YUV444 สำหรับงานภาพละเอียดสูง และสามารถแสดงผลบนจอ 8K ได้พร้อมกันถึง 6 จอที่ 30Hz อีกทั้งยังรองรับ DICOM สำหรับการแสดงผลภาพทางการแพทย์ เช่น MRI และ CT scan โดยไม่ต้องใช้จอ grayscale เฉพาะทาง ✅ ข้อมูลสำคัญจากข่าว ➡️ Fenghua No.3 เป็น GPU รุ่นใหม่จาก Innosilicon ประเทศจีน ➡️ ใช้สถาปัตยกรรม RISC-V และออกแบบใหม่ทั้งหมดภายในประเทศ ➡️ เคลมว่ารองรับ CUDA ซึ่งเป็นแพลตฟอร์มเฉพาะของ Nvidia ➡️ รองรับ DirectX 12, Vulkan 1.2, OpenGL 4.6 และ Ray Tracing ➡️ รันเกม Tomb Raider, Delta Force, Valorant ได้ในการสาธิต ➡️ มาพร้อม HBM มากกว่า 112GB สำหรับงาน AI ขนาดใหญ่ ➡️ รองรับโมเดล DeepSeek และ Qwen หลายเวอร์ชัน ➡️ รองรับ YUV444 สำหรับงาน CAD และวิดีโอ ➡️ แสดงผล 8K ได้พร้อมกัน 6 จอที่ 30Hz ➡️ รองรับ DICOM สำหรับภาพทางการแพทย์โดยไม่ต้องใช้จอเฉพาะ ✅ ข้อมูลเสริมจากภายนอก ➡️ CUDA เป็นแพลตฟอร์มที่ Nvidia ใช้สำหรับงาน AI และ HPC โดยทั่วไปไม่เปิดให้ GPU อื่นใช้งาน ➡️ RISC-V เป็นสถาปัตยกรรมแบบเปิดที่กำลังได้รับความนิยมในจีนเพื่อหลีกเลี่ยงการพึ่งพา IP จากตะวันตก ➡️ HBM (High Bandwidth Memory) เป็นหน่วยความจำที่เร็วและเหมาะกับงาน AI มากกว่า GDDR ➡️ YUV444 ให้ความละเอียดสีสูงกว่าฟอร์แมตทั่วไป เช่น YUV420 ซึ่งใช้ในวิดีโอสตรีมมิ่ง ➡️ DICOM เป็นมาตรฐานภาพทางการแพทย์ที่ใช้ในโรงพยาบาลทั่วโลก https://www.tomshardware.com/pc-components/gpus/chinas-latest-gpu-arrives-with-claims-of-cuda-compatibility-and-rt-support-fenghua-no-3-also-boasts-112gb-of-hbm-memory-for-ai

WWW.TOMSHARDWARE.COM

China's latest GPU arrives with claims of CUDA compatibility and RT support — Fenghua No.3 also boasts 112GB+ of HBM memory for AI
The third time may finally be the charm for Fenghua GPUs.

0 ความคิดเห็น 0 การแบ่งปัน 395 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-18 04:03:34 -

Intel Gaudi 3 ฝ่าด่านตลาด AI ด้วยการจับมือ Dell — เปิดตัวในเซิร์ฟเวอร์ PowerEdge XE7740 พร้อมความหวังใหม่ในยุคที่ NVIDIA ครองเกม

หลังจากที่ Intel พยายามผลักดันไลน์ผลิตภัณฑ์ด้าน AI มาหลายปีโดยไม่ประสบความสำเร็จเท่าที่ควร ล่าสุด Gaudi 3 ซึ่งเป็นชิปเร่งความเร็ว AI รุ่นใหม่ของ Intel ได้รับการบรรจุในเซิร์ฟเวอร์ Dell PowerEdge XE7740 อย่างเป็นทางการ ถือเป็นหนึ่งใน “ชัยชนะเล็ก ๆ” ที่อาจพลิกเกมให้ Intel กลับมาแข่งขันกับ NVIDIA และ AMD ได้อีกครั้ง

PowerEdge XE7740 เป็นเซิร์ฟเวอร์ระดับองค์กรที่ออกแบบมาเพื่อรองรับงาน AI โดยเฉพาะ รองรับ Gaudi 3 ได้สูงสุด 8 ตัวในระบบเดียว พร้อมระบบเครือข่ายแบบ 1:1 ระหว่าง accelerator และ NIC เพื่อเพิ่มประสิทธิภาพการประมวลผลและการเชื่อมต่อ นอกจากนี้ยังรองรับโมเดล AI ยอดนิยม เช่น Llama4, Deepseek, Phi4 และ Falcon3

Dell ชูจุดเด่นของ Gaudi 3 ว่า “คุ้มค่า” และ “ปรับขนาดได้ง่าย” โดยเฉพาะในองค์กรที่มีข้อจำกัดด้านพลังงานและระบบระบายความร้อน ซึ่ง Gaudi 3 ถูกออกแบบมาให้ทำงานได้ดีในแร็คขนาด ~10kW ที่พบได้ทั่วไปในดาต้าเซ็นเตอร์

แม้ Dell ยังไม่เปิดเผยตัวเลขประสิทธิภาพอย่างเป็นทางการ แต่จากการทดสอบก่อนหน้านี้ Gaudi 3 เคยแสดงผลลัพธ์ที่เร็วกว่า NVIDIA H100 และ H200 ในบางงาน inferencing ซึ่งหากเป็นจริง ก็อาจเป็นจุดเปลี่ยนสำคัญของ Intel ในตลาด AI ที่เคยถูกมองว่า “ช้าเกินไป”

Intel Gaudi 3 ได้รับการบรรจุในเซิร์ฟเวอร์ Dell PowerEdge XE7740
ถือเป็นการบุกตลาดองค์กรครั้งสำคัญของ Intel
Dell เป็นหนึ่งในผู้ผลิตรายแรกที่นำ Gaudi 3 มาใช้ในระบบจริง

PowerEdge XE7740 รองรับงาน AI เต็มรูปแบบ
รองรับ Gaudi 3 ได้สูงสุด 8 ตัวในระบบเดียว
มีระบบเครือข่ายแบบ 1:1 ระหว่าง accelerator และ NIC
รองรับโมเดล AI ยอดนิยม เช่น Llama4, Phi4, Falcon3

จุดเด่นของ Gaudi 3 คือความคุ้มค่าและความยืดหยุ่น
เหมาะกับองค์กรที่มีข้อจำกัดด้านพลังงานและระบบระบายความร้อน
รองรับการเชื่อมต่อแบบ RoCE v2 สำหรับงานขนาดใหญ่

Dell ชูจุดเด่นด้านการปรับขนาดและการติดตั้งง่าย
ใช้แชสซีแบบ 4U ที่ระบายความร้อนได้ดี
รองรับการติดตั้งในแร็คมาตรฐาน ~10kW โดยไม่ต้องปรับโครงสร้าง

Gaudi 3 เคยแสดงผลลัพธ์ดีกว่า NVIDIA H100/H200 ในบางงาน
โดยเฉพาะงาน inferencing ที่เน้นประสิทธิภาพต่อวัตต์
ยังต้องรอผลการทดสอบจาก Dell เพื่อยืนยัน

https://wccftech.com/intel-gaudi-3-ai-chips-secure-rare-integration-in-dell-poweredge-servers/

📰 Intel Gaudi 3 ฝ่าด่านตลาด AI ด้วยการจับมือ Dell — เปิดตัวในเซิร์ฟเวอร์ PowerEdge XE7740 พร้อมความหวังใหม่ในยุคที่ NVIDIA ครองเกม หลังจากที่ Intel พยายามผลักดันไลน์ผลิตภัณฑ์ด้าน AI มาหลายปีโดยไม่ประสบความสำเร็จเท่าที่ควร ล่าสุด Gaudi 3 ซึ่งเป็นชิปเร่งความเร็ว AI รุ่นใหม่ของ Intel ได้รับการบรรจุในเซิร์ฟเวอร์ Dell PowerEdge XE7740 อย่างเป็นทางการ ถือเป็นหนึ่งใน “ชัยชนะเล็ก ๆ” ที่อาจพลิกเกมให้ Intel กลับมาแข่งขันกับ NVIDIA และ AMD ได้อีกครั้ง PowerEdge XE7740 เป็นเซิร์ฟเวอร์ระดับองค์กรที่ออกแบบมาเพื่อรองรับงาน AI โดยเฉพาะ รองรับ Gaudi 3 ได้สูงสุด 8 ตัวในระบบเดียว พร้อมระบบเครือข่ายแบบ 1:1 ระหว่าง accelerator และ NIC เพื่อเพิ่มประสิทธิภาพการประมวลผลและการเชื่อมต่อ นอกจากนี้ยังรองรับโมเดล AI ยอดนิยม เช่น Llama4, Deepseek, Phi4 และ Falcon3 Dell ชูจุดเด่นของ Gaudi 3 ว่า “คุ้มค่า” และ “ปรับขนาดได้ง่าย” โดยเฉพาะในองค์กรที่มีข้อจำกัดด้านพลังงานและระบบระบายความร้อน ซึ่ง Gaudi 3 ถูกออกแบบมาให้ทำงานได้ดีในแร็คขนาด ~10kW ที่พบได้ทั่วไปในดาต้าเซ็นเตอร์ แม้ Dell ยังไม่เปิดเผยตัวเลขประสิทธิภาพอย่างเป็นทางการ แต่จากการทดสอบก่อนหน้านี้ Gaudi 3 เคยแสดงผลลัพธ์ที่เร็วกว่า NVIDIA H100 และ H200 ในบางงาน inferencing ซึ่งหากเป็นจริง ก็อาจเป็นจุดเปลี่ยนสำคัญของ Intel ในตลาด AI ที่เคยถูกมองว่า “ช้าเกินไป” ✅ Intel Gaudi 3 ได้รับการบรรจุในเซิร์ฟเวอร์ Dell PowerEdge XE7740 ➡️ ถือเป็นการบุกตลาดองค์กรครั้งสำคัญของ Intel ➡️ Dell เป็นหนึ่งในผู้ผลิตรายแรกที่นำ Gaudi 3 มาใช้ในระบบจริง ✅ PowerEdge XE7740 รองรับงาน AI เต็มรูปแบบ ➡️ รองรับ Gaudi 3 ได้สูงสุด 8 ตัวในระบบเดียว ➡️ มีระบบเครือข่ายแบบ 1:1 ระหว่าง accelerator และ NIC ➡️ รองรับโมเดล AI ยอดนิยม เช่น Llama4, Phi4, Falcon3 ✅ จุดเด่นของ Gaudi 3 คือความคุ้มค่าและความยืดหยุ่น ➡️ เหมาะกับองค์กรที่มีข้อจำกัดด้านพลังงานและระบบระบายความร้อน ➡️ รองรับการเชื่อมต่อแบบ RoCE v2 สำหรับงานขนาดใหญ่ ✅ Dell ชูจุดเด่นด้านการปรับขนาดและการติดตั้งง่าย ➡️ ใช้แชสซีแบบ 4U ที่ระบายความร้อนได้ดี ➡️ รองรับการติดตั้งในแร็คมาตรฐาน ~10kW โดยไม่ต้องปรับโครงสร้าง ✅ Gaudi 3 เคยแสดงผลลัพธ์ดีกว่า NVIDIA H100/H200 ในบางงาน ➡️ โดยเฉพาะงาน inferencing ที่เน้นประสิทธิภาพต่อวัตต์ ➡️ ยังต้องรอผลการทดสอบจาก Dell เพื่อยืนยัน https://wccftech.com/intel-gaudi-3-ai-chips-secure-rare-integration-in-dell-poweredge-servers/

WCCFTECH.COM

Intel’s Gaudi 3 AI Chips Secure Integration in Dell’s PowerEdge Servers, Marking One of the Few Wins for the Struggling Lineup
Intel's Gaudi 3 AI chips have seen a rather 'rare' feature from Dell's AI servers, which are claimed to be cost-efficient and scalable.

0 ความคิดเห็น 0 การแบ่งปัน 347 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-17 03:51:14 -

“AMD เตรียมปล่อย ROCm 7.0 — ซอฟต์แวร์ AI ที่หวังโค่น CUDA ด้วยประสิทธิภาพทะลุ Blackwell”

AMD กำลังเตรียมเปิดตัว ROCm 7.0 ซึ่งเป็นเวอร์ชันใหม่ของชุดซอฟต์แวร์สำหรับการประมวลผล AI และ HPC โดยมีเป้าหมายชัดเจน: สร้างทางเลือกที่แท้จริงให้กับนักพัฒนาแทนการพึ่งพา CUDA ของ NVIDIA ที่ครองตลาดมายาวนาน ROCm 7.0 ถูกเพิ่มเข้าใน GitHub แล้ว และคาดว่าจะเปิดตัวภายในไม่กี่สัปดาห์ข้างหน้า

ในงาน Advancing AI ล่าสุด AMD ได้เผยว่า ROCm 7.0 จะมาพร้อมการปรับปรุงครั้งใหญ่ โดยเฉพาะด้าน inferencing และ training ซึ่งสามารถเพิ่มประสิทธิภาพได้ถึง 3.5 เท่าเมื่อเทียบกับ ROCm 6 และที่น่าตื่นเต้นที่สุดคือ Instinct MI355X สามารถทำ FP8 throughput ได้สูงกว่า Blackwell B200 ของ NVIDIA ถึง 30% ในโมเดล DeepSeek R1

ROCm 7.0 ยังรองรับฟีเจอร์ใหม่ เช่น HIP 7.0, การจัดการคลัสเตอร์, และเครื่องมือสำหรับองค์กร พร้อม Docker image ที่ปรับแต่งมาแล้วสำหรับ MI355, MI350, MI325 และ MI300 โดยสามารถใช้งานร่วมกับโมเดลขนาดใหญ่ที่ถูก quantize ด้วย AMD Quark เช่น Llama 3.3 70B และ gpt-oss-120B

เมื่อเปรียบเทียบกับ CUDA ล่าสุด พบว่า ROCm บน MI325X มีข้อได้เปรียบในหลายด้าน เช่น VRAM ขนาด 256GB ต่อ GPU ที่ช่วยลดความซับซ้อนของ pipeline และรองรับ batch ใหญ่ ๆ ได้ดี รวมถึงการทำงานร่วมกับ Hugging Face และ DeepSpeed ได้แบบ native โดยไม่ต้อง patch เพิ่ม

แม้ ROCm จะยังตามหลัง CUDA ในบางด้าน เช่น ecosystem ที่ยังไม่สมบูรณ์ และ library เฉพาะบางตัวที่ต้องปรับแต่งเอง แต่ก็ถือว่าเป็นทางเลือกที่จริงจังสำหรับองค์กรที่ต้องการลดต้นทุนและหลีกเลี่ยงการผูกขาดด้านฮาร์ดแวร์

ข้อมูลสำคัญจากข่าว
AMD เตรียมเปิดตัว ROCm 7.0 เพื่อเป็นทางเลือกแทน CUDA
เพิ่มประสิทธิภาพ inferencing และ training สูงถึง 3.5 เท่าเมื่อเทียบกับ ROCm 6
MI355X ทำ FP8 throughput ได้สูงกว่า Blackwell B200 ถึง 30%
มี Docker image สำหรับ MI355, MI350, MI325 และ MI300 พร้อมใช้งาน

ฟีเจอร์ใหม่และการรองรับ
รองรับ HIP 7.0, การจัดการคลัสเตอร์ และเครื่องมือสำหรับองค์กร
ใช้งานร่วมกับโมเดล MXFP4 และ FP8 ที่ถูก quantize ด้วย AMD Quark
รองรับ DeepSeek R1, Llama 3.3 70B, gpt-oss-120B และอื่น ๆ
ทำงานร่วมกับ Hugging Face และ DeepSpeed ได้แบบ native

ข้อมูลเสริมจากภายนอก
MI325X มี VRAM 256GB ต่อ GPU — เหนือกว่า H100 ที่ต้องแบ่งโมเดล
ROCm ไม่ล็อกผู้ใช้กับฮาร์ดแวร์เฉพาะเหมือน CUDA
TensorWave และ Scimus เริ่มให้บริการคลัสเตอร์ ROCm สำหรับองค์กร
ROCm เหมาะกับงาน inference ขนาดใหญ่และ training ที่เน้นต้นทุนต่อ TFLOP

https://wccftech.com/amd-initiates-work-on-rocm-7-compute-stack/

🚀 “AMD เตรียมปล่อย ROCm 7.0 — ซอฟต์แวร์ AI ที่หวังโค่น CUDA ด้วยประสิทธิภาพทะลุ Blackwell” AMD กำลังเตรียมเปิดตัว ROCm 7.0 ซึ่งเป็นเวอร์ชันใหม่ของชุดซอฟต์แวร์สำหรับการประมวลผล AI และ HPC โดยมีเป้าหมายชัดเจน: สร้างทางเลือกที่แท้จริงให้กับนักพัฒนาแทนการพึ่งพา CUDA ของ NVIDIA ที่ครองตลาดมายาวนาน ROCm 7.0 ถูกเพิ่มเข้าใน GitHub แล้ว และคาดว่าจะเปิดตัวภายในไม่กี่สัปดาห์ข้างหน้า ในงาน Advancing AI ล่าสุด AMD ได้เผยว่า ROCm 7.0 จะมาพร้อมการปรับปรุงครั้งใหญ่ โดยเฉพาะด้าน inferencing และ training ซึ่งสามารถเพิ่มประสิทธิภาพได้ถึง 3.5 เท่าเมื่อเทียบกับ ROCm 6 และที่น่าตื่นเต้นที่สุดคือ Instinct MI355X สามารถทำ FP8 throughput ได้สูงกว่า Blackwell B200 ของ NVIDIA ถึง 30% ในโมเดล DeepSeek R1 ROCm 7.0 ยังรองรับฟีเจอร์ใหม่ เช่น HIP 7.0, การจัดการคลัสเตอร์, และเครื่องมือสำหรับองค์กร พร้อม Docker image ที่ปรับแต่งมาแล้วสำหรับ MI355, MI350, MI325 และ MI300 โดยสามารถใช้งานร่วมกับโมเดลขนาดใหญ่ที่ถูก quantize ด้วย AMD Quark เช่น Llama 3.3 70B และ gpt-oss-120B เมื่อเปรียบเทียบกับ CUDA ล่าสุด พบว่า ROCm บน MI325X มีข้อได้เปรียบในหลายด้าน เช่น VRAM ขนาด 256GB ต่อ GPU ที่ช่วยลดความซับซ้อนของ pipeline และรองรับ batch ใหญ่ ๆ ได้ดี รวมถึงการทำงานร่วมกับ Hugging Face และ DeepSpeed ได้แบบ native โดยไม่ต้อง patch เพิ่ม แม้ ROCm จะยังตามหลัง CUDA ในบางด้าน เช่น ecosystem ที่ยังไม่สมบูรณ์ และ library เฉพาะบางตัวที่ต้องปรับแต่งเอง แต่ก็ถือว่าเป็นทางเลือกที่จริงจังสำหรับองค์กรที่ต้องการลดต้นทุนและหลีกเลี่ยงการผูกขาดด้านฮาร์ดแวร์ ✅ ข้อมูลสำคัญจากข่าว ➡️ AMD เตรียมเปิดตัว ROCm 7.0 เพื่อเป็นทางเลือกแทน CUDA ➡️ เพิ่มประสิทธิภาพ inferencing และ training สูงถึง 3.5 เท่าเมื่อเทียบกับ ROCm 6 ➡️ MI355X ทำ FP8 throughput ได้สูงกว่า Blackwell B200 ถึง 30% ➡️ มี Docker image สำหรับ MI355, MI350, MI325 และ MI300 พร้อมใช้งาน ✅ ฟีเจอร์ใหม่และการรองรับ ➡️ รองรับ HIP 7.0, การจัดการคลัสเตอร์ และเครื่องมือสำหรับองค์กร ➡️ ใช้งานร่วมกับโมเดล MXFP4 และ FP8 ที่ถูก quantize ด้วย AMD Quark ➡️ รองรับ DeepSeek R1, Llama 3.3 70B, gpt-oss-120B และอื่น ๆ ➡️ ทำงานร่วมกับ Hugging Face และ DeepSpeed ได้แบบ native ✅ ข้อมูลเสริมจากภายนอก ➡️ MI325X มี VRAM 256GB ต่อ GPU — เหนือกว่า H100 ที่ต้องแบ่งโมเดล ➡️ ROCm ไม่ล็อกผู้ใช้กับฮาร์ดแวร์เฉพาะเหมือน CUDA ➡️ TensorWave และ Scimus เริ่มให้บริการคลัสเตอร์ ROCm สำหรับองค์กร ➡️ ROCm เหมาะกับงาน inference ขนาดใหญ่และ training ที่เน้นต้นทุนต่อ TFLOP https://wccftech.com/amd-initiates-work-on-rocm-7-compute-stack/

WCCFTECH.COM

AMD Preps To Release the ROCm 7.0 Compute Stack, Aiming to Position It as a Viable Alternative to NVIDIA's CUDA Ecosystem
AMD has started working on releasing the ROCm 7 software stack, which was being hyped up as a way to break NVIDIA's CUDA 'lock-in' ecosystem.

0 ความคิดเห็น 0 การแบ่งปัน 317 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-17 03:22:38 -

“Tencent หันหลังให้ Nvidia — ปรับโครงสร้าง AI สู่ชิปจีนเต็มรูปแบบ ท่ามกลางแรงกดดันจากสงครามเทคโนโลยี”

Tencent บริษัทเทคโนโลยียักษ์ใหญ่ของจีน ประกาศอย่างเป็นทางการในงาน Global Digital Ecosystem Summit เมื่อวันที่ 16 กันยายน 2025 ว่าได้ “ปรับโครงสร้างระบบประมวลผล AI ทั้งหมด” เพื่อรองรับชิปที่ออกแบบโดยบริษัทจีน โดยไม่พึ่งพา Nvidia อีกต่อไป ถือเป็นการเปลี่ยนแปลงครั้งใหญ่ในยุทธศาสตร์ด้านฮาร์ดแวร์ของบริษัท และสะท้อนแนวโน้มการพึ่งพาตนเองของจีนในยุคที่การส่งออกเทคโนโลยีจากสหรัฐฯ ถูกจำกัดอย่างเข้มงวด

Qiu Yuepeng ประธาน Tencent Cloud ยืนยันว่าบริษัทได้ใช้ “ชิปจีนกระแสหลัก” ในการผลิตจริง ไม่ใช่แค่ทดลอง และกำลังร่วมมือกับผู้ผลิตชิปหลายรายเพื่อเลือกฮาร์ดแวร์ที่เหมาะสมกับแต่ละงาน พร้อมลงทุนระยะยาวเพื่อพัฒนาโครงสร้างร่วมระหว่างฮาร์ดแวร์และซอฟต์แวร์ เพื่อลดต้นทุนการประมวลผล

การประกาศนี้เกิดขึ้นเพียงหนึ่งวันหลังจากหน่วยงานกำกับดูแลของจีนเปิดเผยว่า Nvidia ละเมิดกฎการควบรวมกิจการจากการซื้อ Mellanox ในปี 2019 ซึ่งเพิ่มแรงกดดันให้บริษัทจีนต้องเร่งพัฒนาเทคโนโลยีของตนเอง

แม้ Tencent จะไม่เปิดเผยชื่อชิปที่ใช้งานจริง แต่หลายฝ่ายคาดว่าเป็น Huawei Ascend ซึ่งมีการใช้งานแล้วใน ByteDance และได้รับการสนับสนุนจากเฟรมเวิร์ก MindSpore ที่พัฒนาอย่างต่อเนื่อง อย่างไรก็ตาม ยังมีข้อสงสัยว่าชิปเหล่านี้จะสามารถรองรับการฝึกโมเดลขนาดใหญ่ได้จริงหรือไม่ เนื่องจาก Huawei ถูกคาดว่าจะผลิตได้เพียง 200,000 ชิป AI ในปีหน้า

Tencent ยังระบุว่ามีชิปสำหรับการฝึกโมเดลเพียงพอในคลัง และมี “หลายทางเลือก” สำหรับ inference ซึ่งสะท้อนถึงการกระจายความเสี่ยงด้านซัพพลายเชนอย่างชัดเจน

ข้อมูลสำคัญจากข่าว
Tencent ประกาศปรับโครงสร้างระบบ AI เพื่อรองรับชิปจีนเต็มรูปแบบ
ใช้ชิปจีนกระแสหลักในระดับการผลิตจริง ไม่ใช่แค่ทดลอง
ร่วมมือกับผู้ผลิตหลายรายเพื่อเลือกฮาร์ดแวร์ที่เหมาะสมกับแต่ละงาน
ลงทุนระยะยาวเพื่อพัฒนาโครงสร้างร่วมระหว่างฮาร์ดแวร์และซอฟต์แวร์

ความเคลื่อนไหวที่เกี่ยวข้อง
Nvidia ถูกกล่าวหาว่าละเมิดกฎการควบรวมกิจการในจีนจากดีล Mellanox
Tencent มีชิปสำหรับการฝึกโมเดลเพียงพอ และมีหลายทางเลือกสำหรับ inference
DeepSeek AI ประกาศว่าโมเดล V3.1 ถูกออกแบบมาเพื่อรองรับชิปจีนรุ่นใหม่
Huawei Ascend ถูกใช้งานใน ByteDance และมีเฟรมเวิร์ก MindSpore รองรับ

ข้อมูลเสริมจากภายนอก
จีนตั้งเป้าให้บริษัทในประเทศใช้ชิปจีนอย่างน้อย 50% ภายในปี 2026
กลุ่ม Model-Chips Ecosystem Innovation Alliance ก่อตั้งขึ้นเพื่อผลักดันการใช้ชิปจีนในงาน AI
การเปลี่ยนจาก Nvidia ไปยังชิปจีนต้องใช้เวลาและต้นทุนสูงในการปรับซอฟต์แวร์
Huawei Ascend ยังมีข้อจำกัดด้านปริมาณการผลิตและการเข้าถึง HBM

https://www.tomshardware.com/tech-industry/semiconductors/tencent-goes-public-with-pivot-to-chinese-chips

🇨🇳 “Tencent หันหลังให้ Nvidia — ปรับโครงสร้าง AI สู่ชิปจีนเต็มรูปแบบ ท่ามกลางแรงกดดันจากสงครามเทคโนโลยี” Tencent บริษัทเทคโนโลยียักษ์ใหญ่ของจีน ประกาศอย่างเป็นทางการในงาน Global Digital Ecosystem Summit เมื่อวันที่ 16 กันยายน 2025 ว่าได้ “ปรับโครงสร้างระบบประมวลผล AI ทั้งหมด” เพื่อรองรับชิปที่ออกแบบโดยบริษัทจีน โดยไม่พึ่งพา Nvidia อีกต่อไป ถือเป็นการเปลี่ยนแปลงครั้งใหญ่ในยุทธศาสตร์ด้านฮาร์ดแวร์ของบริษัท และสะท้อนแนวโน้มการพึ่งพาตนเองของจีนในยุคที่การส่งออกเทคโนโลยีจากสหรัฐฯ ถูกจำกัดอย่างเข้มงวด Qiu Yuepeng ประธาน Tencent Cloud ยืนยันว่าบริษัทได้ใช้ “ชิปจีนกระแสหลัก” ในการผลิตจริง ไม่ใช่แค่ทดลอง และกำลังร่วมมือกับผู้ผลิตชิปหลายรายเพื่อเลือกฮาร์ดแวร์ที่เหมาะสมกับแต่ละงาน พร้อมลงทุนระยะยาวเพื่อพัฒนาโครงสร้างร่วมระหว่างฮาร์ดแวร์และซอฟต์แวร์ เพื่อลดต้นทุนการประมวลผล การประกาศนี้เกิดขึ้นเพียงหนึ่งวันหลังจากหน่วยงานกำกับดูแลของจีนเปิดเผยว่า Nvidia ละเมิดกฎการควบรวมกิจการจากการซื้อ Mellanox ในปี 2019 ซึ่งเพิ่มแรงกดดันให้บริษัทจีนต้องเร่งพัฒนาเทคโนโลยีของตนเอง แม้ Tencent จะไม่เปิดเผยชื่อชิปที่ใช้งานจริง แต่หลายฝ่ายคาดว่าเป็น Huawei Ascend ซึ่งมีการใช้งานแล้วใน ByteDance และได้รับการสนับสนุนจากเฟรมเวิร์ก MindSpore ที่พัฒนาอย่างต่อเนื่อง อย่างไรก็ตาม ยังมีข้อสงสัยว่าชิปเหล่านี้จะสามารถรองรับการฝึกโมเดลขนาดใหญ่ได้จริงหรือไม่ เนื่องจาก Huawei ถูกคาดว่าจะผลิตได้เพียง 200,000 ชิป AI ในปีหน้า Tencent ยังระบุว่ามีชิปสำหรับการฝึกโมเดลเพียงพอในคลัง และมี “หลายทางเลือก” สำหรับ inference ซึ่งสะท้อนถึงการกระจายความเสี่ยงด้านซัพพลายเชนอย่างชัดเจน ✅ ข้อมูลสำคัญจากข่าว ➡️ Tencent ประกาศปรับโครงสร้างระบบ AI เพื่อรองรับชิปจีนเต็มรูปแบบ ➡️ ใช้ชิปจีนกระแสหลักในระดับการผลิตจริง ไม่ใช่แค่ทดลอง ➡️ ร่วมมือกับผู้ผลิตหลายรายเพื่อเลือกฮาร์ดแวร์ที่เหมาะสมกับแต่ละงาน ➡️ ลงทุนระยะยาวเพื่อพัฒนาโครงสร้างร่วมระหว่างฮาร์ดแวร์และซอฟต์แวร์ ✅ ความเคลื่อนไหวที่เกี่ยวข้อง ➡️ Nvidia ถูกกล่าวหาว่าละเมิดกฎการควบรวมกิจการในจีนจากดีล Mellanox ➡️ Tencent มีชิปสำหรับการฝึกโมเดลเพียงพอ และมีหลายทางเลือกสำหรับ inference ➡️ DeepSeek AI ประกาศว่าโมเดล V3.1 ถูกออกแบบมาเพื่อรองรับชิปจีนรุ่นใหม่ ➡️ Huawei Ascend ถูกใช้งานใน ByteDance และมีเฟรมเวิร์ก MindSpore รองรับ ✅ ข้อมูลเสริมจากภายนอก ➡️ จีนตั้งเป้าให้บริษัทในประเทศใช้ชิปจีนอย่างน้อย 50% ภายในปี 2026 ➡️ กลุ่ม Model-Chips Ecosystem Innovation Alliance ก่อตั้งขึ้นเพื่อผลักดันการใช้ชิปจีนในงาน AI ➡️ การเปลี่ยนจาก Nvidia ไปยังชิปจีนต้องใช้เวลาและต้นทุนสูงในการปรับซอฟต์แวร์ ➡️ Huawei Ascend ยังมีข้อจำกัดด้านปริมาณการผลิตและการเข้าถึง HBM https://www.tomshardware.com/tech-industry/semiconductors/tencent-goes-public-with-pivot-to-chinese-chips

WWW.TOMSHARDWARE.COM

Chinese giant Tencent announces domestic AI chip push — says it has fully adapted infrastructure to support homegrown silicon in blow to Nvidia
Tencent goes public with its pivot to Chinese accelerators, highlighting a deeper break from Nvidia as domestic AI hardware matures.

0 ความคิดเห็น 0 การแบ่งปัน 409 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-16 04:15:39 -

“Villager: เครื่องมือเจาะระบบจากจีนที่ใช้ AI สั่งงานด้วยภาษาคน — ดาวน์โหลดทะลุหมื่นครั้งใน 2 เดือน สะเทือนวงการไซเบอร์”

Villager คือเครื่องมือเจาะระบบ (pentest tool) ที่ถูกเผยแพร่บน PyPI โดยผู้ใช้ชื่อ “stupidfish001” ซึ่งมีความเชื่อมโยงกับกลุ่มแข่งขัน CTF จากจีนชื่อ HSCSEC และบริษัท Cyberspike ที่จดทะเบียนในชื่อ Changchun Anshanyuan Technology Co., Ltd. แม้จะถูกนำเสนอว่าเป็นเครื่องมือสำหรับทีม red team แต่ผู้เชี่ยวชาญด้านความปลอดภัยเตือนว่า Villager อาจกลายเป็น “Cobalt Strike ยุคใหม่” — เครื่องมือที่เริ่มจากการใช้งานอย่างถูกต้อง แต่ถูกนำไปใช้โดยกลุ่มแฮกเกอร์และรัฐชาติในที่สุด

สิ่งที่ทำให้ Villager น่ากังวลคือความสามารถในการใช้ AI สั่งงานผ่านภาษาธรรมชาติ เช่น “สแกนและเจาะระบบ example.com” แล้วระบบจะจัดการทุกขั้นตอนโดยอัตโนมัติ ตั้งแต่การสร้าง container Kali Linux ไปจนถึงการเลือกเครื่องมือเจาะระบบที่เหมาะสม และปรับเปลี่ยนตามสภาพแวดล้อมที่ตรวจพบ เช่น WordPress หรือ API ที่เปิดอยู่

Villager ยังมีฟีเจอร์หลบเลี่ยงการตรวจสอบ เช่น การสร้าง container ชั่วคราวที่ลบตัวเองภายใน 24 ชั่วโมง การสุ่มพอร์ต SSH และการวางแผนงานแบบไม่ทิ้งร่องรอย นอกจากนี้ยังมีการฝังฟีเจอร์จาก AsyncRAT เช่น keylogging, webcam hijacking และการขโมย token Discord ซึ่งเคยปรากฏในเครื่องมือเก่าของ Cyberspike

Villager ใช้โมเดล AI ชื่อ al-1s-20250421 และเชื่อมต่อกับ DeepSeek ผ่าน API ที่ออกแบบให้เหมือน OpenAI โดยมีการควบคุมผ่าน FastAPI และ GitLab ส่วนตัวของ Cyberspike ซึ่งทำให้สามารถรันคำสั่งใน workflow จริงได้ทันที ปัจจุบันมีการดาวน์โหลดมากกว่า 10,000 ครั้ง และยังคงเพิ่มขึ้นอย่างต่อเนื่อง

ข้อมูลสำคัญจากข่าว
Villager เป็นเครื่องมือเจาะระบบที่ใช้ AI สั่งงานผ่านภาษาธรรมชาติ
เผยแพร่บน PyPI โดยผู้ใช้ที่เชื่อมโยงกับกลุ่ม CTF จากจีนและบริษัท Cyberspike
ดาวน์โหลดมากกว่า 10,000 ครั้งภายใน 2 เดือน — รองรับ Linux, macOS และ Windows
ใช้ container Kali Linux, DeepSeek AI, LangChain และโมเดล al-1s-20250421

ความสามารถและฟีเจอร์ของ Villager
สั่งงานด้วยข้อความธรรมดา เช่น “เจาะระบบ example.com” แล้ว AI จัดการทุกขั้นตอน
สร้าง container ที่ลบตัวเองภายใน 24 ชั่วโมง — ลดร่องรอยการโจมตี
ใช้พอร์ต SSH แบบสุ่มและวางแผนงานเพื่อหลบเลี่ยงการตรวจจับ
ฝังฟีเจอร์จาก AsyncRAT เช่น keylogging, webcam hijacking และ token theft

ข้อมูลเสริมจากภายนอก
Cobalt Strike เคยเป็นเครื่องมือเจาะระบบที่ถูกนำไปใช้โดยกลุ่ม ransomware และรัฐชาติ
การเผยแพร่ผ่าน PyPI ทำให้ Villager เข้าถึงง่ายและดูน่าเชื่อถือ
AI ลดความซับซ้อนของการโจมตี — ผู้ใช้ทั่วไปสามารถรันคำสั่งระดับสูงได้
การใช้ container และ API ทำให้ Villager รันใน workflow จริงได้ทันที

https://hackread.com/china-ai-pentest-tool-villager-10k-downloads/

🧠 “Villager: เครื่องมือเจาะระบบจากจีนที่ใช้ AI สั่งงานด้วยภาษาคน — ดาวน์โหลดทะลุหมื่นครั้งใน 2 เดือน สะเทือนวงการไซเบอร์” Villager คือเครื่องมือเจาะระบบ (pentest tool) ที่ถูกเผยแพร่บน PyPI โดยผู้ใช้ชื่อ “stupidfish001” ซึ่งมีความเชื่อมโยงกับกลุ่มแข่งขัน CTF จากจีนชื่อ HSCSEC และบริษัท Cyberspike ที่จดทะเบียนในชื่อ Changchun Anshanyuan Technology Co., Ltd. แม้จะถูกนำเสนอว่าเป็นเครื่องมือสำหรับทีม red team แต่ผู้เชี่ยวชาญด้านความปลอดภัยเตือนว่า Villager อาจกลายเป็น “Cobalt Strike ยุคใหม่” — เครื่องมือที่เริ่มจากการใช้งานอย่างถูกต้อง แต่ถูกนำไปใช้โดยกลุ่มแฮกเกอร์และรัฐชาติในที่สุด สิ่งที่ทำให้ Villager น่ากังวลคือความสามารถในการใช้ AI สั่งงานผ่านภาษาธรรมชาติ เช่น “สแกนและเจาะระบบ example.com” แล้วระบบจะจัดการทุกขั้นตอนโดยอัตโนมัติ ตั้งแต่การสร้าง container Kali Linux ไปจนถึงการเลือกเครื่องมือเจาะระบบที่เหมาะสม และปรับเปลี่ยนตามสภาพแวดล้อมที่ตรวจพบ เช่น WordPress หรือ API ที่เปิดอยู่ Villager ยังมีฟีเจอร์หลบเลี่ยงการตรวจสอบ เช่น การสร้าง container ชั่วคราวที่ลบตัวเองภายใน 24 ชั่วโมง การสุ่มพอร์ต SSH และการวางแผนงานแบบไม่ทิ้งร่องรอย นอกจากนี้ยังมีการฝังฟีเจอร์จาก AsyncRAT เช่น keylogging, webcam hijacking และการขโมย token Discord ซึ่งเคยปรากฏในเครื่องมือเก่าของ Cyberspike Villager ใช้โมเดล AI ชื่อ al-1s-20250421 และเชื่อมต่อกับ DeepSeek ผ่าน API ที่ออกแบบให้เหมือน OpenAI โดยมีการควบคุมผ่าน FastAPI และ GitLab ส่วนตัวของ Cyberspike ซึ่งทำให้สามารถรันคำสั่งใน workflow จริงได้ทันที ปัจจุบันมีการดาวน์โหลดมากกว่า 10,000 ครั้ง และยังคงเพิ่มขึ้นอย่างต่อเนื่อง ✅ ข้อมูลสำคัญจากข่าว ➡️ Villager เป็นเครื่องมือเจาะระบบที่ใช้ AI สั่งงานผ่านภาษาธรรมชาติ ➡️ เผยแพร่บน PyPI โดยผู้ใช้ที่เชื่อมโยงกับกลุ่ม CTF จากจีนและบริษัท Cyberspike ➡️ ดาวน์โหลดมากกว่า 10,000 ครั้งภายใน 2 เดือน — รองรับ Linux, macOS และ Windows ➡️ ใช้ container Kali Linux, DeepSeek AI, LangChain และโมเดล al-1s-20250421 ✅ ความสามารถและฟีเจอร์ของ Villager ➡️ สั่งงานด้วยข้อความธรรมดา เช่น “เจาะระบบ example.com” แล้ว AI จัดการทุกขั้นตอน ➡️ สร้าง container ที่ลบตัวเองภายใน 24 ชั่วโมง — ลดร่องรอยการโจมตี ➡️ ใช้พอร์ต SSH แบบสุ่มและวางแผนงานเพื่อหลบเลี่ยงการตรวจจับ ➡️ ฝังฟีเจอร์จาก AsyncRAT เช่น keylogging, webcam hijacking และ token theft ✅ ข้อมูลเสริมจากภายนอก ➡️ Cobalt Strike เคยเป็นเครื่องมือเจาะระบบที่ถูกนำไปใช้โดยกลุ่ม ransomware และรัฐชาติ ➡️ การเผยแพร่ผ่าน PyPI ทำให้ Villager เข้าถึงง่ายและดูน่าเชื่อถือ ➡️ AI ลดความซับซ้อนของการโจมตี — ผู้ใช้ทั่วไปสามารถรันคำสั่งระดับสูงได้ ➡️ การใช้ container และ API ทำให้ Villager รันใน workflow จริงได้ทันที https://hackread.com/china-ai-pentest-tool-villager-10k-downloads/

HACKREAD.COM

China-Linked AI Pentest Tool ‘Villager’ Raises Concern After 10K Downloads
Follow us on Bluesky, Twitter (X), Mastodon and Facebook at @Hackread

0 ความคิดเห็น 0 การแบ่งปัน 373 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-13 05:02:47 -

เรื่องเล่าจาก CUDA ถึง ROCm: เมื่อ Elon Musk บอกว่า “AMD ก็ทำงานได้ดี”

Elon Musk ได้โพสต์ข้อความบน X (Twitter เดิม) ว่า AMD Instinct ทำงาน “ค่อนข้างดี” สำหรับโมเดล AI ขนาดเล็กถึงกลาง เช่น inference, fine-tuning และ foundation model ที่ไม่ใหญ่มาก แม้ว่า NVIDIA จะยังคงเป็นตัวเลือกหลักสำหรับงาน training ขนาดใหญ่ แต่คำชมจาก Elon ก็ถือเป็นสัญญาณว่า AMD กำลังไล่ทัน

ที่ผ่านมา NVIDIA ครองตลาดด้วย CUDA ซึ่งเป็น ecosystem แบบ lock-in ที่ทำให้ผู้พัฒนาไม่สามารถเปลี่ยนไปใช้แพลตฟอร์มอื่นได้ง่าย ๆ แต่ AMD กำลังตอบโต้ด้วย ROCm ที่เปิดกว้างและพัฒนาอย่างรวดเร็ว โดยเฉพาะในรุ่น MI300 และ MI355X ที่ xAI ของ Elon ก็ใช้งานอยู่

แม้ AMD จะยังไม่ได้รับความนิยมจาก Big Tech เท่ากับ NVIDIA แต่ก็เริ่มมีการใช้งานใน hyperscaler และ cloud provider มากขึ้น เช่น Oracle Cloud และ Dell ที่เริ่มนำ MI350 Series ไปใช้ใน rack-scale AI infrastructure

AMD ยังเตรียมเปิดตัว MI450 และ Helios rack ที่จะใช้ HBM4 และ EPYC Venice CPU เพื่อเร่งงาน training ขนาดใหญ่ โดยตั้งเป้าให้ลูกค้า “ไม่มีข้ออ้าง” ที่จะไม่เลือก AMD อีกต่อไป

Elon Musk สนับสนุน AMD สำหรับโมเดล AI ขนาดเล็กถึงกลาง
กล่าวว่า AMD ทำงานได้ดีสำหรับ inference และ fine-tuning
xAI ของ Elon ใช้ AMD Instinct MI300/MI355X ในบาง workload
Tesla ก็เคยร่วมมือกับ AMD ในด้าน hardware

จุดแข็งของ AMD ในตลาด AI
MI355X ใช้สถาปัตยกรรม CDNA 4 และ ROCm 7
มี HBM3E สูงสุด 288 GB และ bandwidth สูงถึง 8 TB/s
ประสิทธิภาพ inference สูงขึ้นถึง 35 เท่าเมื่อเทียบกับรุ่นก่อน

การขยาย ecosystem ของ AMD
ROCm รองรับโมเดลใหญ่ เช่น LLaMA และ DeepSeek ตั้งแต่วันแรก
มี developer cloud สำหรับนักพัฒนา AI โดยเฉพาะ
OEM อย่าง Dell, HPE, Supermicro เริ่มนำ MI350 Series ไปใช้ในระบบ on-prem และ hybrid

แผนการเปิดตัว MI450 และ Helios rack
ใช้ HBM4 และ EPYC Venice CPU พร้อม NIC Vulcano 800G
รองรับ 72 GPU ต่อ rack และให้ bandwidth สูงถึง 1.4 PBps
ตั้งเป้าให้ประสิทธิภาพสูงกว่า NVIDIA Vera Rubin ถึง 50% ในด้าน memory และ throughput

https://wccftech.com/elon-musk-endorses-amd-for-small-to-medium-ai-models/

🎙️ เรื่องเล่าจาก CUDA ถึง ROCm: เมื่อ Elon Musk บอกว่า “AMD ก็ทำงานได้ดี” Elon Musk ได้โพสต์ข้อความบน X (Twitter เดิม) ว่า AMD Instinct ทำงาน “ค่อนข้างดี” สำหรับโมเดล AI ขนาดเล็กถึงกลาง เช่น inference, fine-tuning และ foundation model ที่ไม่ใหญ่มาก แม้ว่า NVIDIA จะยังคงเป็นตัวเลือกหลักสำหรับงาน training ขนาดใหญ่ แต่คำชมจาก Elon ก็ถือเป็นสัญญาณว่า AMD กำลังไล่ทัน ที่ผ่านมา NVIDIA ครองตลาดด้วย CUDA ซึ่งเป็น ecosystem แบบ lock-in ที่ทำให้ผู้พัฒนาไม่สามารถเปลี่ยนไปใช้แพลตฟอร์มอื่นได้ง่าย ๆ แต่ AMD กำลังตอบโต้ด้วย ROCm ที่เปิดกว้างและพัฒนาอย่างรวดเร็ว โดยเฉพาะในรุ่น MI300 และ MI355X ที่ xAI ของ Elon ก็ใช้งานอยู่ แม้ AMD จะยังไม่ได้รับความนิยมจาก Big Tech เท่ากับ NVIDIA แต่ก็เริ่มมีการใช้งานใน hyperscaler และ cloud provider มากขึ้น เช่น Oracle Cloud และ Dell ที่เริ่มนำ MI350 Series ไปใช้ใน rack-scale AI infrastructure AMD ยังเตรียมเปิดตัว MI450 และ Helios rack ที่จะใช้ HBM4 และ EPYC Venice CPU เพื่อเร่งงาน training ขนาดใหญ่ โดยตั้งเป้าให้ลูกค้า “ไม่มีข้ออ้าง” ที่จะไม่เลือก AMD อีกต่อไป ✅ Elon Musk สนับสนุน AMD สำหรับโมเดล AI ขนาดเล็กถึงกลาง ➡️ กล่าวว่า AMD ทำงานได้ดีสำหรับ inference และ fine-tuning ➡️ xAI ของ Elon ใช้ AMD Instinct MI300/MI355X ในบาง workload ➡️ Tesla ก็เคยร่วมมือกับ AMD ในด้าน hardware ✅ จุดแข็งของ AMD ในตลาด AI ➡️ MI355X ใช้สถาปัตยกรรม CDNA 4 และ ROCm 7 ➡️ มี HBM3E สูงสุด 288 GB และ bandwidth สูงถึง 8 TB/s ➡️ ประสิทธิภาพ inference สูงขึ้นถึง 35 เท่าเมื่อเทียบกับรุ่นก่อน ✅ การขยาย ecosystem ของ AMD ➡️ ROCm รองรับโมเดลใหญ่ เช่น LLaMA และ DeepSeek ตั้งแต่วันแรก ➡️ มี developer cloud สำหรับนักพัฒนา AI โดยเฉพาะ ➡️ OEM อย่าง Dell, HPE, Supermicro เริ่มนำ MI350 Series ไปใช้ในระบบ on-prem และ hybrid ✅ แผนการเปิดตัว MI450 และ Helios rack ➡️ ใช้ HBM4 และ EPYC Venice CPU พร้อม NIC Vulcano 800G ➡️ รองรับ 72 GPU ต่อ rack และให้ bandwidth สูงถึง 1.4 PBps ➡️ ตั้งเป้าให้ประสิทธิภาพสูงกว่า NVIDIA Vera Rubin ถึง 50% ในด้าน memory และ throughput https://wccftech.com/elon-musk-endorses-amd-for-small-to-medium-ai-models/

WCCFTECH.COM

Elon Musk ‘Endorses’ AMD's AI Hardware for Small to Medium AI Models, Implying That There's Potential to Ease Reliance on NVIDIA
Billionaire Elon Musk has tweeted on the performance of AMD's AI hardware, claiming that it is sufficient for small and medium AI models.

0 ความคิดเห็น 0 การแบ่งปัน 388 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-12 07:17:19 -

“จีนควรเลิกใช้ GPU จากสหรัฐฯ — ผู้เชี่ยวชาญเตือนโมเดลพัฒนา AI ปัจจุบันอาจ ‘อันตรายถึงชีวิต’ หากไม่เปลี่ยนแนวทาง”

Wei Shaojun รองประธานสมาคมอุตสาหกรรมเซมิคอนดักเตอร์จีน และที่ปรึกษาระดับสูงของรัฐบาลจีน ได้ออกมาเรียกร้องให้จีนและประเทศในเอเชียหยุดพึ่งพา GPU จาก Nvidia และ AMD ในการพัฒนา AI โดยเฉพาะการฝึกโมเดลภาษาใหญ่ (LLM) เช่น ChatGPT และ DeepSeek ซึ่งเขาเห็นว่าเป็นการเลียนแบบแนวทางของสหรัฐฯ ที่อาจนำไปสู่ความเสี่ยงระยะยาวทั้งด้านเทคโนโลยีและความมั่นคง

Wei กล่าวในเวทีที่สิงคโปร์ว่า โมเดลการพัฒนา AI แบบอิง GPU นั้น “อาจถึงขั้นอันตราย” หากไม่เปลี่ยนแนวทาง เพราะมันทำให้ประเทศในเอเชียขาดอำนาจในการควบคุมโครงสร้างพื้นฐานของตนเอง และติดกับดักการพึ่งพาเทคโนโลยีจากต่างชาติ โดยเฉพาะในช่วงที่สหรัฐฯ จำกัดการส่งออกชิป AI ประสิทธิภาพสูงไปยังจีนตั้งแต่ปี 2023

แม้จีนจะยังตามหลังสหรัฐฯ และไต้หวันในด้านการผลิตเซมิคอนดักเตอร์ แต่ Wei ยกตัวอย่าง DeepSeek ซึ่งสามารถพัฒนาโมเดล AI ที่แข่งขันกับ OpenAI ได้โดยไม่ต้องใช้ฮาร์ดแวร์ระดับสูงเป็นหลักฐานว่า “อัลกอริธึมที่ดี” สำคัญกว่าฮาร์ดแวร์ล้ำสมัย

เขาเสนอให้จีนพัฒนาโปรเซสเซอร์เฉพาะทางสำหรับการฝึกโมเดล AI แทนการใช้ GPU ที่เดิมออกแบบมาเพื่อกราฟิก พร้อมย้ำว่าจีนมีเงินทุนและความมุ่งมั่นเพียงพอที่จะสร้างระบบนิเวศด้านเซมิคอนดักเตอร์ของตนเอง แม้จะเผชิญแรงกดดันจากการควบคุมการส่งออกของสหรัฐฯ มาหลายปี

ข้อมูลสำคัญจากคำแถลงของ Wei Shaojun
เรียกร้องให้จีนและเอเชียหยุดใช้ GPU จาก Nvidia และ AMD ในการพัฒนา AI
วิจารณ์ว่าการเลียนแบบแนวทางสหรัฐฯ ทำให้ขาดอำนาจควบคุมเทคโนโลยี
เสนอให้พัฒนาโปรเซสเซอร์เฉพาะทางสำหรับ LLM แทน GPU ที่ออกแบบเพื่อกราฟิก
ยกตัวอย่าง DeepSeek เป็นหลักฐานว่าจีนสามารถพัฒนาอัลกอริธึมได้โดยไม่ต้องใช้ฮาร์ดแวร์ระดับสูง

สถานการณ์ด้านฮาร์ดแวร์และการส่งออก
สหรัฐฯ จำกัดการส่งออกชิป AI และ HPC ไปยังจีนตั้งแต่ปี 2023
Nvidia H20 ถูกลดสเปกเพื่อให้ผ่านข้อจำกัด แต่จีนยังไม่ไว้วางใจ
จีนมีความคืบหน้าในการผลิตชิป แต่ยังตามหลังสหรัฐฯ และไต้หวันหลายปี
รัฐบาลจีนผลักดันให้บริษัทในประเทศหลีกเลี่ยงการใช้ GPU จากสหรัฐฯ

ข้อมูลเสริมจากภายนอก
Nvidia ครองตลาด AI ด้วย CUDA และ Tensor Core ที่ออกแบบมาเพื่อ deep learning
GPU ของ Nvidia กลายเป็นมาตรฐานในวงการ AI เพราะประสิทธิภาพสูงและ ecosystem ครบ
ASIC เฉพาะทางสำหรับ AI ยังไม่แพร่หลาย แต่มีแนวโน้มเติบโตในอนาคต
DeepSeek และ Meituan เป็นตัวอย่างของบริษัทจีนที่พัฒนาโมเดล AI โดยเน้นอัลกอริธึมมากกว่าฮาร์ดแวร์

https://www.tomshardware.com/tech-industry/artificial-intelligence/top-china-silicon-figure-calls-on-country-to-stop-using-nvidia-gpus-for-ai-says-current-ai-development-model-could-become-lethal-if-not-addressed

🇨🇳 “จีนควรเลิกใช้ GPU จากสหรัฐฯ — ผู้เชี่ยวชาญเตือนโมเดลพัฒนา AI ปัจจุบันอาจ ‘อันตรายถึงชีวิต’ หากไม่เปลี่ยนแนวทาง” Wei Shaojun รองประธานสมาคมอุตสาหกรรมเซมิคอนดักเตอร์จีน และที่ปรึกษาระดับสูงของรัฐบาลจีน ได้ออกมาเรียกร้องให้จีนและประเทศในเอเชียหยุดพึ่งพา GPU จาก Nvidia และ AMD ในการพัฒนา AI โดยเฉพาะการฝึกโมเดลภาษาใหญ่ (LLM) เช่น ChatGPT และ DeepSeek ซึ่งเขาเห็นว่าเป็นการเลียนแบบแนวทางของสหรัฐฯ ที่อาจนำไปสู่ความเสี่ยงระยะยาวทั้งด้านเทคโนโลยีและความมั่นคง Wei กล่าวในเวทีที่สิงคโปร์ว่า โมเดลการพัฒนา AI แบบอิง GPU นั้น “อาจถึงขั้นอันตราย” หากไม่เปลี่ยนแนวทาง เพราะมันทำให้ประเทศในเอเชียขาดอำนาจในการควบคุมโครงสร้างพื้นฐานของตนเอง และติดกับดักการพึ่งพาเทคโนโลยีจากต่างชาติ โดยเฉพาะในช่วงที่สหรัฐฯ จำกัดการส่งออกชิป AI ประสิทธิภาพสูงไปยังจีนตั้งแต่ปี 2023 แม้จีนจะยังตามหลังสหรัฐฯ และไต้หวันในด้านการผลิตเซมิคอนดักเตอร์ แต่ Wei ยกตัวอย่าง DeepSeek ซึ่งสามารถพัฒนาโมเดล AI ที่แข่งขันกับ OpenAI ได้โดยไม่ต้องใช้ฮาร์ดแวร์ระดับสูงเป็นหลักฐานว่า “อัลกอริธึมที่ดี” สำคัญกว่าฮาร์ดแวร์ล้ำสมัย เขาเสนอให้จีนพัฒนาโปรเซสเซอร์เฉพาะทางสำหรับการฝึกโมเดล AI แทนการใช้ GPU ที่เดิมออกแบบมาเพื่อกราฟิก พร้อมย้ำว่าจีนมีเงินทุนและความมุ่งมั่นเพียงพอที่จะสร้างระบบนิเวศด้านเซมิคอนดักเตอร์ของตนเอง แม้จะเผชิญแรงกดดันจากการควบคุมการส่งออกของสหรัฐฯ มาหลายปี ✅ ข้อมูลสำคัญจากคำแถลงของ Wei Shaojun ➡️ เรียกร้องให้จีนและเอเชียหยุดใช้ GPU จาก Nvidia และ AMD ในการพัฒนา AI ➡️ วิจารณ์ว่าการเลียนแบบแนวทางสหรัฐฯ ทำให้ขาดอำนาจควบคุมเทคโนโลยี ➡️ เสนอให้พัฒนาโปรเซสเซอร์เฉพาะทางสำหรับ LLM แทน GPU ที่ออกแบบเพื่อกราฟิก ➡️ ยกตัวอย่าง DeepSeek เป็นหลักฐานว่าจีนสามารถพัฒนาอัลกอริธึมได้โดยไม่ต้องใช้ฮาร์ดแวร์ระดับสูง ✅ สถานการณ์ด้านฮาร์ดแวร์และการส่งออก ➡️ สหรัฐฯ จำกัดการส่งออกชิป AI และ HPC ไปยังจีนตั้งแต่ปี 2023 ➡️ Nvidia H20 ถูกลดสเปกเพื่อให้ผ่านข้อจำกัด แต่จีนยังไม่ไว้วางใจ ➡️ จีนมีความคืบหน้าในการผลิตชิป แต่ยังตามหลังสหรัฐฯ และไต้หวันหลายปี ➡️ รัฐบาลจีนผลักดันให้บริษัทในประเทศหลีกเลี่ยงการใช้ GPU จากสหรัฐฯ ✅ ข้อมูลเสริมจากภายนอก ➡️ Nvidia ครองตลาด AI ด้วย CUDA และ Tensor Core ที่ออกแบบมาเพื่อ deep learning ➡️ GPU ของ Nvidia กลายเป็นมาตรฐานในวงการ AI เพราะประสิทธิภาพสูงและ ecosystem ครบ ➡️ ASIC เฉพาะทางสำหรับ AI ยังไม่แพร่หลาย แต่มีแนวโน้มเติบโตในอนาคต ➡️ DeepSeek และ Meituan เป็นตัวอย่างของบริษัทจีนที่พัฒนาโมเดล AI โดยเน้นอัลกอริธึมมากกว่าฮาร์ดแวร์ https://www.tomshardware.com/tech-industry/artificial-intelligence/top-china-silicon-figure-calls-on-country-to-stop-using-nvidia-gpus-for-ai-says-current-ai-development-model-could-become-lethal-if-not-addressed

WWW.TOMSHARDWARE.COM

Top China silicon figure calls on country to stop using Nvidia GPUs for AI — says current AI development model could become 'lethal' if not addressed
Develop AI-specific ASICs instead.

0 ความคิดเห็น 0 การแบ่งปัน 466 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-11 03:58:12 -

“NVIDIA Blackwell Ultra GB300 ทำลายสถิติ MLPerf — เร็วขึ้น 45% ใน DeepSeek R1 พร้อมเทคนิคใหม่ที่เปลี่ยนเกม AI inference”

NVIDIA ประกาศความสำเร็จครั้งใหญ่ในการทดสอบ MLPerf v5.1 โดยชิป Blackwell Ultra GB300 NVL72 rack-scale system สามารถทำความเร็วในการประมวลผล inference ได้สูงกว่ารุ่นก่อนหน้า GB200 ถึง 45% ในโมเดล DeepSeek R1 ซึ่งเป็นหนึ่งในโมเดล AI ขนาดใหญ่ที่ซับซ้อนที่สุดในปัจจุบัน

ความสำเร็จนี้เกิดจากการผสานระหว่างฮาร์ดแวร์ที่ทรงพลังและการปรับแต่งซอฟต์แวร์อย่างลึกซึ้ง โดย GB300 ใช้ tensor core ที่มีประสิทธิภาพสูงขึ้นถึง 2 เท่าในส่วน attention-layer และเพิ่ม FLOPS ด้าน AI compute อีก 1.5 เท่า พร้อมหน่วยความจำ HBM3e สูงสุด 288GB ต่อ GPU

ในด้านซอฟต์แวร์ NVIDIA ใช้ฟอร์แมต NVFP4 ซึ่งเป็น floating point แบบ 4-bit ที่ออกแบบมาเฉพาะสำหรับงาน AI reasoning โดยสามารถลดขนาดโมเดลและเพิ่ม throughput ได้โดยไม่เสียความแม่นยำ นอกจากนี้ยังใช้เทคนิคการ “shard” โมเดล Llama 3.1 405B ข้ามหลาย GPU เพื่อเพิ่มประสิทธิภาพโดยไม่เพิ่ม latency

ระบบ GB300 NVL72 ยังมีแบนด์วิดท์รวมถึง 130 TBps ด้วย NVLink fabric ความเร็ว 1.8 TBps ระหว่าง GPU แต่ละตัว ทำให้สามารถสื่อสารกันได้อย่างรวดเร็วและไม่มีคอขวด

ทั้งหมดนี้เป็นส่วนหนึ่งของแนวคิด “AI Factory” ที่ NVIDIA ผลักดัน โดยเชื่อว่าการเพิ่ม throughput ในการประมวลผล AI จะช่วยเพิ่มรายได้ ลดต้นทุน และทำให้ระบบมีประสิทธิภาพสูงสุดในยุคที่ข้อมูลกลายเป็นสินทรัพย์หลัก

ความสามารถของ Blackwell Ultra GB300
เพิ่มความเร็ว inference ใน DeepSeek R1 ได้ถึง 45% เมื่อเทียบกับ GB200
เร็วกว่า Hopper GPU รุ่นก่อนหน้าถึง 5 เท่า
ใช้ tensor core ที่มี 2X attention-layer acceleration และ 1.5X AI compute FLOPS
หน่วยความจำ HBM3e สูงสุด 288GB ต่อ GPU

เทคนิคซอฟต์แวร์ที่ใช้
ใช้ NVFP4 format เพื่อลดขนาดโมเดลและเพิ่ม throughput
ใช้ TensorRT Model Optimizer และ TensorRT-LLM library เพื่อปรับแต่งโมเดล
shard โมเดล Llama 3.1 405B ข้ามหลาย GPU เพื่อเพิ่มประสิทธิภาพ
ใช้ NVLink fabric ความเร็ว 1.8 TBps ระหว่าง GPU รวมเป็น 130 TBps

ผลการทดสอบ MLPerf v5.1
GB300 NVL72 ทำลายสถิติใน DeepSeek R1, Llama 3.1 405B, Llama 3.1 8B และ Whisper
เพิ่ม throughput ต่อ GPU ได้เกือบ 50% ด้วยเทคนิค disaggregated serving
ลด latency และเพิ่มประสิทธิภาพในงาน interactive AI
เหมาะกับการใช้งานในระบบ AI Factory ที่ต้องการประมวลผลจำนวนมาก

ข้อมูลเสริมจากภายนอก
DeepSeek R1 เป็นโมเดล MoE ขนาด 671B parameter ที่ต้องใช้ compute สูงมาก
Whisper กลายเป็นโมเดลแปลงเสียงยอดนิยมบน HuggingFace ด้วยยอดดาวน์โหลดเกือบ 5 ล้านครั้ง
Llama 3.1 405B มีความต้องการด้าน latency และ throughput สูงกว่ารุ่นก่อน
Hopper GPU เริ่มล้าสมัยเมื่อเทียบกับ Blackwell Ultra ในงาน inference

https://www.tomshardware.com/pc-components/gpus/nvidia-claims-software-and-hardware-upgrades-allow-blackwell-ultra-gb300-to-dominate-mlperf-benchmarks-touts-45-percent-deepseek-r-1-inference-throughput-increase-over-gb200

🚀 “NVIDIA Blackwell Ultra GB300 ทำลายสถิติ MLPerf — เร็วขึ้น 45% ใน DeepSeek R1 พร้อมเทคนิคใหม่ที่เปลี่ยนเกม AI inference” NVIDIA ประกาศความสำเร็จครั้งใหญ่ในการทดสอบ MLPerf v5.1 โดยชิป Blackwell Ultra GB300 NVL72 rack-scale system สามารถทำความเร็วในการประมวลผล inference ได้สูงกว่ารุ่นก่อนหน้า GB200 ถึง 45% ในโมเดล DeepSeek R1 ซึ่งเป็นหนึ่งในโมเดล AI ขนาดใหญ่ที่ซับซ้อนที่สุดในปัจจุบัน ความสำเร็จนี้เกิดจากการผสานระหว่างฮาร์ดแวร์ที่ทรงพลังและการปรับแต่งซอฟต์แวร์อย่างลึกซึ้ง โดย GB300 ใช้ tensor core ที่มีประสิทธิภาพสูงขึ้นถึง 2 เท่าในส่วน attention-layer และเพิ่ม FLOPS ด้าน AI compute อีก 1.5 เท่า พร้อมหน่วยความจำ HBM3e สูงสุด 288GB ต่อ GPU ในด้านซอฟต์แวร์ NVIDIA ใช้ฟอร์แมต NVFP4 ซึ่งเป็น floating point แบบ 4-bit ที่ออกแบบมาเฉพาะสำหรับงาน AI reasoning โดยสามารถลดขนาดโมเดลและเพิ่ม throughput ได้โดยไม่เสียความแม่นยำ นอกจากนี้ยังใช้เทคนิคการ “shard” โมเดล Llama 3.1 405B ข้ามหลาย GPU เพื่อเพิ่มประสิทธิภาพโดยไม่เพิ่ม latency ระบบ GB300 NVL72 ยังมีแบนด์วิดท์รวมถึง 130 TBps ด้วย NVLink fabric ความเร็ว 1.8 TBps ระหว่าง GPU แต่ละตัว ทำให้สามารถสื่อสารกันได้อย่างรวดเร็วและไม่มีคอขวด ทั้งหมดนี้เป็นส่วนหนึ่งของแนวคิด “AI Factory” ที่ NVIDIA ผลักดัน โดยเชื่อว่าการเพิ่ม throughput ในการประมวลผล AI จะช่วยเพิ่มรายได้ ลดต้นทุน และทำให้ระบบมีประสิทธิภาพสูงสุดในยุคที่ข้อมูลกลายเป็นสินทรัพย์หลัก ✅ ความสามารถของ Blackwell Ultra GB300 ➡️ เพิ่มความเร็ว inference ใน DeepSeek R1 ได้ถึง 45% เมื่อเทียบกับ GB200 ➡️ เร็วกว่า Hopper GPU รุ่นก่อนหน้าถึง 5 เท่า ➡️ ใช้ tensor core ที่มี 2X attention-layer acceleration และ 1.5X AI compute FLOPS ➡️ หน่วยความจำ HBM3e สูงสุด 288GB ต่อ GPU ✅ เทคนิคซอฟต์แวร์ที่ใช้ ➡️ ใช้ NVFP4 format เพื่อลดขนาดโมเดลและเพิ่ม throughput ➡️ ใช้ TensorRT Model Optimizer และ TensorRT-LLM library เพื่อปรับแต่งโมเดล ➡️ shard โมเดล Llama 3.1 405B ข้ามหลาย GPU เพื่อเพิ่มประสิทธิภาพ ➡️ ใช้ NVLink fabric ความเร็ว 1.8 TBps ระหว่าง GPU รวมเป็น 130 TBps ✅ ผลการทดสอบ MLPerf v5.1 ➡️ GB300 NVL72 ทำลายสถิติใน DeepSeek R1, Llama 3.1 405B, Llama 3.1 8B และ Whisper ➡️ เพิ่ม throughput ต่อ GPU ได้เกือบ 50% ด้วยเทคนิค disaggregated serving ➡️ ลด latency และเพิ่มประสิทธิภาพในงาน interactive AI ➡️ เหมาะกับการใช้งานในระบบ AI Factory ที่ต้องการประมวลผลจำนวนมาก ✅ ข้อมูลเสริมจากภายนอก ➡️ DeepSeek R1 เป็นโมเดล MoE ขนาด 671B parameter ที่ต้องใช้ compute สูงมาก ➡️ Whisper กลายเป็นโมเดลแปลงเสียงยอดนิยมบน HuggingFace ด้วยยอดดาวน์โหลดเกือบ 5 ล้านครั้ง ➡️ Llama 3.1 405B มีความต้องการด้าน latency และ throughput สูงกว่ารุ่นก่อน ➡️ Hopper GPU เริ่มล้าสมัยเมื่อเทียบกับ Blackwell Ultra ในงาน inference https://www.tomshardware.com/pc-components/gpus/nvidia-claims-software-and-hardware-upgrades-allow-blackwell-ultra-gb300-to-dominate-mlperf-benchmarks-touts-45-percent-deepseek-r-1-inference-throughput-increase-over-gb200

WWW.TOMSHARDWARE.COM

Nvidia claims software and hardware upgrades allow Blackwell Ultra GB300 to dominate MLPerf benchmarks — touts 45% DeepSeek R-1 inference throughput increase over GB200
Big increases in performance when running a range of popular open source models.

0 ความคิดเห็น 0 การแบ่งปัน 383 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-10 03:03:54 -

“ศึกชิป AI ระดับโลก! NVIDIA Blackwell Ultra GB300 ปะทะ AMD Instinct MI355X ใน MLPerf v5.1 — เร็วขึ้น ฉลาดขึ้น และร้อนแรงกว่าเดิม”

ในโลกของ AI ที่แข่งขันกันด้วยความเร็วและประสิทธิภาพ ชิปประมวลผลคือหัวใจของทุกระบบ และในรอบล่าสุดของการทดสอบ MLPerf v5.1 ซึ่งเป็นมาตรฐานระดับโลกสำหรับการวัดประสิทธิภาพการประมวลผล AI — NVIDIA และ AMD ต่างก็ส่งชิปเรือธงของตนเข้าประลองกันแบบไม่มีใครยอมใคร

NVIDIA เปิดตัว Blackwell Ultra GB300 ซึ่งเป็นรุ่นอัปเกรดจาก GB200 โดยสามารถทำความเร็วได้สูงขึ้นถึง 45% ในงาน DeepSeek R1 (Offline) เมื่อใช้ 72 GPU และ 44% เมื่อใช้ 8 GPU ส่วนในโหมด Server ก็ยังเร็วขึ้นถึง 25% และ 21% ตามลำดับ1 ถือเป็นการทำตามสัญญาที่เคยประกาศไว้ว่า Blackwell Ultra จะเร็วขึ้นประมาณ 50%

ฝั่ง AMD ก็ไม่น้อยหน้า ส่ง Instinct MI355X เข้าร่วมการทดสอบ โดยในงาน Llama 3.1 405B (Offline) พบว่าทำความเร็วได้สูงกว่า GB200 ถึง 27% และในงาน Llama 2 70B (Offline) MI355X สามารถสร้าง token ได้ถึง 648,248 ต่อวินาทีในระบบ 64 ชิป และ 93,045 ในระบบ 8 ชิป — เร็วกว่า GB200 ถึง 2 เท่า

NVIDIA ยังโชว์พลังของ GB300 ด้วยการทำลายสถิติในหลายหมวด เช่น Stable Diffusion XL, Whisper, Mixtral และ DLRMv2 โดยใช้เทคนิคใหม่อย่าง NVFP4 ซึ่งเป็นฟอร์แมต 4-bit floating point ที่ออกแบบมาเฉพาะสำหรับงาน AI reasoning พร้อมระบบเสิร์ฟแบบแยก context และ generation เพื่อเพิ่ม throughput สูงสุด

การทดสอบครั้งนี้ยังมี Intel Arc Pro B60 เข้าร่วมด้วย แม้จะไม่เร็วเท่าชิประดับ datacenter แต่ก็มีจุดเด่นด้านความคุ้มค่าและการใช้งานในระบบขนาดเล็ก — สะท้อนว่าการแข่งขันไม่ได้มีแค่เรื่องความเร็ว แต่ยังรวมถึงการออกแบบที่ตอบโจทย์การใช้งานจริง

ผลการทดสอบ MLPerf v5.1
GB300 เร็วกว่า GB200 ถึง 45% ใน DeepSeek R1 (Offline) และ 25% ใน Server
MI355X เร็วกว่า GB200 ถึง 27% ใน Llama 3.1 405B และ 2.09x ใน Llama 2 70B
GB300 ทำลายสถิติในหลายหมวด เช่น Whisper, Mixtral, DLRMv2 และ Stable Diffusion XL
ใช้เทคนิค NVFP4 และระบบเสิร์ฟแบบแยก context/generation เพื่อเพิ่ม throughput

จุดเด่นของ Blackwell Ultra GB300
มี 1.5x NVFP4 compute และ 2x attention-layer acceleration เมื่อเทียบกับ Blackwell รุ่นก่อน
ใช้ HBM3e สูงสุด 288GB ต่อ GPU
ทำความเร็ว reasoning ได้สูงกว่า Hopper ถึง 4.7x ใน Offline และ 5.2x ใน Server1
ถือครองสถิติ per-GPU ในทุกหมวดของ MLPerf datacenter benchmark

จุดเด่นของ AMD Instinct MI355X
ทำ token generation ได้สูงสุด 648,248 ต่อวินาทีในระบบ 64 ชิป
เร็วกว่า GB200 ถึง 2 เท่าในระบบ 8 ชิป
เหมาะกับงาน LLM ขนาดใหญ่ เช่น Llama 2 และ Llama 3.1
มีการปรับปรุงด้าน memory bandwidth และการจัดการพลังงาน

ข้อมูลเสริมจากภายนอก
MLPerf v5.1 มีผู้เข้าร่วมมากถึง 27 ราย และเพิ่ม benchmark ใหม่ 3 รายการ ได้แก่ DeepSeek-R1, Llama 3.1 8B และ Whisper Large V3
NVIDIA ใช้ TensorRT-LLM และ Model Optimizer เพื่อปรับแต่งโมเดลให้ทำงานกับ NVFP4 ได้อย่างแม่นยำ2 การเสิร์ฟแบบแยก context/generation ช่วยเพิ่มประสิทธิภาพในงาน LLM แบบ interactive
Intel Arc Pro B60 แม้จะช้ากว่า แต่มีจุดเด่นด้านความคุ้มค่าและการใช้งานในระบบขนาดเล็ก

https://wccftech.com/mlperf-v5-1-ai-inference-benchmark-showdown-nvidia-blackwell-ultra-gb300-amd-instinct-mi355x/

⚙️ “ศึกชิป AI ระดับโลก! NVIDIA Blackwell Ultra GB300 ปะทะ AMD Instinct MI355X ใน MLPerf v5.1 — เร็วขึ้น ฉลาดขึ้น และร้อนแรงกว่าเดิม” ในโลกของ AI ที่แข่งขันกันด้วยความเร็วและประสิทธิภาพ ชิปประมวลผลคือหัวใจของทุกระบบ และในรอบล่าสุดของการทดสอบ MLPerf v5.1 ซึ่งเป็นมาตรฐานระดับโลกสำหรับการวัดประสิทธิภาพการประมวลผล AI — NVIDIA และ AMD ต่างก็ส่งชิปเรือธงของตนเข้าประลองกันแบบไม่มีใครยอมใคร NVIDIA เปิดตัว Blackwell Ultra GB300 ซึ่งเป็นรุ่นอัปเกรดจาก GB200 โดยสามารถทำความเร็วได้สูงขึ้นถึง 45% ในงาน DeepSeek R1 (Offline) เมื่อใช้ 72 GPU และ 44% เมื่อใช้ 8 GPU ส่วนในโหมด Server ก็ยังเร็วขึ้นถึง 25% และ 21% ตามลำดับ1 ถือเป็นการทำตามสัญญาที่เคยประกาศไว้ว่า Blackwell Ultra จะเร็วขึ้นประมาณ 50% ฝั่ง AMD ก็ไม่น้อยหน้า ส่ง Instinct MI355X เข้าร่วมการทดสอบ โดยในงาน Llama 3.1 405B (Offline) พบว่าทำความเร็วได้สูงกว่า GB200 ถึง 27% และในงาน Llama 2 70B (Offline) MI355X สามารถสร้าง token ได้ถึง 648,248 ต่อวินาทีในระบบ 64 ชิป และ 93,045 ในระบบ 8 ชิป — เร็วกว่า GB200 ถึง 2 เท่า NVIDIA ยังโชว์พลังของ GB300 ด้วยการทำลายสถิติในหลายหมวด เช่น Stable Diffusion XL, Whisper, Mixtral และ DLRMv2 โดยใช้เทคนิคใหม่อย่าง NVFP4 ซึ่งเป็นฟอร์แมต 4-bit floating point ที่ออกแบบมาเฉพาะสำหรับงาน AI reasoning พร้อมระบบเสิร์ฟแบบแยก context และ generation เพื่อเพิ่ม throughput สูงสุด การทดสอบครั้งนี้ยังมี Intel Arc Pro B60 เข้าร่วมด้วย แม้จะไม่เร็วเท่าชิประดับ datacenter แต่ก็มีจุดเด่นด้านความคุ้มค่าและการใช้งานในระบบขนาดเล็ก — สะท้อนว่าการแข่งขันไม่ได้มีแค่เรื่องความเร็ว แต่ยังรวมถึงการออกแบบที่ตอบโจทย์การใช้งานจริง ✅ ผลการทดสอบ MLPerf v5.1 ➡️ GB300 เร็วกว่า GB200 ถึง 45% ใน DeepSeek R1 (Offline) และ 25% ใน Server ➡️ MI355X เร็วกว่า GB200 ถึง 27% ใน Llama 3.1 405B และ 2.09x ใน Llama 2 70B ➡️ GB300 ทำลายสถิติในหลายหมวด เช่น Whisper, Mixtral, DLRMv2 และ Stable Diffusion XL ➡️ ใช้เทคนิค NVFP4 และระบบเสิร์ฟแบบแยก context/generation เพื่อเพิ่ม throughput ✅ จุดเด่นของ Blackwell Ultra GB300 ➡️ มี 1.5x NVFP4 compute และ 2x attention-layer acceleration เมื่อเทียบกับ Blackwell รุ่นก่อน ➡️ ใช้ HBM3e สูงสุด 288GB ต่อ GPU ➡️ ทำความเร็ว reasoning ได้สูงกว่า Hopper ถึง 4.7x ใน Offline และ 5.2x ใน Server1 ➡️ ถือครองสถิติ per-GPU ในทุกหมวดของ MLPerf datacenter benchmark ✅ จุดเด่นของ AMD Instinct MI355X ➡️ ทำ token generation ได้สูงสุด 648,248 ต่อวินาทีในระบบ 64 ชิป ➡️ เร็วกว่า GB200 ถึง 2 เท่าในระบบ 8 ชิป ➡️ เหมาะกับงาน LLM ขนาดใหญ่ เช่น Llama 2 และ Llama 3.1 ➡️ มีการปรับปรุงด้าน memory bandwidth และการจัดการพลังงาน ✅ ข้อมูลเสริมจากภายนอก ➡️ MLPerf v5.1 มีผู้เข้าร่วมมากถึง 27 ราย และเพิ่ม benchmark ใหม่ 3 รายการ ได้แก่ DeepSeek-R1, Llama 3.1 8B และ Whisper Large V3 ➡️ NVIDIA ใช้ TensorRT-LLM และ Model Optimizer เพื่อปรับแต่งโมเดลให้ทำงานกับ NVFP4 ได้อย่างแม่นยำ2 ➡️ การเสิร์ฟแบบแยก context/generation ช่วยเพิ่มประสิทธิภาพในงาน LLM แบบ interactive ➡️ Intel Arc Pro B60 แม้จะช้ากว่า แต่มีจุดเด่นด้านความคุ้มค่าและการใช้งานในระบบขนาดเล็ก https://wccftech.com/mlperf-v5-1-ai-inference-benchmark-showdown-nvidia-blackwell-ultra-gb300-amd-instinct-mi355x/

WCCFTECH.COM

MLPerf v5.1 AI Inference Benchmark Showdown: NVIDIA Blackwell Ultra GB300 & AMD Instinct MI355X In The Spotlight
NVIDIA's Blackwell Ultra GB300 & AMD's Instinct MI355X have finally appeared in the latest MLPerf v3.1 AI inference benchmarks.

0 ความคิดเห็น 0 การแบ่งปัน 323 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-05 20:01:41 -

เรื่องเล่าจาก Youtu-Agent ถึง Coze Studio: เมื่อจีนไม่รอใคร และกำลังสร้างระบบนิเวศของ AI agentic tools

ในช่วงครึ่งหลังของปี 2025 จีนเริ่มเปิดตัวชุดเครื่องมือสร้าง AI agent แบบโอเพ่นซอร์สอย่างต่อเนื่อง โดยมี Tencent, ByteDance และ Alibaba เป็นหัวหอกหลักในการผลักดัน “agentic frameworks”—ซอฟต์แวร์ที่ช่วยให้ผู้ใช้สามารถสร้างและจัดการ AI agents ที่ทำงานอัตโนมัติได้

ล่าสุด Tencent เปิดตัว Youtu-Agent บน GitHub ซึ่งเป็นเฟรมเวิร์กที่พัฒนาโดย Youtu Labs และใช้โมเดล DeepSeek-V3.1 เป็นฐาน โดยสามารถทำคะแนนได้ถึง 71.47% บน WebWalkerQA ซึ่งเป็น benchmark สำหรับการเดินทางในเว็บแบบอัตโนมัติ

ก่อนหน้านี้ ByteDance ได้เปิดตัว Coze Studio ในเดือนกรกฎาคม และ Alibaba เปิดตัว Qwen-Agent ในเดือนมีนาคม โดยทั้งสองเฟรมเวิร์กได้รับดาวบน GitHub มากกว่า 10,000 ดวงแล้ว ถือเป็นสัญญาณว่าเครื่องมือจากจีนเริ่มได้รับความนิยมในระดับโลก แม้จะยังตามหลัง LangChain ที่มีมากกว่า 115,000 ดาวอยู่มาก

สิ่งที่ทำให้ Youtu-Agent น่าสนใจคือการใช้ YAML (Yet Another Markup Language) แทนการเขียนโค้ด เพื่อกำหนดพฤติกรรมของเอเจนต์ และมี “meta-agent” ที่สามารถพูดคุยกับผู้ใช้เพื่อสร้าง YAML ให้โดยอัตโนมัติ—ลดภาระของนักพัฒนา และเปิดโอกาสให้ผู้เริ่มต้นสามารถสร้างเอเจนต์ได้ง่ายขึ้น

Tencent ยังเปิดตัวโมเดลแปลภาษาแบบโอเพ่นซอร์สที่ชนะการแข่งขันระดับโลก และปล่อยเวอร์ชันย่อยของโมเดล Hunyuan ที่สามารถรันบน GPU ระดับ consumer ได้ ซึ่งสะท้อนถึงแนวทาง “ประชาธิปไตยของ AI” ที่จีนกำลังผลักดัน

การเปิดตัว agentic frameworks จากจีน
Tencent เปิดตัว Youtu-Agent บน GitHub โดยใช้ DeepSeek-V3.1
ByteDance เปิดตัว Coze Studio ในเดือนกรกฎาคม
Alibaba เปิดตัว Qwen-Agent ในเดือนมีนาคม

ความสามารถของ Youtu-Agent
ทำคะแนน 71.47% บน WebWalkerQA benchmark
ใช้ YAML ในการกำหนดพฤติกรรมของเอเจนต์
มี meta-agent ที่ช่วยสร้าง YAML โดยอัตโนมัติ

ความนิยมและการเปรียบเทียบ
Coze Studio และ Qwen-Agent มีดาวบน GitHub มากกว่า 10,000 ดวง
LangChain จากสหรัฐฯ มีมากกว่า 115,000 ดาว
IBM จัดอันดับว่าเฟรมเวิร์กยอดนิยมยังเป็นของฝั่งสหรัฐฯ เช่น AutoGen, CrewAI

การขยาย ecosystem ของ Tencent
เปิดตัวโมเดลแปลภาษาที่ชนะการแข่งขันระดับโลก
ปล่อยเวอร์ชันย่อยของ Hunyuan ที่รันบน GPU ระดับ consumer
เปิดตัวเอเจนต์เฉพาะทางสำหรับงาน coding และ marketing ในงาน WAIC

https://www.thestar.com.my/tech/tech-news/2025/09/05/china-advances-in-ai-agentic-tools-as-tencent-bytedance-weigh-in

🎙️ เรื่องเล่าจาก Youtu-Agent ถึง Coze Studio: เมื่อจีนไม่รอใคร และกำลังสร้างระบบนิเวศของ AI agentic tools ในช่วงครึ่งหลังของปี 2025 จีนเริ่มเปิดตัวชุดเครื่องมือสร้าง AI agent แบบโอเพ่นซอร์สอย่างต่อเนื่อง โดยมี Tencent, ByteDance และ Alibaba เป็นหัวหอกหลักในการผลักดัน “agentic frameworks”—ซอฟต์แวร์ที่ช่วยให้ผู้ใช้สามารถสร้างและจัดการ AI agents ที่ทำงานอัตโนมัติได้ ล่าสุด Tencent เปิดตัว Youtu-Agent บน GitHub ซึ่งเป็นเฟรมเวิร์กที่พัฒนาโดย Youtu Labs และใช้โมเดล DeepSeek-V3.1 เป็นฐาน โดยสามารถทำคะแนนได้ถึง 71.47% บน WebWalkerQA ซึ่งเป็น benchmark สำหรับการเดินทางในเว็บแบบอัตโนมัติ ก่อนหน้านี้ ByteDance ได้เปิดตัว Coze Studio ในเดือนกรกฎาคม และ Alibaba เปิดตัว Qwen-Agent ในเดือนมีนาคม โดยทั้งสองเฟรมเวิร์กได้รับดาวบน GitHub มากกว่า 10,000 ดวงแล้ว ถือเป็นสัญญาณว่าเครื่องมือจากจีนเริ่มได้รับความนิยมในระดับโลก แม้จะยังตามหลัง LangChain ที่มีมากกว่า 115,000 ดาวอยู่มาก สิ่งที่ทำให้ Youtu-Agent น่าสนใจคือการใช้ YAML (Yet Another Markup Language) แทนการเขียนโค้ด เพื่อกำหนดพฤติกรรมของเอเจนต์ และมี “meta-agent” ที่สามารถพูดคุยกับผู้ใช้เพื่อสร้าง YAML ให้โดยอัตโนมัติ—ลดภาระของนักพัฒนา และเปิดโอกาสให้ผู้เริ่มต้นสามารถสร้างเอเจนต์ได้ง่ายขึ้น Tencent ยังเปิดตัวโมเดลแปลภาษาแบบโอเพ่นซอร์สที่ชนะการแข่งขันระดับโลก และปล่อยเวอร์ชันย่อยของโมเดล Hunyuan ที่สามารถรันบน GPU ระดับ consumer ได้ ซึ่งสะท้อนถึงแนวทาง “ประชาธิปไตยของ AI” ที่จีนกำลังผลักดัน ✅ การเปิดตัว agentic frameworks จากจีน ➡️ Tencent เปิดตัว Youtu-Agent บน GitHub โดยใช้ DeepSeek-V3.1 ➡️ ByteDance เปิดตัว Coze Studio ในเดือนกรกฎาคม ➡️ Alibaba เปิดตัว Qwen-Agent ในเดือนมีนาคม ✅ ความสามารถของ Youtu-Agent ➡️ ทำคะแนน 71.47% บน WebWalkerQA benchmark ➡️ ใช้ YAML ในการกำหนดพฤติกรรมของเอเจนต์ ➡️ มี meta-agent ที่ช่วยสร้าง YAML โดยอัตโนมัติ ✅ ความนิยมและการเปรียบเทียบ ➡️ Coze Studio และ Qwen-Agent มีดาวบน GitHub มากกว่า 10,000 ดวง ➡️ LangChain จากสหรัฐฯ มีมากกว่า 115,000 ดาว ➡️ IBM จัดอันดับว่าเฟรมเวิร์กยอดนิยมยังเป็นของฝั่งสหรัฐฯ เช่น AutoGen, CrewAI ✅ การขยาย ecosystem ของ Tencent ➡️ เปิดตัวโมเดลแปลภาษาที่ชนะการแข่งขันระดับโลก ➡️ ปล่อยเวอร์ชันย่อยของ Hunyuan ที่รันบน GPU ระดับ consumer ➡️ เปิดตัวเอเจนต์เฉพาะทางสำหรับงาน coding และ marketing ในงาน WAIC https://www.thestar.com.my/tech/tech-news/2025/09/05/china-advances-in-ai-agentic-tools-as-tencent-bytedance-weigh-in

WWW.THESTAR.COM.MY

China advances in AI agentic tools as Tencent, ByteDance weigh in
Tencent is the latest to join the fray after the Shenzhen-based company open-sourced its new Youtu-Agent agentic framework on Tuesday.

0 ความคิดเห็น 0 การแบ่งปัน 429 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-04 19:36:36 -

เรื่องเล่าจากบัตรเครดิตที่พูดได้: เมื่อ Alibaba เปลี่ยนเครื่องบันทึกเสียงให้กลายเป็นผู้ช่วยอัจฉริยะ

ในงานครบรอบ 10 ปีของ DingTalk เมื่อปลายเดือนสิงหาคม 2025 Alibaba เปิดตัว DingTalk A1 ซึ่งเป็นเครื่องบันทึกเสียงขนาดเท่าบัตรเครดิตที่อัดแน่นด้วยความสามารถด้าน AI โดยใช้โมเดลจาก Tongyi AI Lab ที่เทรนด้วยเสียงกว่า 100 ล้านชั่วโมง ทำให้สามารถเข้าใจได้มากกว่า 100 ภาษาและ 30 สำเนียงจีน รวมถึงศัพท์เฉพาะจากกว่า 200 อุตสาหกรรม

A1 ไม่ได้แค่บันทึกเสียง แต่สามารถสรุปประชุม, แปลภาษาแบบเรียลไทม์, วิเคราะห์เนื้อหา และสร้างเอกสารในรูปแบบต่าง ๆ เช่น minutes, to-do list หรือแม้แต่ mindmap โดยไม่ต้องพึ่งมนุษย์เลยแม้แต่นิดเดียว

เมื่อเปรียบเทียบกับคู่แข่งอย่าง Plaud Note Pro (US$179) และ Mobvoi TicNote (US$159.99) แล้ว DingTalk A1 มีราคาถูกกว่าอย่างเห็นได้ชัดที่ 499–799 หยวน (US$69.98–111.8) และยังมีฟีเจอร์ที่โดดเด่น เช่น OLED สี, USB-C, การเชื่อมต่อกับแอป DingTalk โดยตรง และการรองรับโมเดล AI ชั้นนำจากจีน เช่น Qwen3-235B, DeepSeek-V3

ตลาด AI hardware ในจีนกำลังเติบโตอย่างรวดเร็ว โดยคาดว่าจะมีมูลค่าถึง 1.1 ล้านล้านหยวนในปีนี้ และเพิ่มเป็น 2.5 ล้านล้านภายในปี 2030 ซึ่งเป็นผลจากนโยบายสนับสนุนของรัฐบาล, การพึ่งพาเทคโนโลยีภายในประเทศ และการนำ AI ไปใช้ในอุตสาหกรรมแบบกว้างขวาง

การเปิดตัว DingTalk A1
เปิดตัวในงานครบรอบ 10 ปีของ DingTalk
ขนาดเท่าบัตรเครดิต หนาเพียง 3.8 มม. น้ำหนัก ~40 กรัม
มี OLED สี, USB-C, รองรับการสรุป, แปล, วิเคราะห์, สร้าง mindmap

ความสามารถด้าน AI
เทรนด้วยเสียงกว่า 100 ล้านชั่วโมงจาก Tongyi AI Lab
รองรับมากกว่า 100 ภาษา, 30 สำเนียงจีน, และศัพท์เฉพาะจาก 200 อุตสาหกรรม
ใช้โมเดล AI ชั้นนำ เช่น Qwen, DeepSeek, QwQ-plus

การเปรียบเทียบกับคู่แข่ง
Plaud Note Pro ราคา US$179, ใช้ GPT-4.1, Claude 4, Gemini 2.5
TicNote ราคา US$159.99, ใช้ DeepSeek-V3, Kimi-k2, รองรับ mindmap และ insight
DingTalk A1 ถูกกว่า, เชื่อมกับแอป DingTalk โดยตรง, ไม่ต้องติดตั้งแยก

แนวโน้มตลาด AI hardware ในจีน
มูลค่าตลาดปี 2025 อยู่ที่ 1.1 ล้านล้านหยวน
คาดว่าจะเพิ่มเป็น 2.5 ล้านล้านหยวนภายในปี 2030
การเติบโตมาจากนโยบายรัฐ, การพึ่งพาเทคโนโลยีในประเทศ, และการนำ AI ไปใช้ในอุตสาหกรรมต่าง ๆ

https://www.thestar.com.my/tech/tech-news/2025/09/04/chinas-latest-ai-gadget-is-a-credit-card-sized-recorder-from-alibabas-dingtalk

🎙️ เรื่องเล่าจากบัตรเครดิตที่พูดได้: เมื่อ Alibaba เปลี่ยนเครื่องบันทึกเสียงให้กลายเป็นผู้ช่วยอัจฉริยะ ในงานครบรอบ 10 ปีของ DingTalk เมื่อปลายเดือนสิงหาคม 2025 Alibaba เปิดตัว DingTalk A1 ซึ่งเป็นเครื่องบันทึกเสียงขนาดเท่าบัตรเครดิตที่อัดแน่นด้วยความสามารถด้าน AI โดยใช้โมเดลจาก Tongyi AI Lab ที่เทรนด้วยเสียงกว่า 100 ล้านชั่วโมง ทำให้สามารถเข้าใจได้มากกว่า 100 ภาษาและ 30 สำเนียงจีน รวมถึงศัพท์เฉพาะจากกว่า 200 อุตสาหกรรม A1 ไม่ได้แค่บันทึกเสียง แต่สามารถสรุปประชุม, แปลภาษาแบบเรียลไทม์, วิเคราะห์เนื้อหา และสร้างเอกสารในรูปแบบต่าง ๆ เช่น minutes, to-do list หรือแม้แต่ mindmap โดยไม่ต้องพึ่งมนุษย์เลยแม้แต่นิดเดียว เมื่อเปรียบเทียบกับคู่แข่งอย่าง Plaud Note Pro (US$179) และ Mobvoi TicNote (US$159.99) แล้ว DingTalk A1 มีราคาถูกกว่าอย่างเห็นได้ชัดที่ 499–799 หยวน (US$69.98–111.8) และยังมีฟีเจอร์ที่โดดเด่น เช่น OLED สี, USB-C, การเชื่อมต่อกับแอป DingTalk โดยตรง และการรองรับโมเดล AI ชั้นนำจากจีน เช่น Qwen3-235B, DeepSeek-V3 ตลาด AI hardware ในจีนกำลังเติบโตอย่างรวดเร็ว โดยคาดว่าจะมีมูลค่าถึง 1.1 ล้านล้านหยวนในปีนี้ และเพิ่มเป็น 2.5 ล้านล้านภายในปี 2030 ซึ่งเป็นผลจากนโยบายสนับสนุนของรัฐบาล, การพึ่งพาเทคโนโลยีภายในประเทศ และการนำ AI ไปใช้ในอุตสาหกรรมแบบกว้างขวาง ✅ การเปิดตัว DingTalk A1 ➡️ เปิดตัวในงานครบรอบ 10 ปีของ DingTalk ➡️ ขนาดเท่าบัตรเครดิต หนาเพียง 3.8 มม. น้ำหนัก ~40 กรัม ➡️ มี OLED สี, USB-C, รองรับการสรุป, แปล, วิเคราะห์, สร้าง mindmap ✅ ความสามารถด้าน AI ➡️ เทรนด้วยเสียงกว่า 100 ล้านชั่วโมงจาก Tongyi AI Lab ➡️ รองรับมากกว่า 100 ภาษา, 30 สำเนียงจีน, และศัพท์เฉพาะจาก 200 อุตสาหกรรม ➡️ ใช้โมเดล AI ชั้นนำ เช่น Qwen, DeepSeek, QwQ-plus ✅ การเปรียบเทียบกับคู่แข่ง ➡️ Plaud Note Pro ราคา US$179, ใช้ GPT-4.1, Claude 4, Gemini 2.5 ➡️ TicNote ราคา US$159.99, ใช้ DeepSeek-V3, Kimi-k2, รองรับ mindmap และ insight ➡️ DingTalk A1 ถูกกว่า, เชื่อมกับแอป DingTalk โดยตรง, ไม่ต้องติดตั้งแยก ✅ แนวโน้มตลาด AI hardware ในจีน ➡️ มูลค่าตลาดปี 2025 อยู่ที่ 1.1 ล้านล้านหยวน ➡️ คาดว่าจะเพิ่มเป็น 2.5 ล้านล้านหยวนภายในปี 2030 ➡️ การเติบโตมาจากนโยบายรัฐ, การพึ่งพาเทคโนโลยีในประเทศ, และการนำ AI ไปใช้ในอุตสาหกรรมต่าง ๆ https://www.thestar.com.my/tech/tech-news/2025/09/04/chinas-latest-ai-gadget-is-a-credit-card-sized-recorder-from-alibabas-dingtalk

WWW.THESTAR.COM.MY

China’s latest AI gadget is a credit card-sized recorder from Alibaba’s DingTalk
Transcription capability developed with Alibaba's Tongyi AI lab, using over 100 million hours of audio content for training.

0 ความคิดเห็น 0 การแบ่งปัน 374 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-02 04:39:37 -

เรื่องเล่าจาก SGLang: เมื่อ DeepSeek ถูกเสิร์ฟด้วยศิลปะของการแยกงานและแบ่งผู้เชี่ยวชาญ

DeepSeek เป็นโมเดล LLM ที่ทรงพลังและซับซ้อน ด้วยสถาปัตยกรรมที่ใช้ Multi-head Latent Attention (MLA) และ Mixture of Experts (MoE) ซึ่งทำให้การรัน inference แบบ real-time กลายเป็นความท้าทายระดับสูง แต่ทีม SGLang ได้โชว์ว่า ถ้าออกแบบระบบดีพอ ก็สามารถรัน DeepSeek-V3 บน 96 H100 GPUs ได้อย่างมีประสิทธิภาพสูงสุด

หัวใจของความสำเร็จนี้คือการใช้เทคนิค PD Disaggregation (แยกงานระหว่าง prefill และ decode) ร่วมกับ Expert Parallelism (EP) ที่ปรับแต่งอย่างละเอียดผ่าน DeepEP, DeepGEMM และ EPLB เพื่อให้การจัดการ memory, communication และ workload balance เป็นไปอย่างไร้รอยต่อ

ผลลัพธ์คือ throughput สูงถึง 52.3k input tokens/sec และ 22.3k output tokens/sec ต่อ node ซึ่งใกล้เคียงกับระบบ production ของ DeepSeek เอง แต่ใช้ต้นทุนเพียง 20% ของ API ทางการ

สถาปัตยกรรมการรัน DeepSeek บน SGLang
ใช้ 12 nodes × 8 H100 GPUs รวม 96 GPUs
throughput สูงถึง 52.3k input และ 22.3k output tokens/sec ต่อ node
ต้นทุน inference อยู่ที่ ~$0.20 ต่อ 1M output tokens

เทคนิค Prefill-Decode Disaggregation (PD)
แยกการรัน prefill และ decode ออกจากกันเพื่อเพิ่มประสิทธิภาพ
ลดปัญหา prefill interrupt และ latency จากการจัด batch แบบรวม
รองรับ dispatch mode ที่ต่างกันสำหรับแต่ละ phase

Expert Parallelism (EP) ด้วย DeepEP
ใช้ normal dispatch สำหรับ prefill และ low-latency dispatch สำหรับ decode
รองรับ auto mode ที่เลือก dispatch ตาม workload
ลด latency และเพิ่ม throughput โดยใช้ expert routing ที่ปรับแต่งได้

DeepGEMM สำหรับ MoE computation
ใช้ Grouped GEMMs แบบ contiguous และ masked layout
รองรับ CUDA Graph สำหรับ decode phase
ใช้ Triton kernel เพื่อจัดเรียงข้อมูลให้เหมาะกับ GEMM kernel

Two-Batch Overlap (TBO)
แบ่ง batch เป็นสองส่วนเพื่อให้ computation และ communication overlap
เพิ่ม throughput ได้ถึง 35% และลด peak memory usage
ใช้ abstraction layer เพื่อจัดการ micro-batch อย่างสะอาดและ maintainable

Expert Parallelism Load Balancer (EPLB)
ใช้ expert redundancy เพื่อจัดวาง expert ให้สมดุล
รองรับ parallelism size ที่ไม่จำกัดแค่ power-of-two เช่น 12 หรือ 72
เพิ่ม utilization rate และลดการรอ GPU ที่ช้า

Toolkits เสริมใน SGLang
DisposableTensor สำหรับจัดการ memory ใน PyTorch โดยตรง
Expert workload simulator เพื่อประเมิน performance ก่อน deploy จริง
รองรับการ rebalancing แบบ staged เพื่อไม่ให้รบกวนระบบขณะทำงาน

https://lmsys.org/blog/2025-05-05-large-scale-ep/

🎙️ เรื่องเล่าจาก SGLang: เมื่อ DeepSeek ถูกเสิร์ฟด้วยศิลปะของการแยกงานและแบ่งผู้เชี่ยวชาญ DeepSeek เป็นโมเดล LLM ที่ทรงพลังและซับซ้อน ด้วยสถาปัตยกรรมที่ใช้ Multi-head Latent Attention (MLA) และ Mixture of Experts (MoE) ซึ่งทำให้การรัน inference แบบ real-time กลายเป็นความท้าทายระดับสูง แต่ทีม SGLang ได้โชว์ว่า ถ้าออกแบบระบบดีพอ ก็สามารถรัน DeepSeek-V3 บน 96 H100 GPUs ได้อย่างมีประสิทธิภาพสูงสุด หัวใจของความสำเร็จนี้คือการใช้เทคนิค PD Disaggregation (แยกงานระหว่าง prefill และ decode) ร่วมกับ Expert Parallelism (EP) ที่ปรับแต่งอย่างละเอียดผ่าน DeepEP, DeepGEMM และ EPLB เพื่อให้การจัดการ memory, communication และ workload balance เป็นไปอย่างไร้รอยต่อ ผลลัพธ์คือ throughput สูงถึง 52.3k input tokens/sec และ 22.3k output tokens/sec ต่อ node ซึ่งใกล้เคียงกับระบบ production ของ DeepSeek เอง แต่ใช้ต้นทุนเพียง 20% ของ API ทางการ ✅ สถาปัตยกรรมการรัน DeepSeek บน SGLang ➡️ ใช้ 12 nodes × 8 H100 GPUs รวม 96 GPUs ➡️ throughput สูงถึง 52.3k input และ 22.3k output tokens/sec ต่อ node ➡️ ต้นทุน inference อยู่ที่ ~$0.20 ต่อ 1M output tokens ✅ เทคนิค Prefill-Decode Disaggregation (PD) ➡️ แยกการรัน prefill และ decode ออกจากกันเพื่อเพิ่มประสิทธิภาพ ➡️ ลดปัญหา prefill interrupt และ latency จากการจัด batch แบบรวม ➡️ รองรับ dispatch mode ที่ต่างกันสำหรับแต่ละ phase ✅ Expert Parallelism (EP) ด้วย DeepEP ➡️ ใช้ normal dispatch สำหรับ prefill และ low-latency dispatch สำหรับ decode ➡️ รองรับ auto mode ที่เลือก dispatch ตาม workload ➡️ ลด latency และเพิ่ม throughput โดยใช้ expert routing ที่ปรับแต่งได้ ✅ DeepGEMM สำหรับ MoE computation ➡️ ใช้ Grouped GEMMs แบบ contiguous และ masked layout ➡️ รองรับ CUDA Graph สำหรับ decode phase ➡️ ใช้ Triton kernel เพื่อจัดเรียงข้อมูลให้เหมาะกับ GEMM kernel ✅ Two-Batch Overlap (TBO) ➡️ แบ่ง batch เป็นสองส่วนเพื่อให้ computation และ communication overlap ➡️ เพิ่ม throughput ได้ถึง 35% และลด peak memory usage ➡️ ใช้ abstraction layer เพื่อจัดการ micro-batch อย่างสะอาดและ maintainable ✅ Expert Parallelism Load Balancer (EPLB) ➡️ ใช้ expert redundancy เพื่อจัดวาง expert ให้สมดุล ➡️ รองรับ parallelism size ที่ไม่จำกัดแค่ power-of-two เช่น 12 หรือ 72 ➡️ เพิ่ม utilization rate และลดการรอ GPU ที่ช้า ✅ Toolkits เสริมใน SGLang ➡️ DisposableTensor สำหรับจัดการ memory ใน PyTorch โดยตรง ➡️ Expert workload simulator เพื่อประเมิน performance ก่อน deploy จริง ➡️ รองรับการ rebalancing แบบ staged เพื่อไม่ให้รบกวนระบบขณะทำงาน https://lmsys.org/blog/2025-05-05-large-scale-ep/

LMSYS.ORG

Deploying DeepSeek with PD Disaggregation and Large-Scale Expert Parallelism on 96 H100 GPUs | LMSYS Org
DeepSeek is a popular open-source large language model (LLM) praised for its strong performance. However, its large size and unique architecture, which us...

0 ความคิดเห็น 0 การแบ่งปัน 398 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-09-02 04:19:20 -

เรื่องเล่าจากเบื้องหลัง AI: ต้นทุนจริงของการรันโมเดลใหญ่

ช่วงนี้มีเสียงลือกันหนาหูว่า AI โดยเฉพาะการ “รัน inference” คือเครื่องเผาเงินชั้นดี หลายคนเชื่อว่าบริษัทอย่าง OpenAI และ Anthropic กำลังขาดทุนยับเยินจากการให้บริการโมเดลขนาดใหญ่ แต่บทความนี้พาเราไปเจาะลึกแบบ “napkin math” หรือคำนวณคร่าว ๆ จากหลักการพื้นฐาน เพื่อหาคำตอบว่าเรื่องนี้จริงแค่ไหน

ผู้เขียนใช้ DeepSeek R1 เป็นโมเดลตัวอย่าง ซึ่งมี 671 พารามิเตอร์ทั้งหมด แต่ใช้แค่ 37B ผ่านเทคนิค mixture of experts (MoE) ที่ช่วยลดต้นทุนได้มาก โดยใช้ GPU H100 จำนวน 72 ตัว คิดราคาที่ $2 ต่อชั่วโมงต่อ GPU ซึ่งสูงกว่าราคาจริงในตลาดเสียอีก

สิ่งที่น่าสนใจคือ “ต้นทุนของ input tokens” กับ “output tokens” ต่างกันมหาศาล! การประมวลผล input tokens สามารถทำได้แบบขนานและเร็วมาก ในขณะที่การสร้าง output tokens ต้องทำแบบลำดับทีละตัว ทำให้ต้นทุนสูงกว่าเป็นพันเท่า

ยิ่งไปกว่านั้น การใช้งานจริงของผู้ใช้ เช่น นักพัฒนา หรือ power users กลับอยู่ในรูปแบบที่ใช้ input เยอะมาก แต่ output น้อย เช่น การส่งโค้ดทั้งไฟล์เพื่อให้ AI วิเคราะห์ แล้วให้มันตอบกลับแค่ไม่กี่บรรทัด ซึ่งเป็นรูปแบบที่ “คุ้มค่ามาก” สำหรับผู้ให้บริการ

ต้นทุนการรัน inference ของโมเดล AI
ใช้ GPU H100 จำนวน 72 ตัว คิดต้นทุน $144/ชั่วโมง
input tokens ประมวลผลได้เร็วมากถึง ~46.8 พันล้าน tokens/ชั่วโมง
output tokens สร้างได้เพียง ~46.7 ล้าน tokens/ชั่วโมง
ต้นทุนต่อ input token อยู่ที่ ~$0.003 ต่อ 1 ล้าน tokens
ต้นทุนต่อ output token สูงถึง ~$3 ต่อ 1 ล้าน tokens

ความแตกต่างระหว่าง input และ output
input สามารถประมวลผลแบบขนานได้
output ต้องสร้างทีละ token ทำให้ช้ากว่าและแพงกว่า
ความไม่สมมาตรนี้ทำให้บาง use case คุ้มค่ามาก เช่น coding assistant

ตัวอย่างการใช้งานจริง
ผู้ใช้ระดับนักพัฒนาใช้ input เยอะมาก เช่น โค้ดหลายไฟล์
แต่ต้องการ output น้อย เช่น คำอธิบายหรือโค้ดสั้น ๆ
ทำให้ต้นทุนจริงต่ำมากเมื่อเทียบกับราคาที่เรียกเก็บ

โมเดลธุรกิจของ API
ราคาขายต่อ 1 ล้าน tokens อยู่ที่ ~$3 สำหรับ output
แต่ต้นทุนจริงอยู่ที่ ~$0.01 สำหรับ input และ ~$3 สำหรับ output
ทำให้มี margin สูงถึง 80–95%

ความเข้าใจผิดเกี่ยวกับต้นทุน AI
หลายคนเชื่อว่า inference ขาดทุนเสมอ ซึ่งไม่จริงในหลายกรณี
การพูดถึงต้นทุนสูงอาจเป็นกลยุทธ์ของผู้เล่นรายใหญ่เพื่อกันคู่แข่ง

ความเสี่ยงจาก context ยาว
เมื่อ context ยาวเกิน 128k tokens จะเปลี่ยนจาก memory-bound เป็น compute-bound
ทำให้ต้นทุนเพิ่มขึ้น 2–10 เท่า
บางโมเดลจึงจำกัด context window เพื่อควบคุมต้นทุน

การตั้งราคาที่ไม่สอดคล้องกับมูลค่าจริง
การคิดราคาตาม input อาจทำให้ผู้ใช้ลดรายละเอียดใน prompt
การคิดราคาตาม output อาจทำให้ผู้ใช้รู้สึกว่าไม่คุ้มถ้าได้คำตอบสั้น

https://martinalderson.com/posts/are-openai-and-anthropic-really-losing-money-on-inference/

🎙️ เรื่องเล่าจากเบื้องหลัง AI: ต้นทุนจริงของการรันโมเดลใหญ่ ช่วงนี้มีเสียงลือกันหนาหูว่า AI โดยเฉพาะการ “รัน inference” คือเครื่องเผาเงินชั้นดี หลายคนเชื่อว่าบริษัทอย่าง OpenAI และ Anthropic กำลังขาดทุนยับเยินจากการให้บริการโมเดลขนาดใหญ่ แต่บทความนี้พาเราไปเจาะลึกแบบ “napkin math” หรือคำนวณคร่าว ๆ จากหลักการพื้นฐาน เพื่อหาคำตอบว่าเรื่องนี้จริงแค่ไหน ผู้เขียนใช้ DeepSeek R1 เป็นโมเดลตัวอย่าง ซึ่งมี 671 พารามิเตอร์ทั้งหมด แต่ใช้แค่ 37B ผ่านเทคนิค mixture of experts (MoE) ที่ช่วยลดต้นทุนได้มาก โดยใช้ GPU H100 จำนวน 72 ตัว คิดราคาที่ $2 ต่อชั่วโมงต่อ GPU ซึ่งสูงกว่าราคาจริงในตลาดเสียอีก สิ่งที่น่าสนใจคือ “ต้นทุนของ input tokens” กับ “output tokens” ต่างกันมหาศาล! การประมวลผล input tokens สามารถทำได้แบบขนานและเร็วมาก ในขณะที่การสร้าง output tokens ต้องทำแบบลำดับทีละตัว ทำให้ต้นทุนสูงกว่าเป็นพันเท่า ยิ่งไปกว่านั้น การใช้งานจริงของผู้ใช้ เช่น นักพัฒนา หรือ power users กลับอยู่ในรูปแบบที่ใช้ input เยอะมาก แต่ output น้อย เช่น การส่งโค้ดทั้งไฟล์เพื่อให้ AI วิเคราะห์ แล้วให้มันตอบกลับแค่ไม่กี่บรรทัด ซึ่งเป็นรูปแบบที่ “คุ้มค่ามาก” สำหรับผู้ให้บริการ ✅ ต้นทุนการรัน inference ของโมเดล AI ➡️ ใช้ GPU H100 จำนวน 72 ตัว คิดต้นทุน $144/ชั่วโมง ➡️ input tokens ประมวลผลได้เร็วมากถึง ~46.8 พันล้าน tokens/ชั่วโมง ➡️ output tokens สร้างได้เพียง ~46.7 ล้าน tokens/ชั่วโมง ➡️ ต้นทุนต่อ input token อยู่ที่ ~$0.003 ต่อ 1 ล้าน tokens ➡️ ต้นทุนต่อ output token สูงถึง ~$3 ต่อ 1 ล้าน tokens ✅ ความแตกต่างระหว่าง input และ output ➡️ input สามารถประมวลผลแบบขนานได้ ➡️ output ต้องสร้างทีละ token ทำให้ช้ากว่าและแพงกว่า ➡️ ความไม่สมมาตรนี้ทำให้บาง use case คุ้มค่ามาก เช่น coding assistant ✅ ตัวอย่างการใช้งานจริง ➡️ ผู้ใช้ระดับนักพัฒนาใช้ input เยอะมาก เช่น โค้ดหลายไฟล์ ➡️ แต่ต้องการ output น้อย เช่น คำอธิบายหรือโค้ดสั้น ๆ ➡️ ทำให้ต้นทุนจริงต่ำมากเมื่อเทียบกับราคาที่เรียกเก็บ ✅ โมเดลธุรกิจของ API ➡️ ราคาขายต่อ 1 ล้าน tokens อยู่ที่ ~$3 สำหรับ output ➡️ แต่ต้นทุนจริงอยู่ที่ ~$0.01 สำหรับ input และ ~$3 สำหรับ output ➡️ ทำให้มี margin สูงถึง 80–95% ‼️ ความเข้าใจผิดเกี่ยวกับต้นทุน AI ⛔ หลายคนเชื่อว่า inference ขาดทุนเสมอ ซึ่งไม่จริงในหลายกรณี ⛔ การพูดถึงต้นทุนสูงอาจเป็นกลยุทธ์ของผู้เล่นรายใหญ่เพื่อกันคู่แข่ง ‼️ ความเสี่ยงจาก context ยาว ⛔ เมื่อ context ยาวเกิน 128k tokens จะเปลี่ยนจาก memory-bound เป็น compute-bound ⛔ ทำให้ต้นทุนเพิ่มขึ้น 2–10 เท่า ⛔ บางโมเดลจึงจำกัด context window เพื่อควบคุมต้นทุน ‼️ การตั้งราคาที่ไม่สอดคล้องกับมูลค่าจริง ⛔ การคิดราคาตาม input อาจทำให้ผู้ใช้ลดรายละเอียดใน prompt ⛔ การคิดราคาตาม output อาจทำให้ผู้ใช้รู้สึกว่าไม่คุ้มถ้าได้คำตอบสั้น https://martinalderson.com/posts/are-openai-and-anthropic-really-losing-money-on-inference/

MARTINALDERSON.COM

Are OpenAI and Anthropic Really Losing Money on Inference?
Deconstructing the real costs of running AI inference at scale. My napkin math suggests the economics might be far more profitable than commonly claimed.

0 ความคิดเห็น 0 การแบ่งปัน 322 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-08-26 16:26:25 -

GB10 Superchip – สมองกลระดับซูเปอร์คอมพิวเตอร์ในร่าง Mini PC

ลองนึกภาพว่าคุณสามารถฝึกโมเดล AI ขนาด 200 พันล้านพารามิเตอร์ได้จากโต๊ะทำงานของคุณเอง โดยไม่ต้องพึ่งคลาวด์หรือเซิร์ฟเวอร์ขนาดใหญ่ นั่นคือสิ่งที่ NVIDIA พยายามทำให้เป็นจริงผ่าน DGX Spark ที่ใช้ GB10 Superchip ซึ่งรวม CPU และ GPU ไว้ในแพ็กเกจเดียวกันด้วยเทคโนโลยี 2.5D packaging บนสถาปัตยกรรม 3nm

GB10 ประกอบด้วย 20 คอร์ ARM v9.2 แบ่งเป็น 2 กลุ่ม พร้อมแคช L2 ส่วนตัวและ L3 ขนาด 32MB รวม GPU Blackwell รุ่นใหม่ที่ให้พลังประมวลผล AI สูงถึง 1000 TOPS (FP4) และรองรับ DLSS 4 กับ Ray Tracing ในตัว

หน่วยความจำ LPDDR5x แบบ Unified Memory Architecture (UMA) ขนาด 128GB ทำให้ CPU และ GPU เข้าถึงข้อมูลร่วมกันได้อย่างรวดเร็ว โดยมีแบนด์วิดท์รวมสูงถึง 600 GB/s ผ่าน NVLINK C2C

DGX Spark ยังรองรับการเชื่อมต่อหลายเครื่องผ่าน ConnectX-7 NIC เพื่อขยายการประมวลผล AI ไปถึงโมเดลขนาด 405 พันล้านพารามิเตอร์ และสามารถใช้งานร่วมกับซอฟต์แวร์ AI เต็มรูปแบบของ NVIDIA เช่น CUDA, TensorRT, vLLM และ GR00T N1.5

สรุปเนื้อหาเป็นหัวข้อ
NVIDIA เปิดตัว GB10 Superchip ในงาน Hot Chips 2025 สำหรับ DGX Spark – AI PC ขนาดเล็ก
ใช้เทคโนโลยี 3nm จาก TSMC และ 2.5D packaging รวม CPU และ GPU ในแพ็กเกจเดียว
CPU มี 20 คอร์ ARM v9.2 พร้อมแคช L2 และ L3 รวม 32MB
GPU ใช้สถาปัตยกรรม Blackwell พร้อม Tensor Core Gen 5 และ Ray Tracing
ให้พลังประมวลผล AI สูงถึง 1000 TOPS (FP4) และ 31 TFLOPs (FP32)
รองรับ LPDDR5x ความเร็ว 9400 MT/s ความจุสูงสุด 128GB แบบ UMA
แบนด์วิดท์รวมของระบบสูงถึง 600 GB/s ผ่าน NVLINK C2C
มี System Level Cache ขนาด 16MB สำหรับการแชร์ข้อมูลระหว่าง CPU และ GPU
รองรับการเชื่อมต่อ PCIe Gen5, USB, Ethernet และแสดงผล 4K/8K ได้หลายจอ
ระบบความปลอดภัยมี Dual Secure Root, fTPM และ discrete TPM
TDP ของชิปอยู่ที่ 140W เหมาะกับการใช้งานบนโต๊ะทำงานทั่วไป
DGX Spark สามารถเชื่อมต่อหลายเครื่องผ่าน ConnectX-7 เพื่อรองรับโมเดล AI ขนาดใหญ่
รองรับการใช้งานร่วมกับโมเดล AI จาก Meta, Google, DeepSeek และ NVIDIA Cosmos

ข้อมูลเสริมจากภายนอก
DGX Spark เป็นการต่อยอดจาก Project DIGITS และใช้แพลตฟอร์มเดียวกับ DGX Cloud
ขนาดเครื่องเล็กเพียง 150 x 150 x 50.5 มม. เหมาะกับการวางบนโต๊ะทำงาน
NVIDIA เตรียมขยาย GB10 ไปสู่แพลตฟอร์มผู้บริโภค เช่น N1X และ N1 SoC สำหรับโน้ตบุ๊ก
DGX Spark รองรับการใช้งานกับแพลตฟอร์ม Isaac, Metropolis และ Holoscan
ใช้ ConnectX NIC ผ่าน PCIe Gen5 x8 เพื่อเชื่อมต่อหลายระบบแบบ low-latency

https://wccftech.com/nvidia-gb10-superchip-soc-3nm-20-arm-v9-2-cpu-cores-nvfp4-blackwell-gpu-lpddr5x-9400-memory-140w-tdp/

🧠 GB10 Superchip – สมองกลระดับซูเปอร์คอมพิวเตอร์ในร่าง Mini PC ลองนึกภาพว่าคุณสามารถฝึกโมเดล AI ขนาด 200 พันล้านพารามิเตอร์ได้จากโต๊ะทำงานของคุณเอง โดยไม่ต้องพึ่งคลาวด์หรือเซิร์ฟเวอร์ขนาดใหญ่ นั่นคือสิ่งที่ NVIDIA พยายามทำให้เป็นจริงผ่าน DGX Spark ที่ใช้ GB10 Superchip ซึ่งรวม CPU และ GPU ไว้ในแพ็กเกจเดียวกันด้วยเทคโนโลยี 2.5D packaging บนสถาปัตยกรรม 3nm GB10 ประกอบด้วย 20 คอร์ ARM v9.2 แบ่งเป็น 2 กลุ่ม พร้อมแคช L2 ส่วนตัวและ L3 ขนาด 32MB รวม GPU Blackwell รุ่นใหม่ที่ให้พลังประมวลผล AI สูงถึง 1000 TOPS (FP4) และรองรับ DLSS 4 กับ Ray Tracing ในตัว หน่วยความจำ LPDDR5x แบบ Unified Memory Architecture (UMA) ขนาด 128GB ทำให้ CPU และ GPU เข้าถึงข้อมูลร่วมกันได้อย่างรวดเร็ว โดยมีแบนด์วิดท์รวมสูงถึง 600 GB/s ผ่าน NVLINK C2C DGX Spark ยังรองรับการเชื่อมต่อหลายเครื่องผ่าน ConnectX-7 NIC เพื่อขยายการประมวลผล AI ไปถึงโมเดลขนาด 405 พันล้านพารามิเตอร์ และสามารถใช้งานร่วมกับซอฟต์แวร์ AI เต็มรูปแบบของ NVIDIA เช่น CUDA, TensorRT, vLLM และ GR00T N1.5 📌 สรุปเนื้อหาเป็นหัวข้อ ➡️ NVIDIA เปิดตัว GB10 Superchip ในงาน Hot Chips 2025 สำหรับ DGX Spark – AI PC ขนาดเล็ก ➡️ ใช้เทคโนโลยี 3nm จาก TSMC และ 2.5D packaging รวม CPU และ GPU ในแพ็กเกจเดียว ➡️ CPU มี 20 คอร์ ARM v9.2 พร้อมแคช L2 และ L3 รวม 32MB ➡️ GPU ใช้สถาปัตยกรรม Blackwell พร้อม Tensor Core Gen 5 และ Ray Tracing ➡️ ให้พลังประมวลผล AI สูงถึง 1000 TOPS (FP4) และ 31 TFLOPs (FP32) ➡️ รองรับ LPDDR5x ความเร็ว 9400 MT/s ความจุสูงสุด 128GB แบบ UMA ➡️ แบนด์วิดท์รวมของระบบสูงถึง 600 GB/s ผ่าน NVLINK C2C ➡️ มี System Level Cache ขนาด 16MB สำหรับการแชร์ข้อมูลระหว่าง CPU และ GPU ➡️ รองรับการเชื่อมต่อ PCIe Gen5, USB, Ethernet และแสดงผล 4K/8K ได้หลายจอ ➡️ ระบบความปลอดภัยมี Dual Secure Root, fTPM และ discrete TPM ➡️ TDP ของชิปอยู่ที่ 140W เหมาะกับการใช้งานบนโต๊ะทำงานทั่วไป ➡️ DGX Spark สามารถเชื่อมต่อหลายเครื่องผ่าน ConnectX-7 เพื่อรองรับโมเดล AI ขนาดใหญ่ ➡️ รองรับการใช้งานร่วมกับโมเดล AI จาก Meta, Google, DeepSeek และ NVIDIA Cosmos ✅ ข้อมูลเสริมจากภายนอก ➡️ DGX Spark เป็นการต่อยอดจาก Project DIGITS และใช้แพลตฟอร์มเดียวกับ DGX Cloud ➡️ ขนาดเครื่องเล็กเพียง 150 x 150 x 50.5 มม. เหมาะกับการวางบนโต๊ะทำงาน ➡️ NVIDIA เตรียมขยาย GB10 ไปสู่แพลตฟอร์มผู้บริโภค เช่น N1X และ N1 SoC สำหรับโน้ตบุ๊ก ➡️ DGX Spark รองรับการใช้งานกับแพลตฟอร์ม Isaac, Metropolis และ Holoscan ➡️ ใช้ ConnectX NIC ผ่าน PCIe Gen5 x8 เพื่อเชื่อมต่อหลายระบบแบบ low-latency https://wccftech.com/nvidia-gb10-superchip-soc-3nm-20-arm-v9-2-cpu-cores-nvfp4-blackwell-gpu-lpddr5x-9400-memory-140w-tdp/

WCCFTECH.COM

NVIDIA Dissects Its GB10 Superchip For DGX AI PCs: 3nm With 20 ARM v9.2 CPU Cores, 1000 TOPS NVFP4 Blackwell GPU, LPDDR5x-9400 Memory Support, 140W TDP
NVIDIA has just detailed its GB10 Superchip with Blackwell GPU, which is being used to power several DGX AI Mini supercomputers.

0 ความคิดเห็น 0 การแบ่งปัน 354 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!
ลุงบ้าคอม ได้ทำการแชร์ลิงก์
2025-08-23 03:48:28 -

เมื่อ Tesla ต้องปรับตัวเพื่ออยู่รอดในตลาดจีน ด้วย AI ที่พูดภาษาท้องถิ่น

Tesla กำลังเผชิญกับการแข่งขันที่ดุเดือดในตลาดรถยนต์ไฟฟ้าจีน ซึ่งเต็มไปด้วยแบรนด์ท้องถิ่นที่ใส่เทคโนโลยีล้ำหน้าเข้าไปในรถอย่างไม่หยุดยั้ง เพื่อรับมือกับสถานการณ์นี้ Tesla จึงตัดสินใจเปลี่ยนกลยุทธ์ด้านซอฟต์แวร์ โดยนำโมเดล AI สัญชาติจีนอย่าง DeepSeek และ Doubao มาใช้ในระบบผู้ช่วยเสียงภายในรถยนต์

Doubao ซึ่งพัฒนาโดย ByteDance จะรับหน้าที่ประมวลผลคำสั่งเสียง เช่น การนำทาง การควบคุมอุณหภูมิ และการเล่นเพลง ส่วน DeepSeek จะทำหน้าที่เป็นผู้ช่วยสนทนาอัจฉริยะที่สามารถตอบคำถามหลายขั้นตอนและเข้าใจบริบทได้ลึกขึ้น ทั้งสองโมเดลจะทำงานผ่านคลาวด์ของ Volcano Engine ซึ่งเป็นบริการของ ByteDance เช่นกัน

การเปลี่ยนแปลงนี้เกิดขึ้นเพราะข้อจำกัดด้านกฎหมายของจีนที่ไม่อนุญาตให้ส่งข้อมูลผู้ใช้ไปยังเซิร์ฟเวอร์ต่างประเทศ ทำให้ Tesla ไม่สามารถใช้ Grok ซึ่งเป็นโมเดลของ xAI ที่ใช้ในสหรัฐฯ ได้

นอกจากนี้ Tesla ยังเปิดตัว Model Y L รุ่นใหม่แบบ 6 ที่นั่งในจีน ซึ่งเป็นรุ่นแรกที่รองรับผู้ช่วยเสียงแบบ “Hey, Tesla” โดยไม่ต้องกดปุ่มบนพวงมาลัยเหมือนรุ่นก่อน ๆ

การเคลื่อนไหวนี้สะท้อนถึงความจำเป็นที่ Tesla ต้องปรับตัวให้เข้ากับวัฒนธรรมเทคโนโลยีของจีน ซึ่งผู้ใช้คุ้นเคยกับระบบผู้ช่วยเสียงที่ตอบสนองได้รวดเร็วและเชื่อมโยงกับบริการท้องถิ่น เช่น แผนที่จีน แอปส่งอาหาร และระบบชำระเงิน

สรุปเนื้อหาเป็นหัวข้อ
Tesla เตรียมใช้ AI สัญชาติจีน DeepSeek และ Doubao ในรถยนต์ที่จำหน่ายในจีน
Doubao รับหน้าที่ประมวลผลคำสั่งเสียง เช่น นำทาง เพลง อุณหภูมิ
DeepSeek ทำหน้าที่สนทนาอัจฉริยะ ตอบคำถามหลายขั้นตอน
ทั้งสองโมเดลทำงานผ่านคลาวด์ Volcano Engine ของ ByteDance
Tesla ไม่สามารถใช้ Grok ในจีนเพราะข้อจำกัดด้านกฎหมายและการจัดการข้อมูล
ผู้ใช้สามารถเรียกผู้ช่วยเสียงด้วยคำว่า “Hey, Tesla” หรือกำหนดเองได้
Tesla เปิดตัว Model Y L รุ่นใหม่แบบ 6 ที่นั่งในจีน รองรับระบบ AI เต็มรูปแบบ
การเปลี่ยนแปลงนี้เกิดจากการแข่งขันกับแบรนด์จีน เช่น BYD และ Geely
BMW ก็ใช้โมเดล Qwen จาก Alibaba ในรถรุ่นใหม่ที่จำหน่ายในจีน
ยังไม่มีการยืนยันว่า AI ทั้งสองถูกติดตั้งในรถทุกคันแล้ว

ข้อมูลเสริมจากภายนอก
DeepSeek ได้รับความนิยมในจีนหลังเปิดตัวรุ่น R1 และ V3.1 ที่มีความสามารถด้าน reasoning สูง
ระบบผู้ช่วยเสียงในรถยนต์จีนสามารถเชื่อมต่อกับบริการท้องถิ่น เช่น Alipay, Meituan, Gaode Maps
LLMs เช่น ChatGPT, Qwen, และ DeepSeek ถูกนำมาใช้ในรถยนต์มากขึ้นทั่วโลก
การใช้ AI ในรถยนต์ช่วยเพิ่มความปลอดภัยและความสะดวกในการขับขี่
การใช้โมเดลท้องถิ่นช่วยให้ตอบสนองต่อภาษาถิ่นและพฤติกรรมผู้ใช้ได้แม่นยำกว่าโมเดลสากล

https://www.thestar.com.my/tech/tech-news/2025/08/22/tesla-to-integrate-deepseek-doubao-ai-voice-controls-in-china

🎙️ เมื่อ Tesla ต้องปรับตัวเพื่ออยู่รอดในตลาดจีน ด้วย AI ที่พูดภาษาท้องถิ่น Tesla กำลังเผชิญกับการแข่งขันที่ดุเดือดในตลาดรถยนต์ไฟฟ้าจีน ซึ่งเต็มไปด้วยแบรนด์ท้องถิ่นที่ใส่เทคโนโลยีล้ำหน้าเข้าไปในรถอย่างไม่หยุดยั้ง เพื่อรับมือกับสถานการณ์นี้ Tesla จึงตัดสินใจเปลี่ยนกลยุทธ์ด้านซอฟต์แวร์ โดยนำโมเดล AI สัญชาติจีนอย่าง DeepSeek และ Doubao มาใช้ในระบบผู้ช่วยเสียงภายในรถยนต์ Doubao ซึ่งพัฒนาโดย ByteDance จะรับหน้าที่ประมวลผลคำสั่งเสียง เช่น การนำทาง การควบคุมอุณหภูมิ และการเล่นเพลง ส่วน DeepSeek จะทำหน้าที่เป็นผู้ช่วยสนทนาอัจฉริยะที่สามารถตอบคำถามหลายขั้นตอนและเข้าใจบริบทได้ลึกขึ้น ทั้งสองโมเดลจะทำงานผ่านคลาวด์ของ Volcano Engine ซึ่งเป็นบริการของ ByteDance เช่นกัน การเปลี่ยนแปลงนี้เกิดขึ้นเพราะข้อจำกัดด้านกฎหมายของจีนที่ไม่อนุญาตให้ส่งข้อมูลผู้ใช้ไปยังเซิร์ฟเวอร์ต่างประเทศ ทำให้ Tesla ไม่สามารถใช้ Grok ซึ่งเป็นโมเดลของ xAI ที่ใช้ในสหรัฐฯ ได้ นอกจากนี้ Tesla ยังเปิดตัว Model Y L รุ่นใหม่แบบ 6 ที่นั่งในจีน ซึ่งเป็นรุ่นแรกที่รองรับผู้ช่วยเสียงแบบ “Hey, Tesla” โดยไม่ต้องกดปุ่มบนพวงมาลัยเหมือนรุ่นก่อน ๆ การเคลื่อนไหวนี้สะท้อนถึงความจำเป็นที่ Tesla ต้องปรับตัวให้เข้ากับวัฒนธรรมเทคโนโลยีของจีน ซึ่งผู้ใช้คุ้นเคยกับระบบผู้ช่วยเสียงที่ตอบสนองได้รวดเร็วและเชื่อมโยงกับบริการท้องถิ่น เช่น แผนที่จีน แอปส่งอาหาร และระบบชำระเงิน 📌 สรุปเนื้อหาเป็นหัวข้อ ➡️ Tesla เตรียมใช้ AI สัญชาติจีน DeepSeek และ Doubao ในรถยนต์ที่จำหน่ายในจีน ➡️ Doubao รับหน้าที่ประมวลผลคำสั่งเสียง เช่น นำทาง เพลง อุณหภูมิ ➡️ DeepSeek ทำหน้าที่สนทนาอัจฉริยะ ตอบคำถามหลายขั้นตอน ➡️ ทั้งสองโมเดลทำงานผ่านคลาวด์ Volcano Engine ของ ByteDance ➡️ Tesla ไม่สามารถใช้ Grok ในจีนเพราะข้อจำกัดด้านกฎหมายและการจัดการข้อมูล ➡️ ผู้ใช้สามารถเรียกผู้ช่วยเสียงด้วยคำว่า “Hey, Tesla” หรือกำหนดเองได้ ➡️ Tesla เปิดตัว Model Y L รุ่นใหม่แบบ 6 ที่นั่งในจีน รองรับระบบ AI เต็มรูปแบบ ➡️ การเปลี่ยนแปลงนี้เกิดจากการแข่งขันกับแบรนด์จีน เช่น BYD และ Geely ➡️ BMW ก็ใช้โมเดล Qwen จาก Alibaba ในรถรุ่นใหม่ที่จำหน่ายในจีน ➡️ ยังไม่มีการยืนยันว่า AI ทั้งสองถูกติดตั้งในรถทุกคันแล้ว ✅ ข้อมูลเสริมจากภายนอก ➡️ DeepSeek ได้รับความนิยมในจีนหลังเปิดตัวรุ่น R1 และ V3.1 ที่มีความสามารถด้าน reasoning สูง ➡️ ระบบผู้ช่วยเสียงในรถยนต์จีนสามารถเชื่อมต่อกับบริการท้องถิ่น เช่น Alipay, Meituan, Gaode Maps ➡️ LLMs เช่น ChatGPT, Qwen, และ DeepSeek ถูกนำมาใช้ในรถยนต์มากขึ้นทั่วโลก ➡️ การใช้ AI ในรถยนต์ช่วยเพิ่มความปลอดภัยและความสะดวกในการขับขี่ ➡️ การใช้โมเดลท้องถิ่นช่วยให้ตอบสนองต่อภาษาถิ่นและพฤติกรรมผู้ใช้ได้แม่นยำกว่าโมเดลสากล https://www.thestar.com.my/tech/tech-news/2025/08/22/tesla-to-integrate-deepseek-doubao-ai-voice-controls-in-china

WWW.THESTAR.COM.MY

Tesla to integrate Deepseek, Doubao AI voice controls in China
Tesla Inc plans to introduce in-car voice assistant functions powered by Deepseek and Bytedance Ltd's Doubao artificial intelligence as it aims to catch local rivals who offer similar features.

0 ความคิดเห็น 0 การแบ่งปัน 502 มุมมอง 0 รีวิว

กรุณาเข้าสู่ระบบเพื่อกดถูกใจ แชร์ และแสดงความคิดเห็น!

Pages Boosts