Grok 4.1 Thinking ขึ้นอันดับ 1

บริษัท xAI ของ Elon Musk ได้เปิดตัวโมเดลใหม่ Grok 4.1 โดยมีสองเวอร์ชันคือ Grok 4.1 มาตรฐาน และ Grok 4.1 Thinking ที่เน้นการใช้เหตุผลเชิงลึก ผลลัพธ์คือ Grok 4.1 Thinking สามารถทำคะแนน Elo ได้สูงถึง 1483 และขึ้นอันดับ 1 บนกระดาน LMArena โดยแซงหน้า Google Gemini 2.5 Pro ที่ตกไปอยู่อันดับ 3

ความสามารถด้านการเขียนเชิงสร้างสรรค์
ผลการทดสอบ Creative Writing v3 แสดงให้เห็นว่า Grok 4.1 ทั้งสองเวอร์ชันมีความสามารถด้านการเขียนที่ดีขึ้นอย่างมาก โดยทำคะแนนเหนือกว่าโมเดลคู่แข่งอย่าง OpenAI o3, Claude Sonnet 4.5 และ Kimi K2 Instruct แม้จะยังตามหลัง GPT 5.1 อยู่เล็กน้อย แต่ถือเป็นการพัฒนาที่ทำให้ Grok กลายเป็นคู่แข่งที่น่าจับตามองในตลาด AI เชิงสร้างสรรค์

ความแม่นยำและการลดความผิดพลาด
เมื่อเทียบกับรุ่นก่อนหน้า Grok 4 Fast โมเดลใหม่สามารถลดอัตราความผิดพลาดเชิงข้อมูลได้ถึง 70% และลดอัตราการ “หลอน” (hallucination) จาก 12.09% เหลือเพียง 4.22% ซึ่งถือเป็นการปรับปรุงครั้งใหญ่ที่ช่วยเพิ่มความน่าเชื่อถือและการใช้งานจริงในระดับองค์กรและผู้ใช้ทั่วไป

แนวโน้มการแข่งขัน AI
การที่ Grok 4.1 Thinking ขึ้นอันดับ 1 ถือเป็นแรงกดดันต่อ Google ที่เตรียมเปิดตัว Gemini 3.0 ในอนาคตอันใกล้ ขณะเดียวกันก็สะท้อนให้เห็นการแข่งขันที่ดุเดือดในตลาด AI ระดับโลก ซึ่งแต่ละบริษัทต่างพยายามพัฒนาโมเดลที่มีทั้งความแม่นยำ ความคิดสร้างสรรค์ และความสามารถในการใช้เหตุผลเชิงลึก

สรุปสาระสำคัญ
ข้อมูลจากข่าว
Grok 4.1 Thinking ทำคะแนน Elo ได้ 1483 ขึ้นอันดับ 1 บน LMArena
Google Gemini 2.5 Pro ตกไปอยู่อันดับ 3
ความสามารถด้าน Creative Writing ดีขึ้น แซงคู่แข่งหลายราย
ลดอัตราความผิดพลาดเชิงข้อมูลลง 70% และลด hallucination เหลือ 4.22%

คำเตือนจากข่าว
การแข่งขัน AI ที่รุนแรงอาจทำให้ผู้ใช้ต้องเผชิญกับการเปลี่ยนแปลงอย่างรวดเร็วของเทคโนโลยี
แม้ Grok 4.1 จะลดความผิดพลาด แต่ยังมีความเสี่ยงจากการหลอนที่ไม่สามารถกำจัดได้หมด
ผู้ใช้ควรระวังการนำ AI มาใช้ในงานที่ต้องการความแม่นยำสูง เช่น กฎหมายหรือการแพทย์

https://securityonline.info/grok-4-1-thinking-steals-1-spot-on-lmarena-surpassing-google-gemini-2-5-pro/
🚀 Grok 4.1 Thinking ขึ้นอันดับ 1 บริษัท xAI ของ Elon Musk ได้เปิดตัวโมเดลใหม่ Grok 4.1 โดยมีสองเวอร์ชันคือ Grok 4.1 มาตรฐาน และ Grok 4.1 Thinking ที่เน้นการใช้เหตุผลเชิงลึก ผลลัพธ์คือ Grok 4.1 Thinking สามารถทำคะแนน Elo ได้สูงถึง 1483 และขึ้นอันดับ 1 บนกระดาน LMArena โดยแซงหน้า Google Gemini 2.5 Pro ที่ตกไปอยู่อันดับ 3 ✍️ ความสามารถด้านการเขียนเชิงสร้างสรรค์ ผลการทดสอบ Creative Writing v3 แสดงให้เห็นว่า Grok 4.1 ทั้งสองเวอร์ชันมีความสามารถด้านการเขียนที่ดีขึ้นอย่างมาก โดยทำคะแนนเหนือกว่าโมเดลคู่แข่งอย่าง OpenAI o3, Claude Sonnet 4.5 และ Kimi K2 Instruct แม้จะยังตามหลัง GPT 5.1 อยู่เล็กน้อย แต่ถือเป็นการพัฒนาที่ทำให้ Grok กลายเป็นคู่แข่งที่น่าจับตามองในตลาด AI เชิงสร้างสรรค์ 📊 ความแม่นยำและการลดความผิดพลาด เมื่อเทียบกับรุ่นก่อนหน้า Grok 4 Fast โมเดลใหม่สามารถลดอัตราความผิดพลาดเชิงข้อมูลได้ถึง 70% และลดอัตราการ “หลอน” (hallucination) จาก 12.09% เหลือเพียง 4.22% ซึ่งถือเป็นการปรับปรุงครั้งใหญ่ที่ช่วยเพิ่มความน่าเชื่อถือและการใช้งานจริงในระดับองค์กรและผู้ใช้ทั่วไป 🔮 แนวโน้มการแข่งขัน AI การที่ Grok 4.1 Thinking ขึ้นอันดับ 1 ถือเป็นแรงกดดันต่อ Google ที่เตรียมเปิดตัว Gemini 3.0 ในอนาคตอันใกล้ ขณะเดียวกันก็สะท้อนให้เห็นการแข่งขันที่ดุเดือดในตลาด AI ระดับโลก ซึ่งแต่ละบริษัทต่างพยายามพัฒนาโมเดลที่มีทั้งความแม่นยำ ความคิดสร้างสรรค์ และความสามารถในการใช้เหตุผลเชิงลึก 📌 สรุปสาระสำคัญ ✅ ข้อมูลจากข่าว ➡️ Grok 4.1 Thinking ทำคะแนน Elo ได้ 1483 ขึ้นอันดับ 1 บน LMArena ➡️ Google Gemini 2.5 Pro ตกไปอยู่อันดับ 3 ➡️ ความสามารถด้าน Creative Writing ดีขึ้น แซงคู่แข่งหลายราย ➡️ ลดอัตราความผิดพลาดเชิงข้อมูลลง 70% และลด hallucination เหลือ 4.22% ‼️ คำเตือนจากข่าว ⛔ การแข่งขัน AI ที่รุนแรงอาจทำให้ผู้ใช้ต้องเผชิญกับการเปลี่ยนแปลงอย่างรวดเร็วของเทคโนโลยี ⛔ แม้ Grok 4.1 จะลดความผิดพลาด แต่ยังมีความเสี่ยงจากการหลอนที่ไม่สามารถกำจัดได้หมด ⛔ ผู้ใช้ควรระวังการนำ AI มาใช้ในงานที่ต้องการความแม่นยำสูง เช่น กฎหมายหรือการแพทย์ https://securityonline.info/grok-4-1-thinking-steals-1-spot-on-lmarena-surpassing-google-gemini-2-5-pro/
SECURITYONLINE.INFO
Grok 4.1 Thinking Steals #1 Spot on LMArena, Surpassing Google Gemini 2.5 Pro
xAI released Grok 4.1 Thinking, which immediately topped the LMArena leaderboard (Elo 1483), pushing Gemini 2.5 Pro to #3. Grok 4.1 also cut hallucinations by 70%.
0 Comments 0 Shares 20 Views 0 Reviews