ChatGPT is getting smarter, but its hallucinations are spiraling

ได้ทำการแชร์ลิงก์

2025-05-07 03:04:58 -

OpenAI ได้เปิดเผยว่า โมเดล AI รุ่นใหม่ GPT o3 และ o4-mini มีอัตราการเกิดภาพหลอน (hallucinations) สูงกว่ารุ่นก่อนหน้า ซึ่งอาจส่งผลต่อ ความน่าเชื่อถือของ AI ในการใช้งานจริง

แม้ว่าโมเดลใหม่จะถูกออกแบบให้ คิดอย่างเป็นขั้นตอนและมีเหตุผลมากขึ้น แต่ผลการทดสอบพบว่า GPT o3 มีอัตราการเกิดภาพหลอน 33% ในการทดสอบเกี่ยวกับบุคคลสาธารณะ ซึ่งสูงกว่ารุ่นก่อนหน้า GPT o1 ที่มีอัตราเพียง 16% ส่วน GPT o4-mini มีอัตราสูงถึง 48%

GPT o3 และ o4-mini มีอัตราการเกิดภาพหลอนสูงกว่ารุ่นก่อนหน้า
- GPT o3 มีอัตรา 33% ในการทดสอบเกี่ยวกับบุคคลสาธารณะ
- GPT o4-mini มีอัตราสูงถึง 48% ในการทดสอบเดียวกัน

OpenAI ออกแบบโมเดลใหม่ให้คิดอย่างเป็นขั้นตอนมากขึ้น
- GPT o3 และ o4-mini ไม่ได้เน้นแค่การสร้างข้อความที่ลื่นไหล แต่พยายามคิดอย่างมีเหตุผล

อัตราการเกิดภาพหลอนสูงขึ้นเมื่อทดสอบกับข้อมูลทั่วไป
- GPT o3 มีอัตรา 51% ในการทดสอบ SimpleQA
- GPT o4-mini มีอัตราสูงถึง 79% ในการทดสอบเดียวกัน

OpenAI เชื่อว่าโมเดลที่มีความสามารถด้านเหตุผลมากขึ้น อาจมีโอกาสเกิดภาพหลอนสูงขึ้น
- เนื่องจากต้อง ประเมินเส้นทางที่เป็นไปได้หลายทางและเชื่อมโยงข้อมูลที่แตกต่างกัน

นักวิจัยบางคนเชื่อว่า AI ที่พยายามคิดอย่างมีเหตุผล อาจมีแนวโน้มที่จะ "สร้างข้อมูลขึ้นมา" มากขึ้น
- เพราะต้อง คาดเดาและเชื่อมโยงข้อมูลที่ไม่สมบูรณ์

https://www.techradar.com/computing/artificial-intelligence/chatgpt-is-getting-smarter-but-its-hallucinations-are-spiraling

OpenAI ได้เปิดเผยว่า โมเดล AI รุ่นใหม่ GPT o3 และ o4-mini มีอัตราการเกิดภาพหลอน (hallucinations) สูงกว่ารุ่นก่อนหน้า ซึ่งอาจส่งผลต่อ ความน่าเชื่อถือของ AI ในการใช้งานจริง แม้ว่าโมเดลใหม่จะถูกออกแบบให้ คิดอย่างเป็นขั้นตอนและมีเหตุผลมากขึ้น แต่ผลการทดสอบพบว่า GPT o3 มีอัตราการเกิดภาพหลอน 33% ในการทดสอบเกี่ยวกับบุคคลสาธารณะ ซึ่งสูงกว่ารุ่นก่อนหน้า GPT o1 ที่มีอัตราเพียง 16% ส่วน GPT o4-mini มีอัตราสูงถึง 48% ✅ GPT o3 และ o4-mini มีอัตราการเกิดภาพหลอนสูงกว่ารุ่นก่อนหน้า - GPT o3 มีอัตรา 33% ในการทดสอบเกี่ยวกับบุคคลสาธารณะ - GPT o4-mini มีอัตราสูงถึง 48% ในการทดสอบเดียวกัน ✅ OpenAI ออกแบบโมเดลใหม่ให้คิดอย่างเป็นขั้นตอนมากขึ้น - GPT o3 และ o4-mini ไม่ได้เน้นแค่การสร้างข้อความที่ลื่นไหล แต่พยายามคิดอย่างมีเหตุผล ✅ อัตราการเกิดภาพหลอนสูงขึ้นเมื่อทดสอบกับข้อมูลทั่วไป - GPT o3 มีอัตรา 51% ในการทดสอบ SimpleQA - GPT o4-mini มีอัตราสูงถึง 79% ในการทดสอบเดียวกัน ✅ OpenAI เชื่อว่าโมเดลที่มีความสามารถด้านเหตุผลมากขึ้น อาจมีโอกาสเกิดภาพหลอนสูงขึ้น - เนื่องจากต้อง ประเมินเส้นทางที่เป็นไปได้หลายทางและเชื่อมโยงข้อมูลที่แตกต่างกัน ✅ นักวิจัยบางคนเชื่อว่า AI ที่พยายามคิดอย่างมีเหตุผล อาจมีแนวโน้มที่จะ "สร้างข้อมูลขึ้นมา" มากขึ้น - เพราะต้อง คาดเดาและเชื่อมโยงข้อมูลที่ไม่สมบูรณ์ https://www.techradar.com/computing/artificial-intelligence/chatgpt-is-getting-smarter-but-its-hallucinations-are-spiraling

WWW.TECHRADAR.COM

ChatGPT is getting smarter, but its hallucinations are spiraling

Is delusion the price of sophistication?

0 ความคิดเห็น 0 การแบ่งปัน 171 มุมมอง 0 รีวิว