Olmo 3 – เปิดทางใหม่ให้ AI แบบโอเพนซอร์ส

AI2 เปิดตัว Olmo 3 ซึ่งเป็นตระกูลโมเดลภาษาโอเพนซอร์สที่มีทั้งรุ่น 7B และ 32B parameters จุดเด่นคือไม่ใช่แค่ปล่อยโมเดลสำเร็จ แต่ยังเปิดเผย model flow หรือเส้นทางการพัฒนาทั้งหมด ตั้งแต่ข้อมูลฝึก, pipeline, ไปจนถึง checkpoint แต่ละช่วง เพื่อให้ผู้ใช้สามารถเข้าใจและปรับแต่งได้อย่างเต็มที่

ที่สำคัญ Olmo 3 มาพร้อม Olmo 3-Think (32B) ซึ่งเป็น reasoning model ที่สามารถตรวจสอบ intermediate reasoning traces และเชื่อมโยงพฤติกรรมกลับไปยังข้อมูลฝึกและการตัดสินใจที่ใช้ในการเทรน ถือเป็นครั้งแรกที่โมเดลโอเพนซอร์สเปิดให้ตรวจสอบการคิดแบบละเอียดเช่นนี้

สมรรถนะและการเปรียบเทียบ
Olmo 3-Base (7B, 32B): โมเดลฐานที่แข็งแกร่งที่สุดในกลุ่มโอเพนซอร์ส สามารถแก้โจทย์โปรแกรมมิ่ง, การอ่านจับใจความ, และคณิตศาสตร์ได้ดีเยี่ยม พร้อมรองรับ context ยาวถึง ~65K tokens
Olmo 3-Think: โมเดล reasoning ที่แข่งขันได้กับ Qwen 3 และ Gemma 3 โดยใช้ข้อมูลฝึกน้อยกว่า แต่ยังคงทำคะแนนสูงใน benchmark อย่าง MATH, BigBenchHard และ HumanEvalPlus
Olmo 3-Instruct (7B): โมเดลสำหรับการสนทนาและการทำงานแบบ multi-turn ที่สามารถทำงาน instruction-following และ function calling ได้ดี เทียบเคียงกับ Qwen 2.5 และ Llama 3.1
Olmo 3-RL Zero: เส้นทางสำหรับการทดลอง reinforcement learning โดยเปิด checkpoint สำหรับโดเมนเฉพาะ เช่น math, code, และ instruction-following

ความโปร่งใสและการเข้าถึง
Olmo 3 ใช้ชุดข้อมูลใหม่ Dolma 3 (~9.3T tokens) และ Dolci สำหรับ post-training โดยเปิดให้ดาวน์โหลดทั้งหมดภายใต้ใบอนุญาตโอเพนซอร์ส พร้อมเครื่องมือเสริม เช่น OlmoTrace ที่ช่วยตรวจสอบว่าโมเดลเรียนรู้จากข้อมูลใดและอย่างไร

การเปิดเผยทั้ง pipeline และข้อมูลฝึกทำให้ Olmo 3 ไม่ใช่แค่โมเดล แต่เป็น scaffold สำหรับการสร้างระบบ AI ใหม่ ที่ทุกคนสามารถ fork, remix หรือปรับแต่งได้ตามความต้องการ

สรุปสาระสำคัญ
จุดเด่นของ Olmo 3
เปิดเผยทั้ง model flow ตั้งแต่ข้อมูลฝึกถึง checkpoint
รองรับ context ยาว ~65K tokens

โมเดลย่อย
Olmo 3-Base: โมเดลฐานที่แข็งแกร่งที่สุดในโอเพนซอร์ส
Olmo 3-Think: reasoning model ที่ตรวจสอบ trace ได้
Olmo 3-Instruct: เน้นสนทนาและการใช้เครื่องมือ
Olmo 3-RL Zero: สำหรับการทดลอง reinforcement learning

ความโปร่งใส
เปิดข้อมูล Dolma 3 และ Dolci ให้ดาวน์โหลด
มี OlmoTrace สำหรับตรวจสอบการเรียนรู้

คำเตือน
แม้เปิดกว้าง แต่การใช้งาน reasoning model ต้องใช้ทรัพยากรสูง (เช่น GPU cluster)
การปรับแต่งต้องอาศัยความเข้าใจเชิงลึกใน pipeline และ data mix
ยังมีความเสี่ยงด้านบั๊กหรือการตีความผิดพลาดจาก reasoning trace ที่ต้องตรวจสอบเอง

https://allenai.org/blog/olmo3
🤖 Olmo 3 – เปิดทางใหม่ให้ AI แบบโอเพนซอร์ส AI2 เปิดตัว Olmo 3 ซึ่งเป็นตระกูลโมเดลภาษาโอเพนซอร์สที่มีทั้งรุ่น 7B และ 32B parameters จุดเด่นคือไม่ใช่แค่ปล่อยโมเดลสำเร็จ แต่ยังเปิดเผย model flow หรือเส้นทางการพัฒนาทั้งหมด ตั้งแต่ข้อมูลฝึก, pipeline, ไปจนถึง checkpoint แต่ละช่วง เพื่อให้ผู้ใช้สามารถเข้าใจและปรับแต่งได้อย่างเต็มที่ ที่สำคัญ Olmo 3 มาพร้อม Olmo 3-Think (32B) ซึ่งเป็น reasoning model ที่สามารถตรวจสอบ intermediate reasoning traces และเชื่อมโยงพฤติกรรมกลับไปยังข้อมูลฝึกและการตัดสินใจที่ใช้ในการเทรน ถือเป็นครั้งแรกที่โมเดลโอเพนซอร์สเปิดให้ตรวจสอบการคิดแบบละเอียดเช่นนี้ 📊 สมรรถนะและการเปรียบเทียบ 🎗️ Olmo 3-Base (7B, 32B): โมเดลฐานที่แข็งแกร่งที่สุดในกลุ่มโอเพนซอร์ส สามารถแก้โจทย์โปรแกรมมิ่ง, การอ่านจับใจความ, และคณิตศาสตร์ได้ดีเยี่ยม พร้อมรองรับ context ยาวถึง ~65K tokens 🎗️ Olmo 3-Think: โมเดล reasoning ที่แข่งขันได้กับ Qwen 3 และ Gemma 3 โดยใช้ข้อมูลฝึกน้อยกว่า แต่ยังคงทำคะแนนสูงใน benchmark อย่าง MATH, BigBenchHard และ HumanEvalPlus 🎗️ Olmo 3-Instruct (7B): โมเดลสำหรับการสนทนาและการทำงานแบบ multi-turn ที่สามารถทำงาน instruction-following และ function calling ได้ดี เทียบเคียงกับ Qwen 2.5 และ Llama 3.1 🎗️ Olmo 3-RL Zero: เส้นทางสำหรับการทดลอง reinforcement learning โดยเปิด checkpoint สำหรับโดเมนเฉพาะ เช่น math, code, และ instruction-following 🔍 ความโปร่งใสและการเข้าถึง Olmo 3 ใช้ชุดข้อมูลใหม่ Dolma 3 (~9.3T tokens) และ Dolci สำหรับ post-training โดยเปิดให้ดาวน์โหลดทั้งหมดภายใต้ใบอนุญาตโอเพนซอร์ส พร้อมเครื่องมือเสริม เช่น OlmoTrace ที่ช่วยตรวจสอบว่าโมเดลเรียนรู้จากข้อมูลใดและอย่างไร การเปิดเผยทั้ง pipeline และข้อมูลฝึกทำให้ Olmo 3 ไม่ใช่แค่โมเดล แต่เป็น scaffold สำหรับการสร้างระบบ AI ใหม่ ที่ทุกคนสามารถ fork, remix หรือปรับแต่งได้ตามความต้องการ 📌 สรุปสาระสำคัญ ✅ จุดเด่นของ Olmo 3 ➡️ เปิดเผยทั้ง model flow ตั้งแต่ข้อมูลฝึกถึง checkpoint ➡️ รองรับ context ยาว ~65K tokens ✅ โมเดลย่อย ➡️ Olmo 3-Base: โมเดลฐานที่แข็งแกร่งที่สุดในโอเพนซอร์ส ➡️ Olmo 3-Think: reasoning model ที่ตรวจสอบ trace ได้ ➡️ Olmo 3-Instruct: เน้นสนทนาและการใช้เครื่องมือ ➡️ Olmo 3-RL Zero: สำหรับการทดลอง reinforcement learning ✅ ความโปร่งใส ➡️ เปิดข้อมูล Dolma 3 และ Dolci ให้ดาวน์โหลด ➡️ มี OlmoTrace สำหรับตรวจสอบการเรียนรู้ ‼️ คำเตือน ⛔ แม้เปิดกว้าง แต่การใช้งาน reasoning model ต้องใช้ทรัพยากรสูง (เช่น GPU cluster) ⛔ การปรับแต่งต้องอาศัยความเข้าใจเชิงลึกใน pipeline และ data mix ⛔ ยังมีความเสี่ยงด้านบั๊กหรือการตีความผิดพลาดจาก reasoning trace ที่ต้องตรวจสอบเอง https://allenai.org/blog/olmo3
ALLENAI.ORG
Olmo 3: Charting a path through the model flow to lead open-source AI | Ai2
Our new flagship Olmo 3 model family empowers the open source community with not only state-of-the-art open models, but the entire model flow and full traceability back to training data.
0 Comments 0 Shares 24 Views 0 Reviews