“IBM เปิดตัว Granite 4.0 — โมเดล AI ไฮบริดที่เล็กแต่แรง ท้าชนคู่แข่งที่ใหญ่กว่าถึง 12 เท่า”
IBM เดินหน้าสร้างจุดยืนในโลก AI ด้วยการเปิดตัว Granite 4.0 โมเดลภาษาแบบโอเพ่นซอร์สที่ออกแบบมาเพื่อองค์กรโดยเฉพาะ จุดเด่นของ Granite 4.0 คือสถาปัตยกรรมแบบ “ไฮบริด” ที่ผสมผสานระหว่าง Mamba-2 และ Transformer ในอัตราส่วน 90:10 เพื่อให้ได้ทั้งความเร็วและความแม่นยำ โดยลดการใช้ RAM ได้มากกว่า 70% เมื่อเทียบกับโมเดลทั่วไป
Mamba-2 เป็นโมเดลแบบ state-space ที่ประมวลผลข้อมูลแบบเชิงเส้น ทำให้เหมาะกับงานที่มีบริบทยาว เช่น เอกสารหรือโค้ดขนาดใหญ่ ขณะที่ Transformer ยังคงทำหน้าที่ในส่วนที่ต้องการความละเอียดของบริบท เช่น การตอบคำถามหรือการสื่อสารแบบละเอียด
Granite 4.0 เปิดตัวพร้อมกันหลายขนาด ได้แก่ Micro, Tiny และ Small โดยรุ่น Small เหมาะกับงานระดับองค์กร เช่น ระบบตอบกลับอัตโนมัติหรือ multi-agent workflows ส่วนรุ่น Micro และ Tiny เหมาะกับงานที่ต้องการความเร็ว เช่น edge computing และแอปพลิเคชันที่มี latency ต่ำ
ผลการทดสอบบน IFEval พบว่า Granite 4.0-H-Small ได้คะแนน 0.89 ซึ่งสูงกว่าทุกโมเดลโอเพ่นเวต ยกเว้น Llama 4 Maverick ที่มีขนาดใหญ่กว่าถึง 12 เท่า IBM ยังร่วมมือกับ EY และ Lockheed Martin ในการทดสอบใช้งานจริง เพื่อปรับปรุงโมเดลให้เหมาะกับงานระดับองค์กร
โมเดลทั้งหมดเปิดให้ใช้งานผ่านหลายแพลตฟอร์ม เช่น watsonx.ai, Hugging Face, Docker Hub, NVIDIA NIM, Replicate และ Dell Technologies โดยมีแผนจะขยายไปยัง Amazon SageMaker และ Microsoft Azure ในอนาคต
ข้อมูลสำคัญจากข่าว
IBM เปิดตัว Granite 4.0 โมเดลภาษาแบบโอเพ่นซอร์สภายใต้ Apache 2.0 License
ใช้สถาปัตยกรรมไฮบริดระหว่าง Mamba-2 และ Transformer ในอัตราส่วน 90:10
ลดการใช้ RAM ได้มากกว่า 70% เมื่อเทียบกับโมเดลทั่วไป
Granite 4.0-H-Small ได้คะแนน 0.89 บน IFEval สูงกว่าทุกโมเดลโอเพ่นเวต ยกเว้น Llama 4 Maverick
เปิดตัวหลายขนาด ได้แก่ Micro, Tiny และ Small พร้อมรุ่น Instruct
รุ่น Small เหมาะกับงานระดับองค์กร เช่น multi-tool agents และ customer support
รุ่น Micro และ Tiny เหมาะกับ edge devices และงานที่ต้องการ latency ต่ำ
เปิดให้ใช้งานผ่าน watsonx.ai, Hugging Face, Docker Hub, NVIDIA NIM ฯลฯ
IBM ร่วมมือกับ EY และ Lockheed Martin ในการทดสอบใช้งานจริง
ข้อมูลเสริมจากภายนอก
Mamba-2 เป็นโมเดลแบบ state-space ที่ใช้หน่วยความจำคงที่ ไม่เพิ่มตามความยาวบริบท
Transformer มีจุดแข็งด้าน self-attention แต่ใช้ RAM สูงเมื่อบริบทยาว
การผสม Mamba กับ Transformer ช่วยลดต้นทุนฮาร์ดแวร์และเพิ่มความเร็วในการ inference
Granite 4.0 ได้รับการรับรอง ISO 42001 และมีการเซ็นดิจิทัลเพื่อความโปร่งใส
โมเดลถูกฝึกด้วยข้อมูลกว่า 22 ล้านล้าน token และรองรับ sequence ยาวถึง 512K token
https://news.itsfoss.com/ibm-unveils-granite-4/ 🧠 “IBM เปิดตัว Granite 4.0 — โมเดล AI ไฮบริดที่เล็กแต่แรง ท้าชนคู่แข่งที่ใหญ่กว่าถึง 12 เท่า”
IBM เดินหน้าสร้างจุดยืนในโลก AI ด้วยการเปิดตัว Granite 4.0 โมเดลภาษาแบบโอเพ่นซอร์สที่ออกแบบมาเพื่อองค์กรโดยเฉพาะ จุดเด่นของ Granite 4.0 คือสถาปัตยกรรมแบบ “ไฮบริด” ที่ผสมผสานระหว่าง Mamba-2 และ Transformer ในอัตราส่วน 90:10 เพื่อให้ได้ทั้งความเร็วและความแม่นยำ โดยลดการใช้ RAM ได้มากกว่า 70% เมื่อเทียบกับโมเดลทั่วไป
Mamba-2 เป็นโมเดลแบบ state-space ที่ประมวลผลข้อมูลแบบเชิงเส้น ทำให้เหมาะกับงานที่มีบริบทยาว เช่น เอกสารหรือโค้ดขนาดใหญ่ ขณะที่ Transformer ยังคงทำหน้าที่ในส่วนที่ต้องการความละเอียดของบริบท เช่น การตอบคำถามหรือการสื่อสารแบบละเอียด
Granite 4.0 เปิดตัวพร้อมกันหลายขนาด ได้แก่ Micro, Tiny และ Small โดยรุ่น Small เหมาะกับงานระดับองค์กร เช่น ระบบตอบกลับอัตโนมัติหรือ multi-agent workflows ส่วนรุ่น Micro และ Tiny เหมาะกับงานที่ต้องการความเร็ว เช่น edge computing และแอปพลิเคชันที่มี latency ต่ำ
ผลการทดสอบบน IFEval พบว่า Granite 4.0-H-Small ได้คะแนน 0.89 ซึ่งสูงกว่าทุกโมเดลโอเพ่นเวต ยกเว้น Llama 4 Maverick ที่มีขนาดใหญ่กว่าถึง 12 เท่า IBM ยังร่วมมือกับ EY และ Lockheed Martin ในการทดสอบใช้งานจริง เพื่อปรับปรุงโมเดลให้เหมาะกับงานระดับองค์กร
โมเดลทั้งหมดเปิดให้ใช้งานผ่านหลายแพลตฟอร์ม เช่น watsonx.ai, Hugging Face, Docker Hub, NVIDIA NIM, Replicate และ Dell Technologies โดยมีแผนจะขยายไปยัง Amazon SageMaker และ Microsoft Azure ในอนาคต
✅ ข้อมูลสำคัญจากข่าว
➡️ IBM เปิดตัว Granite 4.0 โมเดลภาษาแบบโอเพ่นซอร์สภายใต้ Apache 2.0 License
➡️ ใช้สถาปัตยกรรมไฮบริดระหว่าง Mamba-2 และ Transformer ในอัตราส่วน 90:10
➡️ ลดการใช้ RAM ได้มากกว่า 70% เมื่อเทียบกับโมเดลทั่วไป
➡️ Granite 4.0-H-Small ได้คะแนน 0.89 บน IFEval สูงกว่าทุกโมเดลโอเพ่นเวต ยกเว้น Llama 4 Maverick
➡️ เปิดตัวหลายขนาด ได้แก่ Micro, Tiny และ Small พร้อมรุ่น Instruct
➡️ รุ่น Small เหมาะกับงานระดับองค์กร เช่น multi-tool agents และ customer support
➡️ รุ่น Micro และ Tiny เหมาะกับ edge devices และงานที่ต้องการ latency ต่ำ
➡️ เปิดให้ใช้งานผ่าน watsonx.ai, Hugging Face, Docker Hub, NVIDIA NIM ฯลฯ
➡️ IBM ร่วมมือกับ EY และ Lockheed Martin ในการทดสอบใช้งานจริง
✅ ข้อมูลเสริมจากภายนอก
➡️ Mamba-2 เป็นโมเดลแบบ state-space ที่ใช้หน่วยความจำคงที่ ไม่เพิ่มตามความยาวบริบท
➡️ Transformer มีจุดแข็งด้าน self-attention แต่ใช้ RAM สูงเมื่อบริบทยาว
➡️ การผสม Mamba กับ Transformer ช่วยลดต้นทุนฮาร์ดแวร์และเพิ่มความเร็วในการ inference
➡️ Granite 4.0 ได้รับการรับรอง ISO 42001 และมีการเซ็นดิจิทัลเพื่อความโปร่งใส
➡️ โมเดลถูกฝึกด้วยข้อมูลกว่า 22 ล้านล้าน token และรองรับ sequence ยาวถึง 512K token
https://news.itsfoss.com/ibm-unveils-granite-4/