มีความพยายามของกลุ่มนักวิจัยที่สร้างโมเดล AI ซึ่งมีความสามารถในการให้เหตุผลที่มีประสิทธิภาพ คล้ายกับโมเดลของ OpenAI ชื่อ o1 แต่ใช้งบประมาณต่ำกว่า 50 ดอลลาร์สหรัฐ นักวิจัยจาก Stanford และมหาวิทยาลัย Washington ได้พัฒนาโมเดลชื่อ "s1" โดยใช้เทคนิคการปรับแต่งแบบพิเศษ
แทนที่จะฝึกโมเดลใหม่ตั้งแต่ต้นซึ่งมีค่าใช้จ่ายสูง พวกเขาใช้โมเดลภาษาที่มีอยู่แล้วและทำการปรับแต่งโดยใช้วิธีการกลั่นแบบมีการสอน เทคนิคนี้ช่วยให้โมเดล s1 สามารถสร้างผลลัพธ์ที่คล้ายกับโมเดลของ Google ที่มีชื่อว่า Gemini 2.0 Flash Thinking Experimental โดยการฝึกโมเดล s1 นี้ใช้เวลาเพียง 30 นาทีและใช้ GPU จำนวน 16 ตัว การเช่า GPU นี้มีค่าใช้จ่ายรวมต่ำกว่า 50 ดอลลาร์สหรัฐ
นอกจากนี้ นักวิจัยยังค้นพบวิธีการเพิ่มประสิทธิภาพของ s1 โดยให้โมเดลรอเล็กน้อยก่อนที่จะให้คำตอบสุดท้าย ทำให้มีเวลามากขึ้นในการตรวจสอบและปรับปรุงคำตอบ อย่างไรก็ตาม การใช้โมเดลของ Google เป็นครูสอนอาจทำให้เกิดข้อสงสัยในความสามารถในการขยายผลของโมเดล s1 และอาจเกิดปัญหาด้านลิขสิทธิ์
https://www.techspot.com/news/106676-researchers-create-reasoning-model-under-50-performs-similar.html
แทนที่จะฝึกโมเดลใหม่ตั้งแต่ต้นซึ่งมีค่าใช้จ่ายสูง พวกเขาใช้โมเดลภาษาที่มีอยู่แล้วและทำการปรับแต่งโดยใช้วิธีการกลั่นแบบมีการสอน เทคนิคนี้ช่วยให้โมเดล s1 สามารถสร้างผลลัพธ์ที่คล้ายกับโมเดลของ Google ที่มีชื่อว่า Gemini 2.0 Flash Thinking Experimental โดยการฝึกโมเดล s1 นี้ใช้เวลาเพียง 30 นาทีและใช้ GPU จำนวน 16 ตัว การเช่า GPU นี้มีค่าใช้จ่ายรวมต่ำกว่า 50 ดอลลาร์สหรัฐ
นอกจากนี้ นักวิจัยยังค้นพบวิธีการเพิ่มประสิทธิภาพของ s1 โดยให้โมเดลรอเล็กน้อยก่อนที่จะให้คำตอบสุดท้าย ทำให้มีเวลามากขึ้นในการตรวจสอบและปรับปรุงคำตอบ อย่างไรก็ตาม การใช้โมเดลของ Google เป็นครูสอนอาจทำให้เกิดข้อสงสัยในความสามารถในการขยายผลของโมเดล s1 และอาจเกิดปัญหาด้านลิขสิทธิ์
https://www.techspot.com/news/106676-researchers-create-reasoning-model-under-50-performs-similar.html
มีความพยายามของกลุ่มนักวิจัยที่สร้างโมเดล AI ซึ่งมีความสามารถในการให้เหตุผลที่มีประสิทธิภาพ คล้ายกับโมเดลของ OpenAI ชื่อ o1 แต่ใช้งบประมาณต่ำกว่า 50 ดอลลาร์สหรัฐ นักวิจัยจาก Stanford และมหาวิทยาลัย Washington ได้พัฒนาโมเดลชื่อ "s1" โดยใช้เทคนิคการปรับแต่งแบบพิเศษ
แทนที่จะฝึกโมเดลใหม่ตั้งแต่ต้นซึ่งมีค่าใช้จ่ายสูง พวกเขาใช้โมเดลภาษาที่มีอยู่แล้วและทำการปรับแต่งโดยใช้วิธีการกลั่นแบบมีการสอน เทคนิคนี้ช่วยให้โมเดล s1 สามารถสร้างผลลัพธ์ที่คล้ายกับโมเดลของ Google ที่มีชื่อว่า Gemini 2.0 Flash Thinking Experimental โดยการฝึกโมเดล s1 นี้ใช้เวลาเพียง 30 นาทีและใช้ GPU จำนวน 16 ตัว การเช่า GPU นี้มีค่าใช้จ่ายรวมต่ำกว่า 50 ดอลลาร์สหรัฐ
นอกจากนี้ นักวิจัยยังค้นพบวิธีการเพิ่มประสิทธิภาพของ s1 โดยให้โมเดลรอเล็กน้อยก่อนที่จะให้คำตอบสุดท้าย ทำให้มีเวลามากขึ้นในการตรวจสอบและปรับปรุงคำตอบ อย่างไรก็ตาม การใช้โมเดลของ Google เป็นครูสอนอาจทำให้เกิดข้อสงสัยในความสามารถในการขยายผลของโมเดล s1 และอาจเกิดปัญหาด้านลิขสิทธิ์
https://www.techspot.com/news/106676-researchers-create-reasoning-model-under-50-performs-similar.html
0 Comments
0 Shares
299 Views
0 Reviews