เรื่องเล่าจาก Google ในหอพักถึง Searcha Page ข้างเครื่องซักผ้า
ย้อนกลับไปเมื่อปี 1998 Google เริ่มต้นจากเซิร์ฟเวอร์ที่ประกอบด้วย Duplo blocks ในหอพักมหาวิทยาลัย Stanford และมีฐานข้อมูลเพียง 24 ล้านหน้าเว็บ วันนี้ Google มีดัชนีมากกว่า 400 พันล้านรายการ และต้องใช้ศูนย์ข้อมูลขนาดมหึมาเพื่อรองรับการค้นหาทั่วโลก
แต่ Ryan Pearce นักพัฒนาที่เคยทำงานด้าน enterprise software และเกม กลับเลือกเส้นทางที่ต่างออกไป—เขาสร้าง Searcha Page และ Seek Ninja ซึ่งเป็น search engine แบบ self-hosted ที่ตั้งอยู่ในห้องซักผ้าของบ้านตัวเอง โดยใช้เซิร์ฟเวอร์เก่าที่ประกอบจากชิ้นส่วนมือสอง และ CPU AMD EPYC 7532 รุ่นปี 2020 ที่ตอนนี้หาซื้อได้ในราคาต่ำกว่า $200
ระบบของเขาไม่ใช้ cloud และไม่พึ่ง AI แบบสรุปผลลัพธ์ แต่ใช้ machine learning เพื่อขยายคำค้นหาและเข้าใจบริบทของผู้ใช้ ทำให้สามารถให้ผลลัพธ์ที่แม่นยำโดยใช้ทรัพยากรเพียงเศษเสี้ยวของ Google
แม้จะเริ่มจากเซิร์ฟเวอร์สองตัวที่วางบนเก้าอี้ในห้องซักผ้า และต้องเจาะผนังเพื่อเดินสาย LAN แต่ Pearce ก็สามารถสร้างฐานข้อมูลกว่า 2 พันล้านรายการ และตั้งเป้าจะเพิ่มเป็น 4 พันล้านภายใน 6 เดือน โดยเขาเขียนโค้ดไปแล้วกว่า 150,000 บรรทัด และปรับแต่งมากกว่า 500,000 บรรทัดเพื่อให้ระบบทำงานได้โดยไม่ต้องพึ่ง LLM
การสร้าง Searcha Page และ Seek Ninja
เป็น search engine แบบ self-hosted ที่ตั้งอยู่ในห้องซักผ้า
ใช้เซิร์ฟเวอร์เก่าพร้อม CPU AMD EPYC 7532 จำนวน 32 คอร์
มีฐานข้อมูลกว่า 2 พันล้านรายการ และตั้งเป้าเพิ่มเป็น 4 พันล้าน
แนวทางการใช้ AI
ไม่ใช้ LLM หรือ AI ที่สรุปผลลัพธ์
ใช้ machine learning เพื่อขยายคำค้นหาและเข้าใจบริบท
ลดการพึ่งพาโมเดลใหญ่เพื่อให้ระบบเบาและควบคุมได้
การออกแบบระบบและการตั้งค่า
เซิร์ฟเวอร์วางบนเก้าอี้ในห้องซักผ้า พร้อมเจาะผนังเดินสาย LAN
มีระบบระบายความร้อนแบบ DIY ด้วยท่ออากาศ
เคยวางในห้องนอนแต่ร้อนเกินไปจนต้องย้าย
ความสามารถของระบบ
ให้ผลลัพธ์ที่แม่นยำแม้ใช้ทรัพยากรน้อย
มีความเร็วในการค้นหาที่ดีขึ้นในช่วงหลัง
รองรับการใช้งานจริงผ่านเว็บไซต์ Searcha Page และ Seek Ninja
แผนในอนาคต
อาจย้ายระบบไปยังศูนย์ข้อมูลขนาดเล็กใกล้บ้าน
ไม่ต้องการใช้ cloud และต้องการควบคุมระบบเอง
ใช้รายได้จาก affiliate ads เพื่อสนับสนุนการพัฒนา
https://www.tomshardware.com/software/search-engines/ai-driven-search-engine-running-inside-a-laundry-room-aims-to-rival-google-and-you-can-try-it-yourself-programmer-harnesses-old-server-parts-and-ai-to-deliver-quality-results
ย้อนกลับไปเมื่อปี 1998 Google เริ่มต้นจากเซิร์ฟเวอร์ที่ประกอบด้วย Duplo blocks ในหอพักมหาวิทยาลัย Stanford และมีฐานข้อมูลเพียง 24 ล้านหน้าเว็บ วันนี้ Google มีดัชนีมากกว่า 400 พันล้านรายการ และต้องใช้ศูนย์ข้อมูลขนาดมหึมาเพื่อรองรับการค้นหาทั่วโลก
แต่ Ryan Pearce นักพัฒนาที่เคยทำงานด้าน enterprise software และเกม กลับเลือกเส้นทางที่ต่างออกไป—เขาสร้าง Searcha Page และ Seek Ninja ซึ่งเป็น search engine แบบ self-hosted ที่ตั้งอยู่ในห้องซักผ้าของบ้านตัวเอง โดยใช้เซิร์ฟเวอร์เก่าที่ประกอบจากชิ้นส่วนมือสอง และ CPU AMD EPYC 7532 รุ่นปี 2020 ที่ตอนนี้หาซื้อได้ในราคาต่ำกว่า $200
ระบบของเขาไม่ใช้ cloud และไม่พึ่ง AI แบบสรุปผลลัพธ์ แต่ใช้ machine learning เพื่อขยายคำค้นหาและเข้าใจบริบทของผู้ใช้ ทำให้สามารถให้ผลลัพธ์ที่แม่นยำโดยใช้ทรัพยากรเพียงเศษเสี้ยวของ Google
แม้จะเริ่มจากเซิร์ฟเวอร์สองตัวที่วางบนเก้าอี้ในห้องซักผ้า และต้องเจาะผนังเพื่อเดินสาย LAN แต่ Pearce ก็สามารถสร้างฐานข้อมูลกว่า 2 พันล้านรายการ และตั้งเป้าจะเพิ่มเป็น 4 พันล้านภายใน 6 เดือน โดยเขาเขียนโค้ดไปแล้วกว่า 150,000 บรรทัด และปรับแต่งมากกว่า 500,000 บรรทัดเพื่อให้ระบบทำงานได้โดยไม่ต้องพึ่ง LLM
การสร้าง Searcha Page และ Seek Ninja
เป็น search engine แบบ self-hosted ที่ตั้งอยู่ในห้องซักผ้า
ใช้เซิร์ฟเวอร์เก่าพร้อม CPU AMD EPYC 7532 จำนวน 32 คอร์
มีฐานข้อมูลกว่า 2 พันล้านรายการ และตั้งเป้าเพิ่มเป็น 4 พันล้าน
แนวทางการใช้ AI
ไม่ใช้ LLM หรือ AI ที่สรุปผลลัพธ์
ใช้ machine learning เพื่อขยายคำค้นหาและเข้าใจบริบท
ลดการพึ่งพาโมเดลใหญ่เพื่อให้ระบบเบาและควบคุมได้
การออกแบบระบบและการตั้งค่า
เซิร์ฟเวอร์วางบนเก้าอี้ในห้องซักผ้า พร้อมเจาะผนังเดินสาย LAN
มีระบบระบายความร้อนแบบ DIY ด้วยท่ออากาศ
เคยวางในห้องนอนแต่ร้อนเกินไปจนต้องย้าย
ความสามารถของระบบ
ให้ผลลัพธ์ที่แม่นยำแม้ใช้ทรัพยากรน้อย
มีความเร็วในการค้นหาที่ดีขึ้นในช่วงหลัง
รองรับการใช้งานจริงผ่านเว็บไซต์ Searcha Page และ Seek Ninja
แผนในอนาคต
อาจย้ายระบบไปยังศูนย์ข้อมูลขนาดเล็กใกล้บ้าน
ไม่ต้องการใช้ cloud และต้องการควบคุมระบบเอง
ใช้รายได้จาก affiliate ads เพื่อสนับสนุนการพัฒนา
https://www.tomshardware.com/software/search-engines/ai-driven-search-engine-running-inside-a-laundry-room-aims-to-rival-google-and-you-can-try-it-yourself-programmer-harnesses-old-server-parts-and-ai-to-deliver-quality-results
🎙️ เรื่องเล่าจาก Google ในหอพักถึง Searcha Page ข้างเครื่องซักผ้า
ย้อนกลับไปเมื่อปี 1998 Google เริ่มต้นจากเซิร์ฟเวอร์ที่ประกอบด้วย Duplo blocks ในหอพักมหาวิทยาลัย Stanford และมีฐานข้อมูลเพียง 24 ล้านหน้าเว็บ วันนี้ Google มีดัชนีมากกว่า 400 พันล้านรายการ และต้องใช้ศูนย์ข้อมูลขนาดมหึมาเพื่อรองรับการค้นหาทั่วโลก
แต่ Ryan Pearce นักพัฒนาที่เคยทำงานด้าน enterprise software และเกม กลับเลือกเส้นทางที่ต่างออกไป—เขาสร้าง Searcha Page และ Seek Ninja ซึ่งเป็น search engine แบบ self-hosted ที่ตั้งอยู่ในห้องซักผ้าของบ้านตัวเอง โดยใช้เซิร์ฟเวอร์เก่าที่ประกอบจากชิ้นส่วนมือสอง และ CPU AMD EPYC 7532 รุ่นปี 2020 ที่ตอนนี้หาซื้อได้ในราคาต่ำกว่า $200
ระบบของเขาไม่ใช้ cloud และไม่พึ่ง AI แบบสรุปผลลัพธ์ แต่ใช้ machine learning เพื่อขยายคำค้นหาและเข้าใจบริบทของผู้ใช้ ทำให้สามารถให้ผลลัพธ์ที่แม่นยำโดยใช้ทรัพยากรเพียงเศษเสี้ยวของ Google
แม้จะเริ่มจากเซิร์ฟเวอร์สองตัวที่วางบนเก้าอี้ในห้องซักผ้า และต้องเจาะผนังเพื่อเดินสาย LAN แต่ Pearce ก็สามารถสร้างฐานข้อมูลกว่า 2 พันล้านรายการ และตั้งเป้าจะเพิ่มเป็น 4 พันล้านภายใน 6 เดือน โดยเขาเขียนโค้ดไปแล้วกว่า 150,000 บรรทัด และปรับแต่งมากกว่า 500,000 บรรทัดเพื่อให้ระบบทำงานได้โดยไม่ต้องพึ่ง LLM
✅ การสร้าง Searcha Page และ Seek Ninja
➡️ เป็น search engine แบบ self-hosted ที่ตั้งอยู่ในห้องซักผ้า
➡️ ใช้เซิร์ฟเวอร์เก่าพร้อม CPU AMD EPYC 7532 จำนวน 32 คอร์
➡️ มีฐานข้อมูลกว่า 2 พันล้านรายการ และตั้งเป้าเพิ่มเป็น 4 พันล้าน
✅ แนวทางการใช้ AI
➡️ ไม่ใช้ LLM หรือ AI ที่สรุปผลลัพธ์
➡️ ใช้ machine learning เพื่อขยายคำค้นหาและเข้าใจบริบท
➡️ ลดการพึ่งพาโมเดลใหญ่เพื่อให้ระบบเบาและควบคุมได้
✅ การออกแบบระบบและการตั้งค่า
➡️ เซิร์ฟเวอร์วางบนเก้าอี้ในห้องซักผ้า พร้อมเจาะผนังเดินสาย LAN
➡️ มีระบบระบายความร้อนแบบ DIY ด้วยท่ออากาศ
➡️ เคยวางในห้องนอนแต่ร้อนเกินไปจนต้องย้าย
✅ ความสามารถของระบบ
➡️ ให้ผลลัพธ์ที่แม่นยำแม้ใช้ทรัพยากรน้อย
➡️ มีความเร็วในการค้นหาที่ดีขึ้นในช่วงหลัง
➡️ รองรับการใช้งานจริงผ่านเว็บไซต์ Searcha Page และ Seek Ninja
✅ แผนในอนาคต
➡️ อาจย้ายระบบไปยังศูนย์ข้อมูลขนาดเล็กใกล้บ้าน
➡️ ไม่ต้องการใช้ cloud และต้องการควบคุมระบบเอง
➡️ ใช้รายได้จาก affiliate ads เพื่อสนับสนุนการพัฒนา
https://www.tomshardware.com/software/search-engines/ai-driven-search-engine-running-inside-a-laundry-room-aims-to-rival-google-and-you-can-try-it-yourself-programmer-harnesses-old-server-parts-and-ai-to-deliver-quality-results
0 Comments
0 Shares
8 Views
0 Reviews