ผลทดสอบสมรถนะ Meaka Cluster
ผลทดสอบ GPU Cluster ในเบื้องต้นพอจะสรุปได้ดังนี้
- เครื่องของเราเป็น 2xQuadCore Xeon และ 2 Tesla M2050.
- มีแรมท้งหมด 16GB, ได้ขนาดของปัญหาสำหรับรัน(NB) ประมาณ 40000
ขนาดบล้อกของปัญหามีค่าดีที่สุดที่ 2048 (max value), ค่า DGEM (อัตรา่ส่วนโหลดงานระหว่าง CPU กับ GPU) อยู่ที่ 0.9
- performance สูงสุดของการรันใน GPU เดี่ยวอยู่ที่ 265.8 Gflops (44.9% of Rpeak)
- performance สูงสุดของการรันใน GPU สองตัวอยู่ที่ 307.4 Gflops (27.8% of Rpeak)
- performance ของการรันแบบ cluster บน 8 nodes อยู่ที่ 531 Gflops (6% of Rpeak)

ตารางแสดงความเร็วการประมวลผลในหน่วย GFlops บบ GPU เดี่ยวและบน GPU ระดับคลัสเตอร์

กราฟแสดงความเร็วการประมวลผลในหน่วย GFlops ตามขนาดของปัญหาและจำนวนเครื่อง
ในเบื้องต้นคิดว่า Performance ถูกจำกัดที่ขนาดของ RAM จากกราฟผลทดสอบจะเห็นได้ว่า scale up ของ performance เมื่อเพิ่มขนาดของปัญหายังไม่ถึงจุดอิ่มตัว
ส่วนอีกเรื่องคือ Performance ของการรันหลายๆ เครื่องที่ตกลงไปมาก จาก 1->2 เครื่องก็ตกลงไปมากแล้ว
ตรงนี้คิดว่าเป็นที่ network ที่เป็น Gigabit Ethernet
ผู้สนใจสามารถดาวน์โหลดผลทดสอบฉบับเต็มได้ตาม[ไฟล์แนบ]นี้ครับ
