
บุคคลที่คุ้นเคยในแวดวงความปลอดภัยทางไซเบอร์ได้กลับมาปรากฏตัวอีกครั้ง แต่คราวนี้ผ่านทางช่องโหว่สำคัญอย่างการ์ดจอ ช่องโหว่ดังกล่าว Rowhammer ซึ่งก่อนหน้านี้มักเกี่ยวข้องกับ RAM ของ CPU เป็นหลักนอกจากนี้ยังพิสูจน์แล้วว่ามีประสิทธิภาพต่อหน่วยความจำ GDDR6 ที่ใช้ใน GPU ต่างๆ ของ NVIDIA ซึ่งเปิดช่องทางให้เกิดการโจมตีที่อาจส่งผลให้สามารถควบคุมระบบได้อย่างสมบูรณ์
ทีมวิจัยหลายทีมได้นำเสนอผลงานพร้อมๆ กัน ห่วงโซ่การโจมตีที่สมบูรณ์แบบต่อ GPU ของ NVIDIA ที่ใช้ GDDR6ด้วยชื่อต่างๆ เช่น GDDRHammer, GeForge หรือ GPUBreach นอกเหนือจากรายละเอียดทางเทคนิคแล้ว ข้อความสำหรับผู้ใช้ ธุรกิจ และสภาพแวดล้อมคลาวด์ในยุโรปนั้นชัดเจน: การ์ดกราฟิกบางประเภทที่ใช้กันอย่างแพร่หลายในพีซีที่บ้าน เวิร์กสเตชัน และเซิร์ฟเวอร์ สามารถเป็นช่องทางที่ทำให้ผู้โจมตีสามารถเข้าถึงสิทธิ์ผู้ดูแลระบบบนระบบปฏิบัติการได้
Rowhammer คืออะไร และทำไมตอนนี้จึงมุ่งเป้าไปที่ GPU ที่ใช้ GDDR6?
Rowhammer เป็นช่องโหว่ทางกายภาพที่ใช้ประโยชน์จากจุดอ่อนนี้ วิธีการผลิตและบรรจุเซลล์หน่วยความจำ DRAMหากมีการเข้าถึงแถวหน่วยความจำบางแถวอย่างรวดเร็วและซ้ำๆ ("การกระแทก") จะทำให้เกิดการรบกวนทางไฟฟ้า ซึ่งอาจทำให้บิตในแถวที่อยู่ติดกันเปลี่ยนแปลงไป หรือที่เรารู้จักกันดีในชื่อการพลิกบิต: 0 กลายเป็น 1 หรือในทางกลับกัน โดยที่ซอฟต์แวร์ไม่ได้สั่งการไว้
ผลงานทางวิชาการชิ้นแรกๆ ย้อนกลับไปในยุคสมัยนั้น หน่วยความจำ DDR3 และ DDR4 รุ่นต่อมาพวกเขาได้แสดงให้เห็นว่าเทคนิคนี้สามารถใช้เพื่อทำลายการแยกกระบวนการทำงาน เปลี่ยนแปลงข้อมูลที่ละเอียดอ่อน และยกระดับสิทธิ์จากผู้ใช้ที่ไม่มีใบอนุญาตไปเป็นผู้ดูแลระบบได้ เป็นเวลาหลายปีที่คิดว่ามาตรการบรรเทาผลกระทบและการพัฒนาฮาร์ดแวร์ได้ควบคุมปัญหาไว้ได้แล้ว แต่ความเป็นจริงคือ พื้นที่การโจมตีได้ขยายวงกว้างขึ้น
ผลการวิจัยล่าสุดแสดงให้เห็นว่า หน่วยความจำ GDDR6 ในการ์ดจอสมัยใหม่นั้นไม่ปลอดภัยแทนที่จะโจมตี RAM หลักที่เชื่อมต่อกับ CPU ทีมต่างๆ ได้มุ่งเน้นความพยายามไปที่หน่วยความจำเฉพาะของการ์ดกราฟิก โดยใช้รูปแบบการเข้าถึงที่รุนแรงมากและเทคนิคเฉพาะเพื่อหลีกเลี่ยงการป้องกันการรีเฟรชแถวภายใน (TRR) ที่มีอยู่ในชิปเหล่านี้
สิ่งใหม่ในที่นี้ไม่ใช่แค่ว่า Rowhammer ใช้ชิป GDDR6 เท่านั้น แต่ยังรวมถึง... ผู้โจมตีสามารถพัฒนาจากการทำลายหน่วยความจำ GPU ไปสู่การจัดการหน่วยความจำ CPU ของโฮสต์โดยตรงได้โดยใช้ตรรกะการจัดการหน่วยความจำของตัวการ์ดเองและคุณสมบัติของบัส PCIe
งานวิจัยของ GDDRHammer และ GeForge: จากการพลิกบิตสู่การควบคุมระบบอย่างสมบูรณ์
กลุ่มวิจัยสองกลุ่มซึ่งทำงานอย่างอิสระในมหาวิทยาลัยต่างๆ ในสหรัฐอเมริกา ได้ตีพิมพ์ผลการศึกษาภายใต้ชื่อต่างๆ ดังนี้ GDDRHammer และ GeForce Forgeทั้งสองวิธีมีแนวคิดพื้นฐานร่วมกันคือ การทำให้เกิดการเปลี่ยนแปลงบิตในหน่วยความจำ GDDR6 ของ GPU และเปลี่ยนการเปลี่ยนแปลงทางกายภาพเหล่านั้นให้กลายเป็นการประนีประนอมระบบโดยรวม
ในการทดสอบ นักวิจัยได้วิเคราะห์อย่างน้อย การ์ดจอ NVIDIA GPU 25 รุ่น ที่ใช้หน่วยความจำ GDDR6ซึ่งรวมถึงการ์ดกราฟิกสำหรับผู้บริโภคและมืออาชีพที่ใช้สถาปัตยกรรม Ampere และ Ada Lovelace การ์ดที่พบการสลับบิตและการใช้ประโยชน์ที่ประสบความสำเร็จ ได้แก่ GeForce RTX 3060 รวมถึงซีรี่ส์ RTX 6000 และ RTX A6000 สำหรับมืออาชีพด้วย
ผลลัพธ์ที่ได้นั้นน่าทึ่งมาก: วิธีการของ GeForge สามารถเหนี่ยวนำให้เกิดผลลัพธ์ได้มากกว่า การปรับแต่งบิต 1.100 ครั้งบน RTX 3060 สำหรับผู้บริโภคทั่วไป และมากกว่า 200 เล็กน้อยบน RTX A6000 ระดับมืออาชีพ ในส่วนของ GDDRHammer นั้น ทำได้โดยเฉลี่ยเกินหนึ่งพันบิตฟลิปต่อกิกะไบต์ของหน่วยความจำ ซึ่งเป็นตัวเลขที่สูงกว่าความพยายามก่อนหน้านี้บนฮาร์ดแวร์กราฟิกมาก
เพื่อให้บรรลุเป้าหมายนี้ ทีมต่างๆ จำเป็นต้องดำเนินการดังต่อไปนี้ การหลีกเลี่ยงมาตรการบรรเทาผลกระทบของ TRR รวมอยู่ในชิปหน่วยความจำ GDDR6 รูปแบบการเข้าถึงที่ไม่สม่ำเสมอถูกนำมาใช้ในหลายแถว โดยมีการเปลี่ยนแปลงความถี่ ลำดับ และความเข้ม เพื่อให้ฮาร์ดแวร์ไม่ตรวจพบพฤติกรรมที่น่าสงสัย แต่มีการรบกวนมากพอที่จะบังคับให้เกิดการเปลี่ยนแปลงบิต
เมื่อได้แสดงให้เห็นถึงความสามารถในการกระตุ้นการพลิกบิตได้อย่างน่าเชื่อถือแล้ว ขั้นตอนต่อไปคือ โดยมุ่งเน้นการเปลี่ยนแปลงเหล่านั้นไปยังโครงสร้างหน่วยความจำที่ไวต่อการเปลี่ยนแปลงเป็นพิเศษในกรณีนี้คือตารางเพจที่จัดการโดยหน่วยความจำของ GPU
วิธีการจัดการตารางเพจ GPU เพื่อเข้าถึง RAM ของ CPU
แก่นแท้ของการโจมตีเหล่านี้อยู่ที่... ตารางเพจแบบลำดับชั้นที่ GPU ใช้ในการแปลงที่อยู่เสมือน โดยจะระบุที่อยู่ทางกายภาพ ทั้งในหน่วยความจำภายในเครื่องและในหน่วยความจำของระบบโฮสต์ โดยทั่วไป โครงสร้างเหล่านี้จะถูกจัดสรรในพื้นที่หน่วยความจำที่คาดเดาได้ยาก หรือยากต่อการเข้าถึงโดยโค้ดที่ไม่มีสิทธิ์พิเศษ
ช่องโหว่ GDDRHammer และ GeForge ใช้การเรียกฟังก์ชันหน่วยความจำมาตรฐาน (เช่น ฟังก์ชันที่ใช้ cudaMalloc และ Unified Virtual Memory) เพื่อทำการโจมตีแบบแท้จริง "การนวดเพื่อกระตุ้นความทรงจำ"การจัดสรรและการปล่อยบล็อกจะดำเนินการในลักษณะที่มีการควบคุมอย่างเข้มงวด จนกระทั่งตารางเพจบางตารางไปอยู่ในตำแหน่งทางกายภาพที่ผู้โจมตีรู้ว่ามีความเสี่ยงต่อช่องโหว่ Rowhammer
เมื่อระบุตำแหน่งของภูมิภาคเหล่านี้ได้แล้ว เป้าหมายต่อไปคือ... แก้ไขข้อมูลเฉพาะรายการในตารางหน้า โดยการเปลี่ยนบิต ด้วยการเปลี่ยนแปลงบิตเฉพาะของตัวชี้ที่อยู่ทางกายภาพ อินพุตจะหยุดชี้ไปยังตารางที่ถูกต้อง และเริ่มชี้ไปยังตารางปลอมที่ผู้โจมตีสร้างขึ้นในหน่วยความจำที่ถูกควบคุม
นับจากจุดนั้นเป็นต้นไป GPU จะเข้าใจผิดว่ากำลังใช้ตารางเพจที่ถูกต้อง แต่ในความเป็นจริงแล้วไม่ใช่เช่นนั้น การดำเนินการอ่านและเขียนทั้งหมด ผ่านเส้นทางนี้ ข้อมูลจะถูกส่งต่อไปยังตำแหน่งหน่วยความจำที่โค้ดที่เป็นอันตรายเลือกไว้ จุดสำคัญคือ ที่อยู่เหล่านี้ไม่จำเป็นต้องอยู่ในหน่วยความจำของ GPU อีกต่อไป แต่จะอยู่ใน RAM ทางกายภาพของระบบโฮสต์แทน
ในการสาธิตเชิงปฏิบัติ นักวิจัยได้บรรลุผลลัพธ์ดังต่อไปนี้ด้วยวิธีการนี้ การเข้าถึงการอ่านและการเขียนตามอำเภอใจในหน่วยความจำ CPU ทั้งหมดในสถานการณ์หนึ่งที่นำเสนอ ช่องโหว่นี้จะเขียนทับส่วนหนึ่งของโค้ดในไลบรารีระบบ (เช่น ฟังก์ชัน libc) ลงในหน่วยความจำ RAM ของโฮสต์โดยตรง ดังนั้นเมื่อโปรแกรมที่ถูกต้องตามกฎหมายซึ่งมีสิทธิ์ระดับสูงถูกเรียกใช้ โค้ดที่ถูกแทรกเข้าไปจะถูกเรียกใช้งานและสามารถเข้าถึงคอนโซลของผู้ใช้ระดับสูงสุดได้
GPUBreach: วิธีที่สามที่ผสมผสานช่องโหว่ Rowhammer และช่องโหว่ของไดรเวอร์เข้าด้วยกัน
นอกจาก GDDRHammer และ GeForge แล้ว นักวิจัยยังได้อธิบายถึงเวกเตอร์ตัวที่สามที่เรียกว่า GPUBreachนี่ถือเป็นการโจมตี Rowhammer ครั้งที่สามที่ได้รับการยืนยันแล้วต่อ GPU ในกรณีนี้ จุดสนใจไม่ได้จำกัดอยู่แค่ฟิสิกส์ของหน่วยความจำ แต่ยังขึ้นอยู่กับ... ช่องโหว่ล่าสุดในไดรเวอร์ NVIDIA.
GPUBreach พิสูจน์แล้วว่ามันเป็นไปได้ บุกรุกเคอร์เนลของระบบปฏิบัติการแม้ว่า IOMMU จะทำงานอยู่ก็ตามเรื่องนี้น่าเป็นห่วงอย่างยิ่งสำหรับเซิร์ฟเวอร์และเวิร์กสเตชันที่ได้นำมาตรการนี้มาใช้เป็นระบบป้องกันหลักแล้ว การศึกษาครั้งนี้มุ่งเน้นไปที่ NVIDIA RTX A6000 เป็นหลัก ซึ่งเป็น GPU ระดับไฮเอนด์ที่ใช้กันอย่างแพร่หลายในศูนย์ข้อมูล สภาพแวดล้อมที่ต้องการการประมวลผลสูง และโครงการปัญญาประดิษฐ์
ในสถานการณ์นี้ การโจมตียังคงเริ่มต้นด้วย ตารางเพจ GPU เสียหายจากการใช้ Rowhammerแต่จากนั้นมันก็ผสานความสามารถนั้นเข้ากับการใช้ประโยชน์จากช่องโหว่ของไดรเวอร์เพื่อยกระดับสิทธิ์ให้สูงขึ้นไปอีก ในลักษณะนี้ GPU จึงไม่ได้เป็นเพียงแค่ตัวเร่งการประมวลผลอีกต่อไป แต่กลายเป็นจุดเริ่มต้นในการเข้าควบคุมระบบโฮสต์
การรวมกันของความเปราะบางทางกายภาพ (โรว์แฮมเมอร์) และ ข้อผิดพลาดเชิงตรรกะในซอฟต์แวร์ควบคุม สิ่งนี้ทำให้ GPUBreach ตกอยู่ในสถานการณ์ที่เปราะบางเป็นพิเศษ เนื่องจากมันจำกัดประสิทธิภาพของระบบป้องกันที่ก่อนหน้านี้ถือว่ามีความแข็งแกร่งพอสมควรในสภาพแวดล้อมการทำงานระดับมืออาชีพ
รุ่นที่ได้รับผลกระทบและสถานะช่องโหว่ใน NVIDIA
งานวิจัยที่ตีพิมพ์จนถึงปัจจุบันยังไม่ได้ระบุรายชื่อรุ่นที่ได้รับผลกระทบทั้งหมด แต่ได้ยืนยันตัวอย่างเฉพาะหลายประการแล้ว เช่น: การ์ดจอ GeForce RTX 3060 สำหรับผู้บริโภค และการ์ดจอ RTX 6000 และ RTX A6000 สำหรับมืออาชีพโดยทั้งหมดใช้หน่วยความจำ GDDR6 และใช้สถาปัตยกรรม Ampere
ในการทดสอบในวงกว้าง กลุ่มวิจัยกลุ่มหนึ่งได้ตรวจสอบยืนยันแล้ว การ์ดจอระดับไฮเอนด์ 25 ตัว พร้อมหน่วยความจำ GDDR6จากการศึกษาพบว่า การ์ดจอ RTX A6000 จำนวน 16 จาก 17 รุ่นที่ทำการทดสอบ มีช่องโหว่ต่อการโจมตีแบบ Rowhammer ที่เสนอไว้ นอกจากนี้ยังได้ทำการทดสอบกับรุ่นต่างๆ ในตระกูล Ada ด้วย ซึ่งพบร่องรอยของช่องโหว่ที่คล้ายคลึงกัน แม้ว่าการทดสอบกับผลิตภัณฑ์ที่หลากหลายมากขึ้นยังคงดำเนินอยู่ก็ตาม
ในทางกลับกัน งานวิจัยชี้ให้เห็นว่า หน่วยความจำ GDDR6X และ GDDR7 ไม่ได้รับผลกระทบจากวิธีการเดียวกันอย่างน้อยก็ด้วยเทคนิคในปัจจุบัน เช่นเดียวกับหน่วยความจำอย่าง HBM2 หรือ HBM3 ที่มีกลไกแก้ไขข้อผิดพลาดในตัว (On-Die ECC) ซึ่งไม่พบรูปแบบความล้มเหลวแบบเดียวกัน
การสื่อสารของ NVIDIA ต่อสาธารณะค่อนข้างระมัดระวัง บริษัทได้กล่าวถึง... เอกสารความปลอดภัยที่เผยแพร่ก่อนหน้านี้ เรื่องนี้เกี่ยวข้องกับการโจมตี Rowhammer ครั้งก่อนๆ ที่เกิดขึ้นกับ GPU เช่น GPUHammer และขอแนะนำให้ลูกค้าที่กังวลศึกษาคู่มือการแก้ไขปัญหา ในขณะนี้ยังไม่มีรายละเอียดเกี่ยวกับการอัปเดตเฟิร์มแวร์หรือไดรเวอร์ใดๆ ที่สามารถบล็อกช่องโหว่การโจมตีใหม่เหล่านี้ได้อย่างสมบูรณ์
อย่างไรก็ตาม เป็นเรื่องที่ควรเน้นย้ำว่า ขณะนี้ยังไม่มีเหตุการณ์ฉุกเฉินใดๆ ที่เกิดขึ้นจริงในปัจจุบัน ซึ่งกำลังใช้ประโยชน์จากวิธีการเหล่านี้ในการโจมตี GPU ของ NVIDIA ที่ใช้ GDDR6 ในขณะนี้ สิ่งเหล่านี้ยังเป็นเพียงการพิสูจน์แนวคิดในเชิงวิชาการเท่านั้น แต่ศักยภาพในการสร้างผลกระทบนั้นร้ายแรงมากพอที่ผู้ผลิต ผู้ให้บริการคลาวด์ และองค์กรขนาดใหญ่ต่างเริ่มให้ความสนใจแล้ว
ข้อจำกัดของโปรแกรมป้องกันไวรัส และเหตุผลที่ทำให้ตรวจจับการโจมตีได้ยาก
หนึ่งในข้อสรุปที่น่ากังวลที่สุดจากการศึกษาเหล่านี้คือ เมื่อสิทธิพิเศษเพิ่มสูงขึ้น สิทธิพิเศษเหล่านั้นก็จะยิ่งเพิ่มมากขึ้น ระดับฮาร์ดแวร์โซลูชันด้านความปลอดภัยแบบดั้งเดิมมีขอบเขตการมองเห็นที่จำกัดมาก โปรแกรมป้องกันไวรัสและเครื่องมือตรวจสอบจำนวนมากทำงานในพื้นที่ของระบบปฏิบัติการเป็นหลัก แต่ปัญหาที่แท้จริงนั้นเกิดขึ้นก่อนหน้านั้น นั่นคือการทำงานร่วมกันระหว่าง GPU กับหน่วยความจำ
เมื่อการ์ดกราฟิกได้รับสิทธิ์ในการอ่านและเขียนข้อมูลโดยตรงไปยังหน่วยความจำทางกายภาพของโฮสต์ การประมวลผลจะถูกส่งผ่านทางไปป์ ผ่านทางบัส PCIe ซึ่งเป็นการข้ามขั้นตอนการควบคุมบางส่วนของ CPUจากมุมมองของระบบ การกระทำเหล่านี้จำนวนมากถูกเข้าใจผิดว่าเป็นปริมาณการประมวลผลแบบเร่งความเร็วที่ถูกต้องตามกฎหมาย ดังนั้นจึงไม่มีสัญญาณเตือนใดๆ เกิดขึ้นอย่างชัดเจน
นอกจากนี้ รูปแบบการตอกยังได้รับการออกแบบมาเพื่อ เพื่อให้ระบบป้องกันของชิปหน่วยความจำตรวจจับไม่ได้สิ่งนี้ทำให้ซอฟต์แวร์รักษาความปลอดภัยแยกแยะได้ยากระหว่างการเข้าถึงอย่างเข้มข้นตามปกติ (เช่น จากแอปพลิเคชัน AI หรือแอปพลิเคชันการเรนเดอร์) กับการพยายามโจมตี
ทั้งหมดนี้ทำให้ มาตรการซอฟต์แวร์ล้วนๆ ซอฟต์แวร์ป้องกันไวรัส, EDR และมาตรการรักษาความปลอดภัยอื่นๆ เพียงอย่างเดียวอาจไม่เพียงพอที่จะหยุดยั้งการโจมตีประเภทนี้ได้ การป้องกันที่มีประสิทธิภาพมากที่สุดนั้นเกี่ยวข้องกับการเปลี่ยนแปลงการกำหนดค่าฮาร์ดแวร์ และในระยะกลาง การปรับเปลี่ยนการออกแบบ GPU หน่วยความจำ และตัวควบคุม
มาตรการบรรเทา: การปรับแต่ง IOMMU, ECC และการตั้งค่าต่างๆ
ทีมวิจัยต่างๆ เห็นพ้องกันในสองแนวทางการป้องกันหลักในทันทีสำหรับระบบที่ใช้ GPU ของ NVIDIA ที่มีหน่วยความจำ GDDR6: เปิดใช้งาน IOMMU ใน BIOS และเปิดใช้งานไฟล์ หน่วยความจำแก้ไขข้อผิดพลาด (ECC) บนบัตรที่รองรับฟังก์ชันนี้
หน่วยจัดการหน่วยความจำอินพุต/เอาต์พุต (IOMMU) ทำหน้าที่จัดสรร ที่อยู่เสมือนที่อุปกรณ์สามารถมองเห็นได้ (เช่น GPU) ไปยังที่อยู่ทางกายภาพเฉพาะในหน่วยความจำของโฮสต์ ซึ่งทำให้สามารถจำกัดส่วนต่างๆ ของ RAM ที่การ์ดสามารถเข้าถึงได้โดยตรง ลดขอบเขตของช่องโหว่ที่อาจเกิดขึ้นได้
ตามทฤษฎี การเปิดใช้งาน IOMMU ควรจะป้องกันไม่ให้การแมปรูรับแสงที่ปลอมแปลงเป็น GPU สามารถเข้าถึงหน่วยความจำทั้งหมดของ CPU ได้อย่างอิสระ อย่างไรก็ตาม งานวิจัยชี้ให้เห็นว่า ฟังก์ชันนี้ไม่ได้เปิดใช้งานโดยค่าเริ่มต้นเสมอไป ในระบบปฏิบัติการ Linux เชิงพาณิชย์หลายรุ่น ไม่ว่าจะด้วยเหตุผลด้านความเข้ากันได้หรือประสิทธิภาพ ก็ยังทำให้คอมพิวเตอร์จำนวนมากมีความเสี่ยงอยู่
ระบบป้องกันหลักประการที่สองคือการเปิดใช้งาน ECC บน GPU คุณสมบัตินี้ช่วยให้... หน่วยความจำจะแก้ไขข้อผิดพลาดระดับบิตเดียวจำนวนมากโดยอัตโนมัตินี่หมายความว่าการเปลี่ยนแปลงบิตส่วนใหญ่ที่เกิดจาก Rowhammer จะถูกทำให้เป็นกลางก่อนที่จะถูกนำไปใช้ประโยชน์ได้ ปัญหาคือ ECC มีข้อเสียคือ ลดหน่วยความจำที่ใช้งานได้ และอาจส่งผลให้ประสิทธิภาพลดลงอย่างเห็นได้ชัด ซึ่งทำให้ผู้ใช้ระดับมืออาชีพจำนวนมากเลือกที่จะปิดใช้งาน
ที่แย่ไปกว่านั้น การศึกษาบางชิ้นยังชี้ให้เห็นว่า การโจมตีของ Rowhammer บางส่วนไม่ถูกบล็อกโดย ECCรูปแบบบางอย่างอาจทำให้เกิดข้อผิดพลาดหลายบิตที่เกินขีดความสามารถในการแก้ไข หรือทำให้เกิดข้อผิดพลาดที่ไม่สามารถตรวจพบว่าสามารถแก้ไขได้ ดังนั้นแม้ว่า ECC จะช่วยยกระดับมาตรฐานขึ้นอย่างมาก แต่ก็ไม่ใช่ทางออกที่สมบูรณ์แบบ
ผลกระทบในยุโรป: คอมพิวเตอร์ส่วนบุคคลที่บ้าน เวิร์กสเตชัน และระบบคลาวด์
ในบริบทของยุโรป ขอบเขตของช่องโหว่เหล่านี้มีความสำคัญเป็นพิเศษสำหรับ กลุ่มผู้ใช้ขนาดใหญ่สามกลุ่มกลุ่มเป้าหมาย ได้แก่ บุคคลทั่วไปที่มีพีซีสำหรับเล่นเกมหรือสร้างคอนเทนต์ บริษัทที่มีเวิร์กสเตชันสำหรับงานกราฟิก และผู้ให้บริการคลาวด์ที่ใช้ GPU ร่วมกันระหว่างลูกค้าหลายราย
ในตลาดบ้านพักอาศัย ระบบระดับกลางและระดับสูงหลายระบบมีคุณสมบัติดังต่อไปนี้ การ์ดจออย่างเช่น GeForce RTX 3060นี่เป็นหนึ่งในแบบจำลองเฉพาะที่พบการเปลี่ยนแปลงบิตและการโจมตีแบบต่อเนื่องในห้องปฏิบัติการ อย่างไรก็ตาม ความเสี่ยงในทางปฏิบัติในปัจจุบันถือว่าต่ำ เนื่องจากช่องโหว่มีความซับซ้อน ต้องอาศัยความรู้เชิงลึกเกี่ยวกับระบบ และยังไม่พบการโจมตีใดๆ ที่นำไปใช้ในวงกว้าง
จุดที่เรื่องนี้เริ่มร้ายแรงขึ้นก็คือ... สภาพแวดล้อมขององค์กรและศูนย์ข้อมูลการ์ดจอ RTX 6000 และ RTX A6000 สำหรับมืออาชีพ ออกแบบมาเพื่อการคำนวณทางวิทยาศาสตร์ ปัญญาประดิษฐ์ การออกแบบขั้นสูง หรือการจำลองกราฟิก เป็นที่นิยมใช้ในองค์กรต่างๆ ในยุโรปในภาคส่วนต่างๆ เช่น วิศวกรรม ยานยนต์ การธนาคาร หรือการวิจัยภาครัฐ
ในสถานการณ์การใช้งานคลาวด์แบบแบ่งปัน GPU เพียงตัวเดียวก็เพียงพอแล้ว ให้บริการลูกค้าหลายรายพร้อมกันหากผู้ใดผู้หนึ่งสามารถโจมตีด้วย Rowhammer ได้สำเร็จจากคอนเทนเนอร์หรือเครื่องเสมือนของตน พวกเขาสามารถบังคับให้เกิดการยกระดับสิทธิ์ ซึ่งส่งผลกระทบต่อไฮเปอร์ไวเซอร์หรือผู้เช่ารายอื่น ๆ บนเซิร์ฟเวอร์เดียวกัน และอาจส่งผลกระทบต่อการรักษาความลับและความพร้อมใช้งานของข้อมูลได้
โดยทั่วไปแล้ว ผู้ให้บริการคลาวด์รายใหญ่ในยุโรปจะใช้มาตรการรักษาความปลอดภัยที่เข้มงวดกว่าพีซีที่บ้าน เช่น การกำหนดค่า IOMMU ที่ปรับแต่งอย่างละเอียด การแบ่งส่วนทรัพยากร การตรวจสอบที่เข้มงวดมากขึ้น และในหลายกรณี การเปิดใช้งาน ECC โดยค่าเริ่มต้น ใน GPU ของพวกเขา ถึงกระนั้น งานวิจัยนี้ก็เป็นเครื่องเตือนใจว่า แม้แต่ตัวเร่งกราฟิกประสิทธิภาพสูงก็มีความเสี่ยงอยู่ดี
ตอนนี้ผู้ใช้งานและองค์กรต่างๆ สามารถทำอะไรได้บ้าง?
สำหรับผู้ที่ใช้งาน GPU ของ NVIDIA ที่มี GDDR6 เป็นประจำทุกวัน ไม่ว่าจะในสเปนหรือประเทศอื่นๆ ในยุโรป ก็มีขั้นตอนที่เหมาะสมหลายอย่างที่สามารถทำได้โดยไม่ต้องกังวล ขั้นตอนแรกคือ ตรวจสอบการตั้งค่า BIOS และระบบปฏิบัติการเพื่อตรวจสอบว่า IOMMU เปิดใช้งานและทำงานอย่างถูกต้องหรือไม่
ในสภาพแวดล้อมการทำงานระดับมืออาชีพและบนเซิร์ฟเวอร์ โดยเฉพาะอย่างยิ่งเมื่อทำงานร่วมกับ เวิร์กสเตชันที่มี RTX 6000 หรือ RTX A6000การเปิดใช้งาน ECC นั้นคุ้มค่าที่จะพิจารณาอย่างจริงจัง แม้ว่าจะต้องแลกมาด้วยประสิทธิภาพที่ลดลงและหน่วยความจำที่ใช้งานได้ลดลงบ้างก็ตาม ในหลายกรณี การลดความเสี่ยงนั้นคุ้มค่ากับผลกระทบที่เกิดขึ้น โดยเฉพาะอย่างยิ่งเมื่อต้องจัดการกับข้อมูลที่ละเอียดอ่อนหรือภาระงานที่สำคัญ
ขอแนะนำด้วยครับ หมั่นอัปเดตไดรเวอร์และเฟิร์มแวร์อยู่เสมอ ของการ์ดกราฟิก และติดตามคำแนะนำด้านความปลอดภัยที่เผยแพร่โดย NVIDIA และอย่างใกล้ชิด การอัปเดตที่สำคัญใน Chromeแม้ว่าในปัจจุบันจะยังไม่มีแพทช์มหัศจรรย์ใดที่สามารถกำจัดภัยคุกคามนี้ได้อย่างสมบูรณ์ แต่คาดว่าจะมีการอัปเดตที่จะช่วยลดช่องโหว่บางอย่าง (ตัวอย่างเช่น การแก้ไขข้อบกพร่องของไดรเวอร์ที่ GPUBreach ใช้ประโยชน์)
สำหรับผู้ใช้งานทั่วไปที่มีการ์ดจอ RTX 3060 หรือรุ่น Ampere อื่นๆ ที่ใช้ GDDR6 คำแนะนำที่เหมาะสมที่สุดคือ อย่าปิดใช้งานมาตรการรักษาความปลอดภัยด้วยเหตุผลด้านประสิทธิภาพ หากไม่มีเหตุผลอันสมควร ควรหลีกเลี่ยงการติดตั้งซอฟต์แวร์ที่มีแหล่งที่มาน่าสงสัยซึ่งสามารถประมวลผลโค้ดบน GPU และโดยทั่วไปแล้ว ควรปฏิบัติต่อการ์ดจอเสมือนเป็นส่วนประกอบที่สำคัญไม่แพ้ CPU เอง
ในกรณีของผู้ดูแลระบบและเจ้าหน้าที่รักษาความปลอดภัย การตรวจสอบเหล่านี้ถือว่ามีความเหมาะสม ตรวจสอบนโยบายการแบ่งส่วนทรัพยากร GPU ในสภาพแวดล้อมเสมือนจริง ควรเสริมสร้างการแยกส่วนระหว่างผู้ใช้งาน และหากเป็นไปได้ ควรจำกัดการเข้าถึง API ระดับต่ำของ GPU โดยตรงให้เฉพาะกระบวนการที่จำเป็นจริงๆ เท่านั้น
ทุกอย่างชี้ไปที่ความสัมพันธ์ระหว่าง หน่วยความจำ ฮาร์ดแวร์กราฟิก และความปลอดภัยทางไซเบอร์ ช่องว่างนี้จะแคบลงเรื่อยๆ ในอีกไม่กี่ปีข้างหน้า Rowhammer ไม่ได้เป็นเพียงสิ่งแปลกใหม่ทางวิชาการในอดีตอีกต่อไป แต่ได้ก้าวเข้าสู่ขอบเขตของ GPU สมัยใหม่อย่างเต็มตัวแล้ว และได้แสดงให้เห็นว่าสามารถข้ามขอบเขตระหว่างหน่วยความจำกราฟิกและหน่วยความจำระบบโฮสต์ได้
ผลการทดสอบจาก GDDRHammer, GeForge และ GPUBreach แสดงให้เห็นว่า เป็นไปได้ที่จะเปลี่ยนจากคำสั่งพลิกบิตง่ายๆ ใน GDDR6 ไปเป็นการเข้าถึงเชลล์ที่มีสิทธิ์ระดับรูทในระบบปฏิบัติการแม้กระทั่งสามารถหลีกเลี่ยงระบบป้องกันที่มีอยู่ในปัจจุบันได้บางส่วน ถึงแม้ว่าภัยคุกคามในปัจจุบันยังคงเป็นเพียงทฤษฎีและจำกัดอยู่เฉพาะในห้องปฏิบัติการ แต่ข้อความสำหรับผู้ใช้ ธุรกิจ และผู้ให้บริการคลาวด์ในยุโรปนั้นชัดเจน: ควรปรับการตั้งค่า เปิดใช้งานมาตรการป้องกันที่มีอยู่ และติดตามอย่างใกล้ชิดว่าอุตสาหกรรมและผู้ผลิตตอบสนองต่อการโจมตี Rowhammer รุ่นใหม่นี้บน GPU อย่างไร