ReadyPlanet.com


การรักษาความปลอดภัยที่มีประสิทธิภาพมากขึ้นสำหรับการเรียนรู้ของเครื่องบนคลาวด์


บาคาร่า สมัครบาคาร่า วิธีการเข้ารหัสแบบใหม่ที่คิดค้นโดยนักวิจัยของ MIT ช่วยรักษาความปลอดภัยข้อมูลที่ใช้ในเครือข่ายประสาทเทียมออนไลน์ โดยไม่ทำให้รันไทม์ช้าลงอย่างมาก แนวทางนี้ถือได้ว่าจะใช้โครงข่ายประสาทเทียมบนคลาวด์สำหรับการวิเคราะห์ภาพทางการแพทย์และแอปพลิเคชันอื่นๆ ที่ใช้ข้อมูลที่ละเอียดอ่อน

การเอาท์ซอร์สแมชชีนเลิร์นนิงมีแนวโน้มเพิ่มขึ้นในอุตสาหกรรม บริษัทเทคโนโลยีรายใหญ่ได้เปิดตัวแพลตฟอร์มระบบคลาวด์ที่ดำเนินงานที่ต้องใช้การประมวลผลสูง เช่น เรียกใช้ข้อมูลผ่านเครือข่ายประสาทเทียม (CNN) สำหรับการจัดประเภทรูปภาพ ธุรกิจขนาดเล็กที่มีทรัพยากรจำกัดและผู้ใช้รายอื่นสามารถอัปโหลดข้อมูลไปยังบริการเหล่านั้นได้โดยเสียค่าธรรมเนียมและได้ผลลัพธ์กลับมาในอีกไม่กี่ชั่วโมง

แต่ถ้าเกิดการรั่วไหลของข้อมูลส่วนตัวล่ะ? ในช่วงไม่กี่ปีที่ผ่านมา นักวิจัยได้สำรวจเทคนิคการคำนวณความปลอดภัยต่างๆ เพื่อปกป้องข้อมูลที่ละเอียดอ่อนดังกล่าว แต่วิธีการเหล่านั้นมีข้อเสียด้านประสิทธิภาพซึ่งทำให้การประเมินโครงข่ายประสาทเทียม (การทดสอบและการตรวจสอบความถูกต้อง) ซบเซา ซึ่งบางครั้งอาจช้ากว่าล้านเท่า ซึ่งจำกัดการนำไปใช้ในวงกว้าง

ในบทความที่นำเสนอในการประชุม USENIX Security Conference ในสัปดาห์นี้ นักวิจัยของ MIT ได้อธิบายถึงระบบที่ผสมผสานเทคนิคทั่วไปสองแบบ ได้แก่ การเข้ารหัสแบบโฮโมมอร์ฟิกและวงจรที่อ่านไม่ออก ในลักษณะที่ช่วยให้เครือข่ายดำเนินการตามลำดับความสำคัญได้เร็วกว่าวิธีทั่วไป

นักวิจัยได้ทดสอบระบบที่เรียกว่า GAZELLE ในงานจำแนกภาพแบบสองฝ่าย ผู้ใช้ส่งข้อมูลภาพที่เข้ารหัสไปยังเซิร์ฟเวอร์ออนไลน์เพื่อประเมิน CNN ที่ทำงานบน GAZELLE หลังจากนี้ ทั้งสองฝ่ายจะแชร์ข้อมูลที่เข้ารหัสไปมาเพื่อจัดประเภทภาพของผู้ใช้ ตลอดกระบวนการ ระบบจะทำให้แน่ใจว่าเซิร์ฟเวอร์จะไม่เรียนรู้ข้อมูลที่อัพโหลด ในขณะที่ผู้ใช้ไม่เคยเรียนรู้อะไรเกี่ยวกับพารามิเตอร์เครือข่าย อย่างไรก็ตาม เมื่อเปรียบเทียบกับระบบทั่วไป GAZELLE ทำงานได้เร็วกว่ารุ่นล้ำสมัย 20 ถึง 30 เท่า ในขณะที่ลดแบนด์วิดท์เครือข่ายที่ต้องการลงตามลำดับความสำคัญ

แอปพลิเคชันที่มีแนวโน้มดีอย่างหนึ่งสำหรับระบบคือการฝึกอบรม CNNs เพื่อวินิจฉัยโรค ตัวอย่างเช่น โรงพยาบาลสามารถฝึก CNN เพื่อเรียนรู้ลักษณะของเงื่อนไขทางการแพทย์บางอย่างจากภาพด้วยคลื่นสนามแม่เหล็ก (MRI) และระบุลักษณะเหล่านั้นใน MRI ที่อัปโหลด โรงพยาบาลสามารถทำให้โมเดลพร้อมใช้งานในระบบคลาวด์สำหรับโรงพยาบาลอื่นได้ แต่แบบจำลองนี้ได้รับการฝึกอบรมและอาศัยข้อมูลส่วนตัวของผู้ป่วยเพิ่มเติม เนื่องจากไม่มีโมเดลการเข้ารหัสที่มีประสิทธิภาพ แอปพลิเคชันนี้จึงยังไม่พร้อมสำหรับช่วงไพร์มไทม์

Chiraag Juvekar ผู้เขียนคนแรกของภาควิชาวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ (EECS) กล่าวว่า "ในงานนี้ เราแสดงวิธีการสื่อสารแบบสองฝ่ายที่ปลอดภัยอย่างมีประสิทธิภาพด้วยการผสมผสานเทคนิคทั้งสองนี้เข้าด้วยกันอย่างชาญฉลาด" ). "ขั้นตอนต่อไปคือการนำข้อมูลทางการแพทย์จริงมาแสดงและแสดงให้เห็นว่าแม้ว่าเราจะปรับขนาดสำหรับแอปพลิเคชันที่ผู้ใช้จริงสนใจ แต่ก็ยังให้ประสิทธิภาพที่ยอมรับได้"

ผู้ร่วมเขียนบทความคือ Vinod Vaikuntanathan รองศาสตราจารย์ใน EECS และเป็นสมาชิกของ Computer Science and Artificial Intelligence Laboratory และ Anantha Chandrakasan คณบดีคณะวิศวกรรมศาสตร์และ Vannevar Bush ศาสตราจารย์ด้านวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์

เพิ่มประสิทธิภาพสูงสุด

ซีเอ็นเอ็นประมวลผลข้อมูลภาพผ่านการคำนวณหลายเลเยอร์เชิงเส้นและไม่เชิงเส้น เลเยอร์เชิงเส้นใช้คณิตศาสตร์ที่ซับซ้อน เรียกว่าพีชคณิตเชิงเส้น และกำหนดค่าบางอย่างให้กับข้อมูล เมื่อถึงเกณฑ์ที่กำหนด ข้อมูลจะถูกส่งออกไปยังเลเยอร์ที่ไม่เป็นเชิงเส้นซึ่งทำการคำนวณที่ง่ายกว่า ตัดสินใจ (เช่น ระบุคุณสมบัติของภาพ) และส่งข้อมูลไปยังเลเยอร์เชิงเส้นถัดไป ผลลัพธ์ที่ได้คือรูปภาพที่มีคลาสที่กำหนด เช่น ยานพาหนะ สัตว์ บุคคล หรือลักษณะทางกายวิภาค

แนวทางล่าสุดในการรักษาความปลอดภัย CNN นั้นเกี่ยวข้องกับการใช้การเข้ารหัสแบบโฮโมมอร์ฟิคหรือวงจรที่อ่านไม่ออกเพื่อประมวลผลข้อมูลทั่วทั้งเครือข่าย เทคนิคเหล่านี้มีประสิทธิภาพในการรักษาความปลอดภัยข้อมูล “บนกระดาษ ดูเหมือนว่าจะช่วยแก้ปัญหาได้” Juvekar กล่าว แต่พวกมันทำให้โครงข่ายประสาทเทียมที่ซับซ้อนไม่มีประสิทธิภาพ "ดังนั้น คุณจะไม่ใช้มันสำหรับแอปพลิเคชันในโลกแห่งความเป็นจริง"

การเข้ารหัสแบบ Homomorphic ที่ใช้ในคลาวด์คอมพิวติ้ง รับและดำเนินการคำนวณทั้งหมดในข้อมูลที่เข้ารหัส เรียกว่า ciphertext และสร้างผลลัพธ์ที่เข้ารหัสซึ่งผู้ใช้จะสามารถถอดรหัสลับได้ เมื่อนำไปใช้กับโครงข่ายประสาทเทียม เทคนิคนี้จะรวดเร็วและมีประสิทธิภาพเป็นพิเศษในการคำนวณพีชคณิตเชิงเส้น อย่างไรก็ตาม ข้อมูลในแต่ละเลเยอร์ต้องทำให้เกิดสัญญาณรบกวนเล็กน้อย เสียงรบกวนสะสมหลายชั้น และการคำนวณที่จำเป็นในการกรองสัญญาณรบกวนที่มีความซับซ้อนมากขึ้นเรื่อยๆ ทำให้ความเร็วในการคำนวณช้าลง

วงจรที่อ่านไม่ออกเป็นรูปแบบหนึ่งของการคำนวณแบบสองฝ่ายที่ปลอดภัย เทคนิคนี้รับข้อมูลจากทั้งสองฝ่าย ทำการคำนวณ และส่งอินพุตแยกกันสองรายการไปยังแต่ละฝ่าย ด้วยวิธีนี้ ทั้งสองฝ่ายจะส่งข้อมูลให้กัน แต่พวกเขาไม่เคยเห็นข้อมูลของอีกฝ่ายเลย มีเพียงผลลัพธ์ที่เกี่ยวข้องจากฝั่งของตนเท่านั้น อย่างไรก็ตาม แบนด์วิดท์ที่จำเป็นในการสื่อสารข้อมูลระหว่างฝ่ายต่างๆ จะปรับขนาดตามความซับซ้อนในการคำนวณ ไม่ใช่ขนาดของอินพุต ในโครงข่ายประสาทเทียมออนไลน์ เทคนิคนี้ใช้ได้ดีในเลเยอร์ที่ไม่เป็นเชิงเส้น โดยที่การคำนวณมีน้อย แต่แบนด์วิดท์จะเทอะทะในเลเยอร์เชิงเส้นที่เน้นหนักทางคณิตศาสตร์

นักวิจัยของ MIT กลับรวมเทคนิคทั้งสองนี้เข้าด้วยกันเพื่อขจัดความไร้ประสิทธิภาพ

ในระบบของพวกเขา ผู้ใช้จะอัปโหลดข้อความเข้ารหัสไปยัง CNN บนคลาวด์ ผู้ใช้ต้องมีเทคนิควงจรที่อ่านไม่ออกบนคอมพิวเตอร์ของตนเอง CNN ทำการคำนวณทั้งหมดในเลเยอร์เชิงเส้น จากนั้นส่งข้อมูลไปยังเลเยอร์ที่ไม่เป็นเชิงเส้น เมื่อถึงจุดนั้น CNN และผู้ใช้จะแบ่งปันข้อมูล ผู้ใช้ทำการคำนวณเกี่ยวกับวงจรที่อ่านไม่ออกและส่งข้อมูลกลับไปที่ CNN ด้วยการแบ่งและแบ่งปันปริมาณงาน ระบบจะจำกัดการเข้ารหัสแบบ homomorphic ให้ทำการคำนวณที่ซับซ้อนทีละชั้น ดังนั้นข้อมูลจะไม่ส่งเสียงดังเกินไป นอกจากนี้ยังจำกัดการสื่อสารของวงจรที่อ่านไม่ออกให้เหลือเพียงแค่เลเยอร์ที่ไม่เป็นเชิงเส้นเท่านั้น ซึ่งมันสามารถทำงานได้อย่างเหมาะสมที่สุด

Juvekar กล่าวว่า "เราใช้เทคนิคเฉพาะสำหรับจุดที่พวกเขามีประสิทธิภาพมากที่สุดเท่านั้น

การแบ่งปันความลับ

ขั้นตอนสุดท้ายคือการทำให้แน่ใจว่าชั้นวงจรโฮโมมอร์ฟิกและวงจรที่อ่านไม่ออกนั้นมีรูปแบบการสุ่มทั่วไปที่เรียกว่า "การแบ่งปันแบบลับๆ" ในรูปแบบนี้ ข้อมูลจะถูกแบ่งออกเป็นส่วนต่างๆ ที่มอบให้กับฝ่ายต่างๆ ทุกฝ่ายประสานส่วนต่างๆ ของตนเพื่อสร้างข้อมูลทั้งหมดขึ้นใหม่

ใน GAZELLE เมื่อผู้ใช้ส่งข้อมูลที่เข้ารหัสไปยังบริการบนคลาวด์ ข้อมูลจะถูกแยกระหว่างทั้งสองฝ่าย เพิ่มในแต่ละการแชร์เป็นรหัสลับ (ตัวเลขสุ่ม) ที่มีเพียงฝ่ายที่เป็นเจ้าของเท่านั้นที่รู้ ตลอดการคำนวณ แต่ละฝ่ายจะมีข้อมูลบางส่วนเสมอ บวกกับตัวเลขสุ่ม ดังนั้นข้อมูลจึงดูเหมือนสุ่มทั้งหมด เมื่อสิ้นสุดการคำนวณ ทั้งสองฝ่ายจะซิงค์ข้อมูลของตน จากนั้นผู้ใช้จะขอรหัสลับจากบริการบนคลาวด์ ผู้ใช้สามารถลบรหัสลับออกจากข้อมูลทั้งหมดเพื่อให้ได้ผลลัพธ์

“เมื่อสิ้นสุดการคำนวณ เราต้องการให้ฝ่ายแรกได้ผลลัพธ์การจัดหมวดหมู่ และฝ่ายที่สองไม่ได้อะไรเลย” Juvekar กล่าว นอกจากนี้ "บุคคลที่หนึ่งเรียนรู้อะไรเกี่ยวกับพารามิเตอร์ของแบบจำลอง"บาคาร่า สมัครบาคาร่า



ผู้ตั้งกระทู้ Rimuru Tempest :: วันที่ลงประกาศ 2021-09-17 16:04:27 IP : 182.232.149.249


แสดงความคิดเห็น
ความคิดเห็น *
ผู้แสดงความคิดเห็น  *
อีเมล 
ไม่ต้องการให้แสดงอีเมล



Copyright © 2010 All Rights Reserved.