13
Oct
2022

ชิปใหม่เพิ่มประสิทธิภาพการประมวลผล AI

เอดจ์คอมพิวติ้งที่ขับเคลื่อนด้วย AI มีอยู่ทั่วไปในชีวิตของเรา อุปกรณ์ต่างๆ เช่น โดรน อุปกรณ์สวมใส่อัจฉริยะ และเซ็นเซอร์ IoT อุตสาหกรรมได้รับการติดตั้งชิปที่เปิดใช้งาน AI เพื่อให้การประมวลผลเกิดขึ้นที่ “ขอบ” ของอินเทอร์เน็ตซึ่งเป็นที่มาของข้อมูล ซึ่งช่วยให้ประมวลผลแบบเรียลไทม์และรับประกันความเป็นส่วนตัวของข้อมูล

อย่างไรก็ตาม ฟังก์ชัน AI บนอุปกรณ์ขอบเล็กๆ เหล่านี้ถูกจำกัดด้วยพลังงานจากแบตเตอรี่ ดังนั้นการปรับปรุงประสิทธิภาพการใช้พลังงานจึงเป็นสิ่งสำคัญ ในชิป AI ในปัจจุบัน การประมวลผลข้อมูลและการจัดเก็บข้อมูลเกิดขึ้นในที่ที่แยกจากกัน – หน่วยประมวลผลและหน่วยหน่วยความจำ การย้ายข้อมูลบ่อยครั้งระหว่างหน่วยเหล่านี้ใช้พลังงานส่วนใหญ่ระหว่างการประมวลผล AI ดังนั้นการลดการเคลื่อนไหวของข้อมูลจึงเป็นกุญแจสำคัญในการแก้ไขปัญหาด้านพลังงาน

วิศวกรของมหาวิทยาลัยสแตนฟอร์ดได้คิดค้นวิธีแก้ปัญหาที่เป็นไปได้: ชิปหน่วยความจำเข้าถึงโดยสุ่มแบบต้านทาน (RRAM) แบบใหม่ที่ทำการประมวลผล AI ภายในหน่วยความจำ ดังนั้นจึงช่วยขจัดการแยกระหว่างหน่วยคำนวณและหน่วยหน่วยความจำ ชิป “compute-in-memory” (CIM) ที่เรียกว่า NeuRRAM มีขนาดประมาณปลายนิ้วและทำงานได้ดีกว่าด้วยพลังงานแบตเตอรี่ที่จำกัด มากกว่าที่ชิปปัจจุบันสามารถทำได้

H.-S กล่าวว่า “การคำนวณบนชิปนั้นเสร็จสิ้นแทนที่จะส่งข้อมูลไปและกลับจากคลาวด์สามารถช่วยให้ AI เร็วขึ้น ปลอดภัยขึ้น ถูกกว่า และปรับขนาดได้มากขึ้นในอนาคต และทำให้ผู้คนเข้าถึงพลัง AI ได้มากขึ้น” H.-S กล่าว Philip Wong , Willard R. และ Inez Kerr Bell ศาสตราจารย์แห่ง School of Engineering

“ปัญหาการเคลื่อนย้ายข้อมูลคล้ายกับการใช้เวลาแปดชั่วโมงในการเดินทางเป็นเวลาสองชั่วโมงในวันทำงาน” Weier Wan ผู้สำเร็จการศึกษาล่าสุดจาก Stanford ซึ่งเป็นผู้นำโครงการนี้กล่าวเสริม “ด้วยชิปของเรา เรากำลังแสดงเทคโนโลยีเพื่อรับมือกับความท้าทายนี้”

พวกเขานำเสนอ NeuRRAM ใน บทความล่าสุดใน วารสาร Nature ในขณะที่การประมวลผลในหน่วยความจำมีมานานหลายทศวรรษแล้ว ชิปตัวนี้เป็นชิปตัวแรกที่แสดงให้เห็นถึงการใช้งาน AI ที่หลากหลายบนฮาร์ดแวร์ แทนที่จะใช้การจำลองเพียงอย่างเดียว

นำพลังการคำนวณมาสู่อุปกรณ์
เพื่อเอาชนะปัญหาคอขวดในการเคลื่อนย้ายข้อมูล นักวิจัยได้ใช้สิ่งที่เรียกว่า compute-in-memory (CIM) ซึ่งเป็นสถาปัตยกรรมชิปแบบใหม่ที่ทำการประมวลผลด้วย AI ภายในหน่วยความจำโดยตรง แทนที่จะใช้ในหน่วยคำนวณแยกกัน เทคโนโลยีหน่วยความจำที่ NeuRRAM ใช้เป็นหน่วยความจำเข้าถึงโดยสุ่มแบบต้านทาน (RRAM) เป็นหน่วยความจำแบบไม่ลบเลือน – หน่วยความจำที่เก็บข้อมูลแม้เมื่อปิดเครื่อง – ซึ่งปรากฏในผลิตภัณฑ์เชิงพาณิชย์ RRAM สามารถจัดเก็บโมเดล AI ขนาดใหญ่ในพื้นที่ขนาดเล็ก และใช้พลังงานเพียงเล็กน้อย ทำให้เหมาะสำหรับอุปกรณ์ Edge ขนาดเล็กและใช้พลังงานต่ำ

แม้ว่าแนวคิดของชิป CIM จะได้รับการจัดตั้งขึ้นมาเป็นอย่างดี และแนวคิดในการใช้การประมวลผล AI ใน RRAM ไม่ใช่เรื่องใหม่ “นี่เป็นหนึ่งในอินสแตนซ์แรกๆ ที่รวมหน่วยความจำจำนวนมากเข้ากับชิปเครือข่ายประสาทเทียมและนำเสนอผลการวัดประสิทธิภาพทั้งหมด ผ่านการวัดฮาร์ดแวร์” Wong ซึ่งเป็นผู้เขียนอาวุโสร่วมของ กระดาษNature กล่าว

สถาปัตยกรรมของ NeuRRAM ช่วยให้ชิปทำการคำนวณในหน่วยความจำแบบอะนาล็อกโดยใช้พลังงานต่ำและในพื้นที่ที่มีขนาดกะทัดรัด ได้รับการออกแบบร่วมกับห้องปฏิบัติการของ Gert Cauwenberghs ที่มหาวิทยาลัยแคลิฟอร์เนีย ซานดิเอโก ซึ่งเป็นผู้บุกเบิกการออกแบบฮาร์ดแวร์ neuromorphic ที่ใช้พลังงานต่ำ สถาปัตยกรรมยังช่วยให้สามารถกำหนดค่าใหม่ได้ในทิศทางของกระแสข้อมูล รองรับกลยุทธ์การทำแผนที่ภาระงาน AI ที่หลากหลาย และสามารถทำงานกับอัลกอริธึม AI ประเภทต่างๆ ได้โดยไม่สูญเสียความแม่นยำในการคำนวณของ AI

เพื่อแสดงความแม่นยำของความสามารถ AI ของ NeuRRAM ทีมงานได้ทดสอบว่ามันทำงานอย่างไรในงานต่างๆ พวกเขาพบว่าการรู้จำตัวอักษรจากชุดข้อมูล MNIST นั้นแม่นยำ 99%, การจัดหมวดหมู่รูปภาพจากชุดข้อมูล CIFAR-10 นั้นแม่นยำถึง 85.7%, แม่นยำ 84.7% ในการรู้จำคำสั่งคำพูดของ Google และพบว่าข้อผิดพลาดในการสร้างภาพใหม่ลดลง 70% ใน Bayesian งานกู้คืนรูปภาพ

“ประสิทธิภาพ ความเก่งกาจ และความแม่นยำล้วนเป็นสิ่งสำคัญสำหรับการใช้เทคโนโลยีในวงกว้าง” Wan กล่าว “แต่การตระหนักรู้ในครั้งเดียวนั้นไม่ใช่เรื่องง่าย การร่วมมือกันเพิ่มประสิทธิภาพทั้งชุดตั้งแต่ฮาร์ดแวร์ไปจนถึงซอฟต์แวร์คือกุญแจสำคัญ”

“การออกแบบร่วมแบบฟูลสแตกดังกล่าวเกิดขึ้นได้ด้วยทีมนักวิจัยระดับนานาชาติที่มีความเชี่ยวชาญหลากหลาย” หว่องกล่าวเสริม

ขุมพลังการคำนวณแห่งอนาคต
ตอนนี้ NeuRRAM เป็นแนวคิดที่พิสูจน์ได้ทางกายภาพ แต่ต้องการการพัฒนาเพิ่มเติมก่อนที่จะพร้อมสำหรับการแปลเป็นอุปกรณ์ Edge จริง

แต่ประสิทธิภาพ ความแม่นยำ และความสามารถในการทำงานต่างๆ ที่ผสมผสานกันนี้ แสดงให้เห็นถึงศักยภาพของชิป “บางทีวันนี้อาจใช้เพื่อทำงาน AI ธรรมดาๆ เช่น การจำคีย์เวิร์ดหรือการตรวจจับโดยมนุษย์ แต่พรุ่งนี้อาจเปิดประสบการณ์ผู้ใช้ที่แตกต่างไปจากเดิมอย่างสิ้นเชิง ลองนึกภาพการวิเคราะห์วิดีโอแบบเรียลไทม์ร่วมกับการรู้จำคำพูดภายในอุปกรณ์ขนาดเล็ก” Wan กล่าว “เพื่อให้เข้าใจถึงสิ่งนี้ เราจำเป็นต้องปรับปรุงการออกแบบและปรับขนาด RRAM ให้เป็นโหนดเทคโนโลยีขั้นสูงต่อไป”

Priyanka Rainaผู้ช่วยศาสตราจารย์ด้านวิศวกรรมไฟฟ้ากล่าวว่า “งานนี้เปิดช่องทางมากมายสำหรับการวิจัยในอนาคตเกี่ยวกับวิศวกรรมอุปกรณ์ RRAM และโมเดลการเขียนโปรแกรมและการออกแบบเครือข่ายประสาทเทียมสำหรับการประมวลผลในหน่วยความจำ เพื่อทำให้เทคโนโลยีนี้สามารถปรับขนาดและใช้งานได้โดยนักพัฒนาซอฟต์แวร์” และผู้ร่วมเขียนบทความ

หากประสบความสำเร็จ ชิปประมวลผลในหน่วยความจำ RRAM อย่าง NeuRRAM จะมีศักยภาพที่แทบจะไร้ขีดจำกัด พวกเขาสามารถฝังลงในทุ่งเพาะปลูกเพื่อทำการคำนวณ AI แบบเรียลไทม์สำหรับการปรับระบบชลประทานให้เข้ากับสภาพดินในปัจจุบัน หรือพวกเขาสามารถเปลี่ยนแว่นตาความเป็นจริงเสริมจากชุดหูฟังที่เกะกะด้วยฟังก์ชันที่จำกัดให้เป็นสิ่งที่คล้ายกับหน้าจอมุมมองของโทนี่ สตาร์คในภาพยนตร์ ไอรอนแมน และ อ เวนเจอร์ส

หากผลิตเป็นจำนวนมาก ชิปเหล่านี้จะมีราคาถูกเพียงพอ ปรับตัวได้เพียงพอ และใช้พลังงานต่ำพอที่จะนำไปใช้ในการพัฒนาเทคโนโลยีที่พัฒนาชีวิตของเราอยู่แล้ว Wong กล่าวเช่นเดียวกับในอุปกรณ์ทางการแพทย์ที่อนุญาตให้มีการตรวจสุขภาพที่บ้าน

สามารถใช้เพื่อแก้ปัญหาความท้าทายทางสังคมทั่วโลกได้เช่นกัน: เซ็นเซอร์ที่เปิดใช้งาน AI จะมีบทบาทในการติดตามและจัดการกับการเปลี่ยนแปลงสภาพภูมิอากาศ “การมีอุปกรณ์อิเล็กทรอนิกส์อัจฉริยะประเภทนี้สามารถวางได้เกือบทุกที่ คุณสามารถตรวจสอบโลกที่เปลี่ยนแปลงไปและเป็นส่วนหนึ่งของการแก้ปัญหา” Wong กล่าว “ชิปเหล่านี้สามารถใช้แก้ปัญหาได้ทุกประเภทตั้งแต่การเปลี่ยนแปลงสภาพภูมิอากาศไปจนถึงความมั่นคงด้านอาหาร”

ผู้เขียนร่วมเพิ่มเติมของงานนี้ ได้แก่ นักวิจัยจาก University of California San Diego (co-lead), Tsinghua University, University of Notre Dame และ University of Pittsburgh อดีตนักศึกษาระดับบัณฑิตศึกษาของ Stanford Sukru Burc Eryilmaz ยังเป็นผู้ร่วมเขียนอีกด้วย Wong เป็นสมาชิกของ Stanford Bio-X และ Wu Tsai Neurosciences Instituteและเป็นบริษัทในเครือของ Precourt Institute for Energy เขายังเป็นผู้อำนวยการคณะของ Stanford Nanofabrication Facility และผู้อำนวยการร่วมของคณะผู้ก่อตั้ง Stanford SystemX Alliance ซึ่งเป็นโครงการในเครือด้านอุตสาหกรรมของ Stanford ที่เน้นเรื่องระบบอาคาร

งานวิจัยนี้ได้รับทุนจาก National Science Foundation Expeditions in Computing, SRC JUMP ASCENT Center, Stanford SystemX Alliance , Stanford NMTRI , Beijing Innovation Center for Future Chips, National Natural Science Foundation of China และ the Office of Naval Research

หน้าแรก

Share

You may also like...