คอมพิวเตอร์ควอนตัมต้องการพลังงานมากแค่ไหน?
Quantum AI Lab ของ Google ได้ติดตั้งรุ่นล่าสุดของสิ่งที่ D-Wave Systems อธิบายว่าเป็นคอมพิวเตอร์ควอนตัมเชิงพาณิชย์เครื่องแรกของโลก คอมพิวเตอร์ควอนตัมอาจแก้ปัญหาบางอย่างได้เร็วกว่าคอมพิวเตอร์แบบคลาสสิกในปัจจุบัน ในขณะที่ใช้พลังงานค่อนข้างน้อยกว่าในการคำนวณ ทว่าประสิทธิภาพการใช้พลังงานของคอมพิวเตอร์ควอนตัมยังคงเป็นปริศนา
สำหรับตอนนี้ เครื่องของ D-Wave สามารถเพิ่มจำนวนควอนตัมบิต (qubits) ที่พวกเขาใช้ได้โดยไม่ต้องเพิ่มความต้องการพลังงานอย่างมีนัยสำคัญ นั่นเป็นเพราะฮาร์ดแวร์คอมพิวเตอร์ควอนตัมของ D-Wave อาศัยการออกแบบเฉพาะที่ประกอบด้วยลูปโลหะไนโอเบียมที่ทำหน้าที่เป็นตัวนำยิ่งยวดเมื่อแช่เย็นจนเย็นถึง 15 มิลลิเคลวิน (-273° C) การใช้พลังงานของฮาร์ดแวร์ D-Wave ส่วนใหญ่—น้อยกว่า 25 กิโลวัตต์เล็กน้อยสำหรับเครื่องล่าสุด—ใช้หน่วยทำความเย็นที่ช่วยให้โปรเซสเซอร์ควอนตัมเย็น ตัวประมวลผลควอนตัมนั้นต้องการเงินเล็กน้อยเปรียบเทียบ
Colin Williams ผู้อำนวยการฝ่ายพัฒนาธุรกิจและพันธมิตรเชิงกลยุทธ์ของ Colin Williams ผู้อำนวยการฝ่ายพัฒนาธุรกิจและพันธมิตรเชิงกลยุทธ์ของ Colin Williams ผู้อำนวยการฝ่ายพัฒนาธุรกิจและหุ้นส่วนเชิงกลยุทธ์ของ Colin Williams ผู้อำนวยการฝ่ายพัฒนาธุรกิจและพันธมิตรเชิงกลยุทธ์ ระบบ D-Wave
เครื่องD-Wave 2X ขนาด 1 000 คิวบิตใหม่ที่ ติดตั้งในห้องทดลองของ Google มีคิวบิตมากกว่า เครื่อง D-Wave Two รุ่นก่อนประมาณสองเท่า แต่จำนวนพลังงานที่น้อยที่สุดที่ใช้โดยโปรเซสเซอร์ควอนตัมหมายความว่า ” พลังของระบบทั้งหมดจะยังคงคงที่ไม่มากก็น้อยสำหรับรุ่นต่อ ๆ ไป” แม้ว่าตัวประมวลผลควอนตัมจะปรับขนาดได้ถึงหลายพัน qubits วิลเลียมส์กล่าว
ขณะนี้ D-Wave สามารถหลีกเลี่ยงสิ่งนี้ได้เนื่องจากหน่วย “cryostat” เดียวกันที่ใช้พลังงานจำนวนมากจะยังคงเพียงพอที่จะทำให้โปรเซสเซอร์ควอนตัมเย็นลงกว่าที่ใช้อยู่ในปัจจุบัน
“มันจะคล้ายคลึงกันถ้าคุณต่ออุปกรณ์ระบายความร้อนขนาดใหญ่เข้ากับพีซีของคุณที่ใช้พลังงานหลายกิโลวัตต์ คุณแทบจะไม่เห็นการใช้พลังงานที่เพิ่มขึ้นเมื่อใช้กับระบบที่ใหญ่ขึ้น เนื่องจากพลังงานถูกครอบงำโดยโครงสร้างพื้นฐานการระบายความร้อนขนาดใหญ่” Matthiasกล่าว Troyer , ฟิสิกส์คำนวณที่ ETH ซูริค
ความสามารถในการขยายขีดความสามารถในการประมวลผลของเครื่อง D-Wave โดยไม่เพิ่มการใช้พลังงานอาจฟังดูมีแนวโน้มดี แต่จริงๆ แล้ว มันไม่ได้พูดถึงประสิทธิภาพการใช้พลังงานของการคำนวณควอนตัมมากนักเมื่อเทียบกับการคำนวณแบบคลาสสิก เครื่อง D-Wave ในปัจจุบันทำงานได้ดีพอ ๆ กับพีซีระดับไฮเอนด์ในงานเฉพาะบางอย่าง แต่ใช้พลังงานมากกว่ามากโดยพิจารณาจากความต้องการในการระบายความร้อนที่รุนแรง (แกนประมวลผลระดับไฮเอนด์ต้องการพลังงานเพียงสิบวัตต์)
“ในขณะที่ ‘ ความต้องการพลังงานที่แบนราบ’ เป็นคำกล่าวที่ดีสำหรับการตลาด แต่ก็ยังไม่ชัดเจนในขณะนี้ว่าความต้องการพลังงานที่แท้จริงเป็นอย่างไรเมื่ออุปกรณ์ได้รับการปรับให้เหมาะสมและปรับขนาดขึ้นแล้ว” Troyer กล่าว “ตอนนี้พวกเขาต้องการอำนาจสั่งการที่ใหญ่กว่าเทคโนโลยีคลาสสิกที่แข่งขันกัน”
อย่างไรก็ตาม มันไม่ใช่การเปรียบเทียบที่ยุติธรรมอย่างแน่นอน Troyer กล่าว “ในด้านพลังงาน พวกเขากำลังแพ้” เขากล่าว แต่เครื่อง D-Wave “ไม่ได้ถูกออกแบบมาให้ประหยัดพลังงาน มันอาจจะชำระอีกครั้งในบางจุด”
Scott Aaronson นักวิทยาศาสตร์คอมพิวเตอร์เชิงทฤษฎีที่ MIT และนักวิจารณ์ D-Wave ดูเหมือนจะสับสนกับแนวคิดที่ว่า D-Wave มีความได้เปรียบด้านพลังงานทุกประเภท อ้างถึงการพึ่งพา D-Wave ในเครื่องทำความเย็นแบบแช่แข็งที่เขาเขียนไว้ในอีเมล: “เป็นเรื่องน่าขบขันที่ chutzpah ประสบปัญหาขนาดมหึมาและนำเสนอเป็นคุณลักษณะ” เขาชี้ให้เห็นว่า D-Wave อาจต้องการระบบระบายความร้อนที่กินไฟมากกว่าเดิม เพื่อสร้างอุณหภูมิที่ต่ำกว่า ซึ่งช่วยเพิ่มโอกาสที่โปรเซสเซอร์ควอนตัมจะได้เปรียบ “การเร่งความเร็ว” เหนือการประมวลผลแบบคลาสสิกในอนาคต
เครื่องอบอ่อนควอนตัมของ D-Wave แสดงสถาปัตยกรรมคอมพิวเตอร์ที่เป็นไปได้เพียงหนึ่งเดียวสำหรับการคำนวณควอนตัม ออกแบบมาเพื่อแก้ปัญหาเฉพาะด้านของ “ปัญหาการปรับให้เหมาะสม” แทนที่จะทำหน้าที่เป็นคอมพิวเตอร์ควอนตัมลอจิกเกตสากล (หลังจะเป็นรุ่นซุปเปอร์รวดเร็วของวันนี้คลาสสิก“ประตูรุ่น” คอมพิวเตอร์.) ของ Google ควอนตัมเอไอแล็บมีการลงทุนในเครื่องจักรทั้ง D-คลื่นและในการสำรวจพัฒนาสากลคอมพิวเตอร์ควอนตัมตรรกะประตู
ในท้ายที่สุด Troyer คาดว่าความต้องการด้านพลังงานสำหรับการคำนวณควอนตัมน่าจะเป็น “สัดส่วนเชิงเส้น” กับจำนวน qubits และข้อต่อของพวกมัน เช่นเดียวกับสัดส่วนกับจำนวนครั้งที่ตัวดำเนินการต้องเรียกใช้และทำให้ระบบเย็นลงก่อนที่จะพบวิธีแก้ปัญหา
ข้อได้เปรียบที่สำคัญของการคำนวณควอนตัมอาจไม่ปรากฏจนกว่าวิศวกรจะสร้างเครื่องจักรที่มีคิวบิตหลายพันหรือหลายล้าน นั่นยังคงเป็นทางออกสำหรับ D-Wave ซึ่งเลือกที่จะเพิ่มจำนวน qubits ในโปรเซสเซอร์อย่างรวดเร็ว นักวิจัยคอมพิวเตอร์ควอนตัมส่วนใหญ่เลือกใช้วิธีการที่ช้ากว่ามากในการสร้างอุปกรณ์คอมพิวเตอร์ควอนตัมที่มีหลาย qubits หรือ qubits หลายสิบตัว เนื่องจากความท้าทายหลักในการแก้ไขข้อผิดพลาดของ qubit และรักษาความสอดคล้องกันทั่วทั้งระบบ
ถึงกระนั้นทั้ง D-Wave และห้องปฏิบัติการคอมพิวเตอร์ควอนตัมอิสระต่างก็มีเป้าหมายเดียวกันในการสร้างเครื่องจักรที่สามารถใช้ประโยชน์จาก “ฟิสิกส์ที่น่ากลัว” ของฟิสิกส์ควอนตัม คอมพิวเตอร์ควอนตัมสามารถทำการคำนวณได้หลายอย่างในเวลาเดียวกันมากกว่าเครื่องจักรแบบคลาสสิก หากคอมพิวเตอร์ควอนตัมสามารถเอาชนะคอมพิวเตอร์แบบคลาสสิกในแง่ของ “เวลาในการแก้ปัญหา” คอมพิวเตอร์เหล่านี้ก็สามารถพิสูจน์ได้ว่าประหยัดพลังงานมากขึ้นเมื่อสิ้นสุดวัน
“ถ้าอุปกรณ์ควอนตัมสามารถแก้ปัญหาด้วยการปรับขนาด [time to solution] ได้ดีกว่าการคำนวณแบบเดิมก็จะชนะด้วยพลังงาน” Troyer กล่าว
เงินเดือน “ช่องว่าง” ระหว่างชายและหญิงเป็นเหมือนช่องว่าง
เงินเดือนของผู้หญิงนั้นช้ากว่าผู้ชายมาก แม้จะแบ่งตามระดับประสบการณ์ก็ตาม การสำรวจระบุ ความแตกต่างโดยรวมของรายได้เฉลี่ยในปี 2561 อยู่ที่ 19,000 ดอลลาร์ ซึ่งน้อยกว่า $1,000 เมื่อเทียบกับปี 2017 แต่ก็ยังถือว่าใหญ่มาก ช่องว่างเริ่มต้นค่อนข้างเล็ก แต่เติบโตอย่างรวดเร็วด้วยประสบการณ์หลายปี ผู้หญิงโดยรวมคิดเป็นร้อยละ 8.5 ของผู้ตอบแบบสำรวจที่ทำงานเต็มเวลาในสาขาที่เชี่ยวชาญ
ความเหลื่อมล้ำทางเชื้อชาติขนาดใหญ่ยังคงมีอยู่
ช่องว่างเงินเดือนในด้านวิศวกรรมระหว่างคนผิวขาวและชาวแอฟริกัน – อเมริกันตามการสำรวจคือ 20,500 ดอลลาร์ในปี 2561 ช่องว่างระหว่างชาวฮิสแปนิกและคอเคเซียนน้อยกว่า 3,000 ดอลลาร์เท่านั้น
เงินไหลไปทางทิศตะวันตก
จากการสำรวจพบว่ารายได้แตกต่างกันไปตามภูมิศาสตร์ ตามปกติแล้ว ภูมิภาคแปซิฟิกมีเงินเดือนวิศวกรรมมัธยฐานสูงสุด: 168,708 ดอลลาร์ รองลงมาคือนิวอิงแลนด์ ภูมิภาคตะวันออก-เหนือ-กลาง และตะวันตก-เหนือ-กลาง เพิ่มส่วนหลังที่ 128,000 ดอลลาร์ เมื่อพิจารณาเฉพาะบางรัฐ แคลิฟอร์เนียได้อันดับสูงสุดที่ 180,000 ดอลลาร์ ตามด้วยดิสตริกต์ออฟโคลัมเบียที่ 159,000 ดอลลาร์ แมสซาชูเซตส์ที่ 158,000 ดอลลาร์ และเวอร์จิเนียและนิวเจอร์ซีย์ที่ 156,000 ดอลลาร์
ด้วยอายุที่เพิ่มมากขึ้น—แต่เพียงจุดเดียว
อายุเฉลี่ยของผู้ตอบแบบสำรวจเป็นรอบ 50 ที่บังเอิญยังเป็นอายุที่เงินเดือนวิศวกรรมไปแบนก่อนที่จะเริ่มลดลงเป็นปรากฏการณ์ก็หยิบขึ้นมาในเร็ว ๆ นี้การสำรวจเงินเดือนเทคโนโลยีโดยได้รับการว่าจ้าง
แบบสำรวจเงินเดือน IEEE-USA ดำเนินการทางออนไลน์ ได้รับการตอบกลับ 8,813 ครั้ง การวิเคราะห์ข้อมูลส่วนใหญ่ขจัดข้อผิดพลาดและมุ่งเน้นไปที่ผู้ตอบแบบสอบถาม 6,739 คนซึ่งเป็นวิศวกรที่ทำงานเต็มเวลาในด้านความสามารถทางเทคนิคหลักของตน
ในวันจันทร์ที่การประชุมสัมมนา IEEE Hot Chipsที่มหาวิทยาลัยสแตนฟอร์ด บริษัทสตาร์ทอัพ Cerebrasได้เปิดตัวชิปที่ใหญ่ที่สุดเท่าที่เคยสร้างมา เป็นระบบขนาดแผ่นเวเฟอร์ซิลิคอนโดยประมาณเพื่อลดเวลาการฝึกอบรม AI จากเดือนเหลือเป็นนาที เป็นความพยายามเชิงพาณิชย์ครั้งแรกที่โปรเซสเซอร์ขนาดเวเฟอร์ตั้งแต่ Trilogy Systems ล้มเหลวในการทำงานในปี 1980
1 | สถิติ
ในฐานะที่เป็นชิปรายใหญ่ที่สุดที่เคยสร้าง Cerebras ของเวเฟอร์ชั่ง Engine (WSE) ตามธรรมชาติมาพร้อมกับพวงของ ขั้นสูงสุด โดยมีบริบทบางส่วนที่เป็นไปได้:
ขนาด : 46,225 ตร.ม. นั่นคือประมาณ 75 เปอร์เซ็นต์ของกระดาษขนาด Letter แต่ใหญ่กว่า GPU ที่ใหญ่ที่สุด 56 เท่า
ทรานซิสเตอร์: 1.2 ล้านล้าน GV100 Volta ของ Nvidia บรรจุใน 21 พันล้าน
แกนประมวลผล: 400,000. ไม่ต้องเลือก GV100 มากเกินไป แต่มีแกน CUDA มากกว่า 5,000 คอร์และเทนเซอร์คอร์มากกว่า 600 คอร์ ซึ่งทั้งสองอย่างนี้ใช้ในปริมาณงาน AI (GV100 ห้าสิบหกตัวจะมีมากกว่า 300,000 คอร์)
หน่วยความจำ: SRAM บนชิป 18 กิกะไบต์ Cerebras กล่าวว่านี่เป็น 3,000 เท่าของ GPU Volta มี SRAM 6 MB ในแคช L2 ตามเอกสารไวท์เปเปอร์นี้ [หน้า 10] แต่ SRAM อาจไม่ใช่การเปรียบเทียบที่ยุติธรรม เนื่องจาก GV100 แต่ละตัวทำงานร่วมกับ DRAM แบนด์วิดท์สูง 32 GB
แบนด์วิดธ์หน่วยความจำ: 9 เพตาไบต์ต่อวินาที ตามรายงานของCerebras มี GPU ที่เราชื่นชอบถึง 10,000 เท่า Cerebras เป็นที่นี่เปรียบเทียบแบนด์วิดธ์ Volta 900 GB / sเพื่อแบนด์วิธสูง DRAM มากกว่า SRAM บนชิป[หน้า 21]
2 | ทำไมคุณถึงต้องการมอนสเตอร์ตัวนี้?
Cerebras สร้างเคสที่ดีในกระดาษสีขาว [PDF] ว่าทำไมชิปขนาดใหญ่ที่น่าขันเช่นนี้จึงสมเหตุสมผล โดยพื้นฐานแล้ว บริษัทให้เหตุผลว่าความต้องการการฝึกอบรมระบบการเรียนรู้เชิงลึกและระบบ AI อื่นๆ กำลังจะหมดลง บริษัทกล่าวว่าการฝึกอบรมรูปแบบใหม่ ซึ่งก็คือการสร้างระบบที่เมื่อผ่านการฝึกอบรมมาแล้ว สามารถจดจำผู้คนหรือชนะเกม Go ได้ — นั้นใช้เวลาเป็นสัปดาห์หรือเป็นเดือน และทำให้เสียเวลาในการคำนวณหลายแสนดอลลาร์ ค่าใช้จ่ายนั้นหมายความว่ามีที่ว่างเพียงเล็กน้อยสำหรับการทดลอง และนั่นเป็นการยับยั้งแนวคิดและนวัตกรรมใหม่ๆ
คำตอบของสตาร์ทอัพคือ โลกต้องการทรัพยากรการประมวลผลการฝึกอบรมมากขึ้นและมีราคาถูกลง การฝึกอบรมต้องใช้เวลาไม่กี่นาทีไม่ใช่เดือน และในการทำเช่นนั้น คุณต้องมีคอร์มากขึ้น หน่วยความจำใกล้กับคอร์เหล่านั้นมากขึ้น และมีความหน่วงต่ำ การเชื่อมต่อแบนด์วิดท์สูงระหว่างคอร์
นั่นคือเป้าหมายที่ชัดเจนสำหรับทุกคนในพื้นที่ AI แต่ด้วยการยอมรับของตัวเอง Cerebras ได้นำแนวคิดนี้ไปสู่เหตุผลสุดขั้ว ชิปขนาดใหญ่ให้พื้นที่ซิลิกอนมากขึ้นสำหรับคอร์โปรเซสเซอร์และหน่วยความจำที่ต้องการแนบชิดกัน และการเชื่อมต่อที่มีแบนด์วิดท์สูงและเวลาแฝงต่ำจะทำได้ก็ต่อเมื่อข้อมูลไม่ต้องปล่อยให้การเชื่อมต่อระหว่างกันที่สั้นและหนาแน่นบนชิป ดังนั้นหนึ่งชิปขนาดใหญ่