การแสดงจุดควอนตัมกราฟีนขั้นสูงสามารถนำไปสู่โซลิดสเตต Qubits ได้หรือไม่?
คอมพิวเตอร์ควอนตัมบางครั้งเรียกว่าจอกศักดิ์สิทธิ์ของการคำนวณ หรือบางทีศิลาอาถรรพ์แห่งการคำนวณอาจเป็นการอ้างอิงยุคกลางที่เหมาะสมอีกประการหนึ่งในการสืบเสาะที่แทบจะเป็นไปไม่ได้ ไม่ว่าในกรณีใด ในขณะที่บางชุดอ้างว่าพวกเขาประสบความสำเร็จในการสร้างต้นแบบคอมพิวเตอร์ควอนตัมที่มีนัยสำคัญพอสมควร แม้จะต้องเผชิญกับความสงสัยก็ตาม การสร้างคอมพิวเตอร์ควอนตัมที่สามารถคำนวณบางสิ่งที่เกินกว่าที่เด็กในโรงเรียนประถมสามารถพิสูจน์ได้นั้นยาก
ปัญหาพื้นฐานประการหนึ่งที่นักวิจัยเผชิญในการพัฒนาคอมพิวเตอร์ควอนตัมคือปัญหาในการทำให้คอมพิวเตอร์ดูแลรักษาควอนตัมบิต (หรือ qubits) มากกว่าสองสามตัว วิธีหนึ่งที่มีแนวโน้มมากกว่าที่จะได้เกินเจ็ด qubitsคือการใช้จุดควอนตัม
ตอนนี้นักวิจัยจากมหาวิทยาลัยอิลลินอยส์ซึ่งนำโดยนาเดีย เมสัน ได้นำรอยย่นใหม่มาสู่การวิจัยในสาขานี้ งานวิจัยซึ่งตีพิมพ์ครั้งแรกในวารสารNature Physicsกำลังมองหาสิ่งที่เกิดขึ้นเมื่อวัสดุนำไฟฟ้าปกติเช่นโลหะหรือกราฟีนถูกประกบระหว่างวัสดุตัวนำยิ่งยวดสองชนิดและสังเกตส่วนต่อประสานของวัสดุ
ในขณะที่มีการสังเกตก่อนหน้านี้ว่าโลหะปกติในกรณีเหล่านี้ใช้ลักษณะของวัสดุตัวนำยิ่งยวดเมื่อกระแสไหลผ่าน (กล่าวคือ มันจะผ่านคู่อิเล็กตรอนผ่านมันด้วยมากกว่าที่จะเป็นกระแสอิเล็กตรอนเดียว) นักวิจัยของรัฐอิลลินอยส์ การทำงานร่วมกับจุดควอนตัมของกราฟีนช่วยให้เข้าใจฟิสิกส์พื้นฐานได้ดีขึ้น: Andreev bound States (ABS)
จนถึงปัจจุบัน ABS ได้พิสูจน์แล้วว่ายากต่อการวัดและสังเกต ณ จุดนี้นักวิจัยได้พัฒนาวิธีการใหม่ในการแยก ABS แต่ละตัวโดยเชื่อมต่อโพรบกับจุดควอนตัมที่ทำจากกราฟีน เนื่องจากจุดควอนตัม พวกมันจำกัด ABS ที่ถูกจำกัดให้อยู่ในสถานะพลังงานที่ไม่ต่อเนื่อง ซึ่งทำให้นักวิจัยไม่เพียงแต่วัด ABS เท่านั้น แต่ยังจัดการพวกมันด้วย
“ก่อนหน้านี้ ไม่สามารถเข้าใจพื้นฐานของสิ่งที่กำลังส่งกระแส” เมสันกล่าว “การดูสถานะที่ถูกผูกไว้แต่ละรายการทำให้คุณสามารถเปลี่ยนพารามิเตอร์หนึ่งตัวและดูว่าโหมดหนึ่งเปลี่ยนไปอย่างไร คุณสามารถทำความเข้าใจอย่างเป็นระบบได้อย่างแท้จริง นอกจากนี้ยังช่วยให้คุณสามารถจัดการ ABS เพื่อใช้กับสิ่งต่าง ๆ ที่ไม่เคยทำมาก่อน “
ความสอดคล้องกันของวัสดุนาโนทั้งสอง กราฟีน และจุดควอนตัม ร่วมกับวัสดุตัวนำยิ่งยวดทำให้การค้นพบครั้งนี้เป็นไปได้
“นี่เป็นกรณีพิเศษที่เราพบบางสิ่งที่เราไม่สามารถค้นพบได้โดยไม่ต้องใช้องค์ประกอบที่แตกต่างกันทั้งหมด – หากไม่มีกราฟีนหรือตัวนำยิ่งยวดหรือจุดควอนตัมก็จะไม่ทำงาน ทั้งหมดนี้เป็นเรื่องจริง จำเป็นต้องเห็นสภาพที่ไม่ปกตินี้” เมสันกล่าว
ทรัพยากรการประมวลผลมหาศาลที่จำเป็นในการฝึกอบรมระบบปัญญาประดิษฐ์ที่ล้ำสมัยหมายความว่าบริษัทเทคโนโลยีที่มีส้นสูงกำลังทิ้งทีมวิชาการไว้ในผงธุลี แต่วิธีการใหม่สามารถช่วยปรับสมดุลของเครื่องชั่ง ทำให้นักวิทยาศาสตร์สามารถจัดการกับปัญหา AI ที่ทันสมัยบนคอมพิวเตอร์เครื่องเดียวได้
2018 รายงานจากOpenAIพบพลังการประมวลผลที่ใช้ในการฝึกอบรมที่มีประสิทธิภาพที่สุด AI จะเพิ่มขึ้นที่ก้าวอย่างรวดเร็วอย่างไม่น่าเชื่อ สองเท่าทุก 3.4เดือน วิธีการหนึ่งที่หิวกระหายข้อมูลมากที่สุดคือการเรียนรู้การเสริมแรงเชิงลึก ซึ่ง AI เรียนรู้ผ่านการลองผิดลองถูกโดยทำซ้ำผ่านการจำลองหลายล้านครั้ง ความก้าวหน้าล่าสุดที่น่าประทับใจใน วิดีโอเกมอย่าง Starcraft และ Dota2 นั้นอาศัยเซิร์ฟเวอร์ที่อัดแน่นไปด้วยซีพียูและ GPU หลายร้อยตัว
ฮาร์ดแวร์เฉพาะทาง เช่น Wafer Scale Engine ของ Cerebras System สัญญาว่าจะแทนที่ชั้นวางโปรเซสเซอร์เหล่านี้ด้วยชิปขนาดใหญ่เพียงตัวเดียวที่ปรับให้เหมาะสมที่สุดสำหรับการฝึกอบรม AI แต่ด้วยป้ายราคาที่พุ่งเข้าหาคนนับล้าน จึงไม่เป็นการปลอบใจนักสำหรับนักวิจัยที่ไม่ได้รับทุนสนับสนุนมากนัก
ตอนนี้ ทีมงานจากUniversity of Southern CaliforniaและIntel Labsได้สร้างวิธีการฝึกอัลกอริธึม Deep Reinforcement Learning (RL) บนฮาร์ดแวร์ที่หาได้ทั่วไปในห้องปฏิบัติการทางวิชาการ ใน บทความที่ นำเสนอในการประชุมนานาชาติด้านการเรียนรู้ของเครื่อง (ICML) ปี2020 ในสัปดาห์นี้ พวกเขาอธิบายว่าพวกเขาสามารถใช้เวิร์กสเตชันระดับไฮเอนด์เพียงเครื่องเดียวเพื่อฝึก AI ด้วยประสิทธิภาพอันล้ำสมัยในการยิงมุมมองบุคคลที่หนึ่งได้อย่างไร วิดีโอเกมDoom พวกเขายังจัดการกับความท้าทาย 3D ที่หลากหลาย 30 ชุดที่สร้างโดยDeepMindโดยใช้พลังประมวลผลเพียงเล็กน้อย
Peter Stoneศาสตราจารย์แห่งมหาวิทยาลัยเท็กซัสในออสตินที่เชี่ยวชาญด้าน RL ระดับลึกกล่าวว่า “การคิดค้นวิธีการทำ RL อย่างลึกซึ้งบนฮาร์ดแวร์สินค้าโภคภัณฑ์เป็นเป้าหมายการวิจัยที่ยอดเยี่ยม นอกจากการละทิ้งกลุ่มวิจัยเล็กๆ ไว้เบื้องหลังแล้ว ทรัพยากรการประมวลผลตามปกติที่จำเป็นในการดำเนินการวิจัยประเภทนี้ยังมีการปล่อยก๊าซคาร์บอนไดออกไซด์อย่างมีนัยสำคัญอีกด้วย เขากล่าวเสริม “ความก้าวหน้าใดๆ ในการทำให้ RL เป็นประชาธิปไตยและลดความต้องการพลังงานในการทำวิจัยเป็นขั้นตอนในทิศทางที่ถูกต้อง” เขากล่าว
แรงบันดาลใจสำหรับโครงการนี้คือกรณีคลาสสิกของความจำเป็นในการเป็นมารดาของการประดิษฐ์Aleksei Petrenkoผู้เขียนนำ ซึ่งเป็นนักศึกษาระดับบัณฑิตศึกษาของ USC กล่าว เมื่อการฝึกงานภาคฤดูร้อนที่ Intel สิ้นสุดลง Petrenko สูญเสียการเข้าถึงคลัสเตอร์ซูเปอร์คอมพิวเตอร์ของบริษัท ซึ่งทำให้โครงการ RL ระดับลึกที่ยังไม่เสร็จตกอยู่ในอันตราย ดังนั้นเขาและเพื่อนร่วมงานจึงตัดสินใจหาวิธีทำงานต่อในระบบที่ง่ายกว่านี้ต่อไป
การใช้เครื่องเดียวที่มี CPU 36 คอร์และ GPU หนึ่งเครื่อง นักวิจัยสามารถประมวลผลได้ประมาณ 140,000 เฟรมต่อวินาทีขณะฝึกอบรมเกี่ยวกับวิดีโอเกม Atari และ Doom หรือเพิ่มเป็นสองเท่าของวิธีที่ดีที่สุดถัดไป
“จากประสบการณ์ของผม นักวิจัยจำนวนมากไม่สามารถเข้าถึงฮาร์ดแวร์ล้ำสมัยและล้ำสมัยได้” Petrenko กล่าว “เราตระหนักดีว่าเพียงแค่คิดใหม่ในแง่ของการใช้ฮาร์ดแวร์ให้เกิดประโยชน์สูงสุด คุณก็สามารถเข้าถึงประสิทธิภาพได้อย่างแท้จริง ซึ่งโดยปกติแล้วจะบีบออกจากคลัสเตอร์ขนาดใหญ่แม้ในเวิร์กสเตชันเครื่องเดียว”
แนวทางชั้นนำใน Deep RL วางตัวแทน AI ในสภาพแวดล้อมจำลองที่ให้รางวัลสำหรับการบรรลุเป้าหมายบางอย่าง ซึ่งตัวแทนใช้เป็นข้อเสนอแนะเพื่อกำหนดกลยุทธ์ที่ดีที่สุด สิ่งนี้เกี่ยวข้องกับงานคำนวณหลักสามงาน: การจำลองสภาพแวดล้อมและตัวแทน ตัดสินใจว่าจะทำอย่างไรต่อไปตามกฎที่เรียกว่านโยบาย และนำผลการดำเนินการดังกล่าวมาปรับปรุงนโยบาย
การฝึกอบรมมักถูกจำกัดด้วยกระบวนการที่ช้าที่สุด Petrenko กล่าว แต่งานทั้งสามนี้มักจะเกี่ยวพันกันในแนวทาง RL ระดับลึกมาตรฐาน ทำให้ยากต่อการปรับให้เหมาะสมทีละรายการ แนวทางใหม่ของนักวิจัยที่เรียกว่าSample Factoryได้แยกพวกเขาออกเพื่อให้สามารถทุ่มเททรัพยากรเพื่อให้พวกเขาทั้งหมดทำงานด้วยความเร็วสูงสุด
ข้อมูลการวางท่อระหว่างกระบวนการถือเป็นปัญหาคอขวดที่สำคัญอีกประการหนึ่ง เนื่องจากข้อมูลเหล่านี้มักจะแพร่กระจายไปยังหลายเครื่องได้ Petrenko อธิบาย กลุ่มของเขาใช้ประโยชน์จากการทำงานบนเครื่องเดียวโดยเพียงแค่อัดข้อมูลทั้งหมดลงในหน่วยความจำที่ใช้ร่วมกัน ซึ่งกระบวนการทั้งหมดสามารถเข้าถึงได้ทันที
ส่งผลให้มีการเร่งความเร็วอย่างมีนัยสำคัญเมื่อเทียบกับแนวทาง RL เชิงลึกชั้นนำ การใช้เครื่องเดียวที่มี CPU 36 คอร์และ GPU หนึ่งเครื่อง นักวิจัยสามารถประมวลผลได้ประมาณ 140,000 เฟรมต่อวินาทีขณะฝึกอบรมเกี่ยวกับวิดีโอเกม Atari และ Doom หรือเพิ่มเป็นสองเท่าของวิธีที่ดีที่สุดถัดไป ในสภาพแวดล้อมการฝึกอบรม 3D DeepMind Labพวกเขาโอเวอร์คล็อก 40,000 เฟรมต่อวินาที ดีกว่าอันดับที่สองประมาณ 15 เปอร์เซ็นต์
ในการตรวจสอบว่าอัตราเฟรมแปลเป็นเวลาการฝึกอบรมอย่างไร ทีมงานได้ทดสอบ Sample Factory กับ อัลกอริธึมของ Google Brain ที่โอเพ่นซอร์สในเดือนมีนาคม ซึ่งออกแบบมาเพื่อเพิ่มประสิทธิภาพ RL ในเชิงลึกอย่างมาก Sample Factory ฝึกฝนงานง่ายๆ สองงานใน Doom โดยใช้เวลาหนึ่งในสี่ของอัลกอริธึมอื่น ทีมงานยังได้ทดสอบแนวทางของพวกเขากับความท้าทาย 30 ประการใน DeepMind Lab โดยใช้เครื่อง 4-GPU 36 คอร์ที่มีประสิทธิภาพยิ่งขึ้น ผลลัพธ์ AI นั้นมีประสิทธิภาพเหนือกว่า AI ดั้งเดิมที่ DeepMind ใช้เพื่อจัดการกับความท้าทายอย่างมีนัยสำคัญ ซึ่งได้รับการฝึกฝนบนคลัสเตอร์การประมวลผลขนาดใหญ่
Edward Beechingนักศึกษาระดับบัณฑิตศึกษาที่ทำงานเกี่ยวกับ RL ระดับลึกที่ Institut National des Sciences Appliquées de Lyon ในฝรั่งเศส กล่าวว่าวิธีการนี้อาจต่อสู้กับความท้าทายที่ต้องใช้หน่วยความจำมาก เช่นHabitatจำลองภาพ 3 มิติ ที่ เผยแพร่โดย Facebook เมื่อปีที่แล้ว
แต่เขาเสริมว่าวิธีการฝึกอบรมที่มีประสิทธิภาพเหล่านี้มีความสำคัญอย่างยิ่งต่อทีมวิจัยขนาดเล็ก “การเพิ่มขึ้นสี่เท่าเมื่อเทียบกับการใช้งานที่ทันสมัยนั้นยิ่งใหญ่มาก” เขากล่าว “ซึ่งหมายความว่าในเวลาเดียวกัน คุณสามารถเรียกใช้การทดสอบได้มากเป็นสี่เท่า”
ในขณะที่คอมพิวเตอร์ที่ใช้ในรายงานยังคงเป็นเวิร์กสเตชันระดับไฮเอนด์ที่ออกแบบมาสำหรับการวิจัย AI แต่ Petrenko กล่าวว่าเขาและผู้ทำงานร่วมกันได้ใช้ Sample Factory บนอุปกรณ์ที่ง่ายกว่ามาก เขายังสามารถทำการทดลอง RLขั้นสูง ในแล็ปท็อปสำหรับเล่นเกมระดับกลางได้อีกด้วย เขากล่าว “อันนี้ไม่เคยได้ยิน”
ที่งานDARPA Electronics Resurgence Initiative Summitวันนี้ที่เมืองดีทรอยต์ Intel วางแผนที่จะเปิดตัวระบบneuromorphic ที่มีเซลล์ประสาท 8 ล้านเซลล์ซึ่งประกอบด้วยชิปวิจัย64 ชิปLoihiซึ่งมีชื่อรหัสว่า Pohoiki Beach ชิป Loihi ถูกสร้างขึ้นด้วยสถาปัตยกรรมที่ใกล้ชิดมากขึ้นตรงกับวิธีที่การทำงานของสมองกว่าชิปทำออกแบบมาเพื่อทำการเรียนรู้ลึกหรือรูปแบบอื่น ๆ ของเอไอ สำหรับชุดของปัญหาที่ “โครงข่ายประสาทเทียม” นั้นทำได้ดีเป็นพิเศษ Loihi นั้นเร็วกว่า CPU ประมาณ 1,000 เท่า และประหยัดพลังงาน 10,000 เท่า ระบบ 64-Loihi ใหม่แสดงถึงเซลล์ประสาท 8 ล้านเซลล์ แต่นั่นเป็นเพียงขั้นตอนสู่ระบบ 768 ชิป 100 ล้านเซลล์ประสาทที่ บริษัท วางแผนไว้สำหรับสิ้นปี 2562
Intel และพันธมิตรด้านการวิจัยกำลังเริ่มทดสอบว่าระบบประสาทขนาดใหญ่เช่น Pohoiki Beach สามารถทำอะไรได้บ้าง แต่จนถึงขณะนี้หลักฐานชี้ให้เห็นถึงประสิทธิภาพและประสิทธิภาพที่มากขึ้นMike Davies ผู้อำนวยการฝ่ายวิจัยเกี่ยวกับระบบประสาทของ Intelกล่าว
“เรากำลังรวบรวมผลลัพธ์และข้อมูลอย่างรวดเร็วซึ่งมีประโยชน์แน่นอน… ส่วนใหญ่อยู่ในขอบเขตของประสิทธิภาพ แทบทุกอันที่เราเปรียบเทียบ … เราพบว่ามีกำไรที่สำคัญในสถาปัตยกรรมนี้” เขากล่าว
การเปลี่ยนจาก Loihi ตัวเดียวเป็น 64 ตัวเป็นปัญหาซอฟต์แวร์มากกว่าฮาร์ดแวร์ “เราออกแบบความสามารถในการปรับขนาดในชิป Loihi ตั้งแต่ต้น” เดวีส์กล่าว “ชิปมีอินเทอร์เฟซการกำหนดเส้นทางแบบลำดับชั้น…ซึ่งช่วยให้เราขยายได้ถึง 16,000 ชิป ดังนั้น 64 เป็นเพียงขั้นตอนต่อไป”
การค้นหาอัลกอริธึมที่ทำงานได้ดีบนระบบเซลล์ประสาท 8 ล้านเซลล์และการเพิ่มประสิทธิภาพอัลกอริธึมเหล่านั้นในซอฟต์แวร์นั้นเป็นความพยายามอย่างมาก เขากล่าว ถึงกระนั้นผลตอบแทนก็อาจมีมหาศาล โครงข่ายประสาทเทียมที่คล้ายกับสมองมากกว่า เช่น Loihi อาจมีภูมิคุ้มกันต่อปัญญาประดิษฐ์บางตัว เนื่องจากขาดคำพูดที่ดีกว่า ความโง่เขลา
ตัวอย่างเช่น โครงข่ายประสาทในปัจจุบันประสบกับสิ่งที่เรียกว่าการลืมอย่างหายนะ หากคุณพยายามสอนโครงข่ายประสาทที่ได้รับการฝึกฝนให้รู้จักสิ่งใหม่ เช่น ป้ายบอกทางใหม่ โดยเพียงแค่เปิดเผยเครือข่ายไปยังอินพุตใหม่ ก็จะรบกวนเครือข่ายมากจนไม่สามารถจดจำสิ่งใดๆ ได้ เพื่อหลีกเลี่ยงปัญหานี้ คุณต้องฝึกเครือข่ายใหม่ทั้งหมดตั้งแต่ต้น (โปรแกรมLifelong Learning หรือ L2M ของ DARPA ทุ่มเทให้กับการแก้ปัญหานี้ )
(นี่คือการเปรียบเทียบที่ฉันชอบที่สุด: สมมติว่าคุณเป็นโค้ชทีมบาสเก็ตบอล และคุณยกตาข่ายขึ้น 30 เซนติเมตรโดยที่ไม่มีใครมองอยู่ ตอนแรกผู้เล่นอาจจะพลาดไปหลายคน แต่พวกเขาจะคิดออกอย่างรวดเร็ว ถ้าผู้เล่นเหล่านั้นเป็นเหมือนวันนี้ โครงข่ายประสาทเทียม คุณจะต้องดึงมันออกจากสนามและสอนพวกเขาทั้งเกมอีกครั้ง—เลี้ยงบอล, ส่งบอล, ทุกอย่าง)