2023-03-17 07:03:42來源:中國青年報
凌晨4點,耿逸然和安博施的鬧鐘同時響起。一個小時后,第36屆神經(jīng)信息處理系統(tǒng)大會(NeurIPS2022)即將開始,作為大會中MyoChallenge挑戰(zhàn)賽骰子重定向(DieReorientation)賽道冠軍,這兩位來自北京大學(xué)信息科學(xué)技術(shù)學(xué)院2020級圖靈班的大三學(xué)生,即將迎來各自人生中首次在國際頂級會議上的亮相。
“還是很激動和緊張的?!?022年12月,該會議在美國舉辦。北京時間清晨5點,耿逸然和安博施線上參會,在15分鐘的全英文報告中,他們對參賽方案的完整闡釋,將來自世界各地的聽眾帶回2022年的夏天。
去年8月,兩人在導(dǎo)師的推薦下了解到,NeurIPS推出了一項比賽,要求參賽者設(shè)計一套人工智能算法,控制仿生靈巧手完成隨機(jī)的抓取、轉(zhuǎn)動骰子等任務(wù),最終成功率最高、需要肌肉施加力最小的團(tuán)隊獲勝。
(相關(guān)資料圖)
賽事通知讓他們立即興奮起來。兩人的導(dǎo)師、北京大學(xué)人工智能研究院助理教授、北京通用人工智能研究院研究員楊耀東和計算機(jī)學(xué)院前沿計算研究中心助理教授董豪長期從事機(jī)械臂和靈巧手的人工智能與環(huán)境交互研究,在這幾位老師的指導(dǎo)下,耿逸然和安博施也一直在學(xué)習(xí),如何在這一領(lǐng)域成為訓(xùn)練人工智能的“優(yōu)秀教師”。此外,他們在匯集頂級人工智能專家的北京通用人工智能研究院長期與許多優(yōu)秀研究員共同工作,積累了很多寶貴經(jīng)驗。用國際頂級人工智能會議的大賽檢驗自己,既是絕佳的練兵機(jī)會,也是展示學(xué)習(xí)所得的機(jī)會。
比賽發(fā)令槍響,耿逸然和安博施的“全速奔跑”開始了。和他們一起合作的,還有同樣來自北京通用人工智能研究院的大學(xué)生鐘伊凡、吉嘉銘、陳源培等。盡管他們對機(jī)械臂的人工智能控制已經(jīng)相對熟悉,但這次比賽中要面對的,是一只截然不同的“虛擬仿生手”。在電腦屏幕上的模擬器中,這只手“有血有肉”,銀灰色的手部骨骼外,覆蓋著由紅色線條表示的一束束肌肉,如同真正的手一樣,各個關(guān)節(jié)和每條肌肉密切聯(lián)動,“牽一發(fā)而動全身”,和常見的只能控制每個獨立關(guān)節(jié)的實體機(jī)械手相比,復(fù)雜程度多了不是一點半點。
花了大約一周時間熟悉仿生靈巧手的關(guān)節(jié)與肌肉之間的關(guān)系后,他們開始制訂培訓(xùn)這位人工智能“學(xué)生”的方案。抓取、轉(zhuǎn)動骰子,對仿生手來說相當(dāng)復(fù)雜,他們就將動作拆解,如同體操教練教學(xué)員完成一套復(fù)雜的轉(zhuǎn)體、曲體組合動作時,先教各個分解動作,再進(jìn)一步完成動作組合。如同水族館表演的海豚,通過獎勵塑造,人工智能在完成目標(biāo)動作時,一個相當(dāng)于小魚的獎勵函數(shù)會對它進(jìn)行“激勵”,以促進(jìn)其更好地“學(xué)習(xí)”。
這些聽起來簡單的操作,背后是無數(shù)爭分奪秒的努力。電腦隨身攜帶,耿逸然有時就趁著上課前的10分鐘,打開電腦修改代碼。每天面對黑色屏幕上一行行白色字母組成的代碼難免枯燥,但早上醒來打開頭天晚上訓(xùn)練的模型,一個好的實驗結(jié)果足以讓人雀躍?!斑@個過程就像開盲盒?!卑膊┦┙榻B,研發(fā)的過程沒有正確答案,一切都是摸著石頭過河,“前一天訓(xùn)練了10個模型,第二天跑完數(shù)據(jù)可能有8個結(jié)果一般、1個不好、還有1個非常好。每天都很期待,會有更多好的結(jié)果。”
仿生靈巧手轉(zhuǎn)動骰子示意圖。受訪者供圖憑著長期打下的基礎(chǔ)和比賽期間的用心,第一次上傳參賽代碼,他們就高居首位,隨著之后不斷調(diào)整方案,也一直處于領(lǐng)先。但就在接近比賽截止日期的一個凌晨4點,從睡夢中醒來的耿逸然突然發(fā)現(xiàn),有其他參賽者的成績超過了他們。他一下就清醒了,套上衣服就沖進(jìn)隔壁宿舍,搖醒了安博施。兩個眼睛還沒睜開的人大腦已經(jīng)無比清醒,迅速沖出宿舍,沖進(jìn)實驗室,緊鑼密鼓地開始調(diào)整方案。
10月末,比賽截止。在之后公布的結(jié)果中,在全球10多個國家的40個參賽隊伍提交的340余份有效方案中,他們的方案位居榜首。
在2022年末的學(xué)術(shù)會議召開前,耿逸然和安博施分工合作,為了他們共同的第一次英文學(xué)術(shù)報告反復(fù)推敲,擬定表述方式、寫下逐字稿、互相給對方試講,一直磨到凌晨3點。兩個小時后,他們的報告結(jié)束,一位來自瑞士的教授向安博施發(fā)出邀約:“你們的講述非常好,希望你可以考慮申請我的博士項目?!?/p>
2023年年初,兩位搭檔了一年多的伙伴再次合作,以共同第一作者的身份,在2023年國際機(jī)器人與自動化大會(ICRA2023)中,發(fā)表研究論文《基于端到端可操作性學(xué)習(xí)的機(jī)器人操縱框架》。“論文里介紹了我們探索出的機(jī)械臂抓取物件的方法?!北绕饏⒓颖荣悾粘5膶W(xué)術(shù)研究需要更加深入的方法探索,通過他們開發(fā)的這套方法,機(jī)械臂可以通過作用域物體的關(guān)鍵點,如柜子的拉手、鍋蓋的抓手等,實現(xiàn)拉開柜門、提起鍋蓋等操作。
但比賽的過程也對他們啟發(fā)頗多?!爸坝X得讓靈巧手轉(zhuǎn)動一個骰子很簡單,但這次比賽中使用的仿生靈巧手模擬了真實的骨骼和肌肉關(guān)系,我們發(fā)現(xiàn)動物的日常動作遠(yuǎn)比機(jī)械精細(xì)的多,且不說大腦,動物小腦中就不知有多少我們還沒發(fā)現(xiàn)的秘密?!彼麄冎溃胱屓斯ぶ悄軐崿F(xiàn)更精細(xì)的功能,一代代計算機(jī)人還有很長的路要走。
責(zé)任編輯:標(biāo)簽:
機(jī)械臂與靈巧手在虛擬環(huán)境和真實世界中進(jìn)行訓(xùn)練與測試。受訪者供圖凌晨4點,耿逸然和安博施的鬧鐘同時響...
中國青年報客戶端北京3月16日電(中青報·中青網(wǎng)見習(xí)記者郭可欣)“揉眼會造成眼表的損傷,尤其會影響我...
美國硅谷銀行(資料圖)海外網(wǎng)3月16日電據(jù)彭博社15日報道,因銀行危機(jī)帶給美國經(jīng)濟(jì)不確定性增加,高盛集...
中國日報網(wǎng)3月16日電綜合美國全國廣播公司(NBC)和《華盛頓郵報》(TheWashingtonPost)日前報道,一項...
中國日報網(wǎng)3月16日電進(jìn)入2023年以來,中國經(jīng)濟(jì)的加速恢復(fù)受到世界廣泛關(guān)注。彭博社14日報道稱,中國經(jīng)濟(jì)...