這種機器手有五個手指,每個手指都配備了先進的光學觸覺傳感器,能夠精確地定位接觸點,并覆蓋復雜的曲面。每個手指有三個獨立的關節(jié),可以靈活地調整姿態(tài)。為了測試機器手的靈巧性,研究人員選擇了一個難度很高的操縱任務:讓機器手在保持物體穩(wěn)定的同時,任意地旋轉物體。這個任務需要不斷地重新調整部分手指的位置,而其他手指則要固定物體。
令人驚訝的是,機器手不依賴任何視覺反饋,只根據觸覺傳感器和自身位置的數據完成了這個任務。這意味著機器手可以在非常差的光線條件下進行操作,甚至可以在黑暗中工作。研究人員表示,這種基于觸覺的靈巧性將為自動化操作在現實世界中開辟全新的應用場景,比如物流、材料處理、高級制造和裝配等領域。
為了讓機器手學會這種操縱技能,研究人員使用了一種叫做深度強化學習的方法,它可以讓機器人通過實踐來學習新的物理任務。研究人員還開發(fā)了一些新的算法來有效地探索可能的操縱策略。他們利用模擬器作為訓練場,在幾個小時內完成了相當于一年的練習。然后,他們將模擬器中訓練好的技能轉移到真實的機器手上,成功地實現了他們期望的靈巧性。
哥倫比亞大學的馬特伊・喬卡利教授說:“雖然我們展示的是一個概念驗證性質的任務,但我們相信這種靈巧性將為自動化操作在現實世界中帶來全新的可能性。一些更直接的用途可能是在物流和材料處理方面,幫助緩解近年來困擾我們經濟的供應鏈問題,在工廠中進行高級制造和裝配。”
喬卡利教授表示,機器人領域的最終目標是在家庭中實現輔助性的機器人,這是真正檢驗靈巧性的試金石。他說:“在這項研究中,我們展示了機器手也可以僅僅基于觸覺來實現高度靈巧性。一旦我們把視覺反饋和觸覺結合起來,我們希望能夠實現更高的靈巧性,有朝一日能夠接近復制人手的功能。”
喬卡利教授指出,一個在現實世界中有用的物理機器人需要同時具備抽象的語義智能(注:能夠概念性地理解世界的運作)和具身智能(能夠物理地與世界互動)。像 OpenAI 的 GPT-4 或谷歌的 PALM 這樣的大型語言模型旨在提供前者,而像這項研究中實現的操縱靈巧性則代表了后者的進步。例如,當被問到如何做三明治時,ChatGPT 會在回應中打出一個步驟清單,但是要真正做出三明治,就需要一個靈巧的機器人。同樣,研究人員希望物理技能高超的機器人能夠將語義智能從互聯(lián)網這個純虛擬的世界中帶出來,用于真實世界的物理任務上,甚至可能是在我們的家里。