誰不想要一個可完全承擔家務的機器人呢(ne)?這(zhè)也(yě)是人們對(duì)機器人技術發展的一大(dà)夢想。
圖片來(lái)源:《麻省理(lǐ)工(gōng)科技評論》
雖然機器人專家已經能(néng)夠讓機器人在實驗室做一些(xiē)像跑酷這(zhè)樣令人印象深刻的事(shì)情,但(dàn)這(zhè)都是在嚴格控制的環境中精心規劃展開(kāi)的。真要讓機器人在你(nǐ)家中自(zì)主工(gōng)作(zuò),多少還是讓人不太放(fàng)心,尤其是在有兒童和(hé)寵物的家庭。而且房屋設計(jì)各有不同,房間布置、物品擺放(fàng)更是千差萬别。
在機器人專家中,有一個被被廣爲認可的觀點,稱爲“莫拉維克悖論”:對(duì)人類來(lái)說很(hěn)難的事(shì)情,對(duì)機器來(lái)說很(hěn)容易;而對(duì)人類來(lái)說容易的事(shì)情,對(duì)機器來(lái)說很(hěn)難。但(dàn)得益于人工(gōng)智能(néng)(AI),這(zhè)種情況現(xiàn)在正在改變。機器人開(kāi)始能(néng)夠完成諸如疊衣物、烹饪和(hé)卸載購物籃等任務,而這(zhè)些(xiē)在不久前還被視(shì)爲機器人幾乎不可能(néng)完成的任務。
據最新一期《麻省理(lǐ)工(gōng)科技評論》報(bào)道(dào),機器人技術作(zuò)爲一個領域正處于拐點:機器人正在走出實驗室,進入千家萬戶。機器人技術即将迎來(lái)自(zì)己的高(gāo)光時(shí)刻。
家用(yòng)機器人不能(néng)太貴
過去的機器人就是昂貴的代名詞,高(gāo)度複雜(zá)款價格動辄數十萬美(měi)元,這(zhè)使得大(dà)多數家庭無法擁有它們。例如,PR2是家用(yòng)機器人最早的叠代産品之一,重200公斤,售價40萬美(měi)元。
幸好(hǎo),新一代更便宜的機器人漸漸出現(xiàn)了(le)。由美(měi)國初創公司Hello Robot開(kāi)發的一款新型家庭機器人Stretch 3,價格就合理(lǐ)得多,24950美(měi)元,重量爲24.5公斤。它有一個小(xiǎo)型移動底座,一根懸挂着攝像頭的搖杆,一個可調節手臂和(hé)一個末端帶有吸盤的夾具,并且可通過控制器進行操作(zuò)。
與此同時(shí),美(měi)國斯坦福大(dà)學研究團隊建立了(le)一個名爲Mobile ALOHA(低(dī)成本開(kāi)源硬件遠程操作(zuò))的系統,能(néng)讓機器人僅借助20個數據(包括人類演示)就學會(huì)烹饪蝦。團隊使用(yòng)現(xiàn)成組件建造出價格更合理(lǐ)的機器人,雖然也(yě)要數萬美(měi)元,但(dàn)之前的類似款動辄數十萬美(měi)元。
AI構建“通用(yòng)機器人大(dà)腦(nǎo)”
将這(zhè)批新機器人與“前輩”區(qū)分開(kāi)來(lái)的,其實是它們的軟件。由于AI繁榮發展,現(xiàn)在的技術焦點,正在從(cóng)昂貴機器人實現(xiàn)身體靈巧性轉向,轉變爲用(yòng)神經網絡構建“通用(yòng)機器人大(dà)腦(nǎo)”。
機器人專家正使用(yòng)深度學習和(hé)神經網絡來(lái)創建“大(dà)腦(nǎo)”系統,以便能(néng)在應用(yòng)中從(cóng)環境學習并相應調整機器人行爲,而不是像傳統的精心規劃和(hé)艱苦培訓。
2023年夏天,谷歌公司推出了(le)視(shì)覺—語言—行動模型RT-2。該模型能(néng)從(cóng)用(yòng)于訓練的在線文(wén)本和(hé)圖像以及它自(zì)己的交互中獲得對(duì)世界的一般理(lǐ)解,并把這(zhè)些(xiē)數據轉化爲機器人操作(zuò)。
豐田研究所、哥(gē)倫比亞大(dà)學和(hé)麻省理(lǐ)工(gōng)學院團隊已借助一種稱爲模仿學習的AI學習技術以及生成式AI,快(kuài)速教機器人完成許多新任務。該新方法将推動生成式AI技術從(cóng)文(wén)本、圖像和(hé)視(shì)頻領域擴展到(dào)機器人運動領域。
從(cóng)OpenAI現(xiàn)已關閉的機器人研究部門(mén)分拆出來(lái)的初創公司Covariant,則建立了(le)一個多模态模型RFM-1,可接受文(wén)本、圖像、視(shì)頻、機器人指令的提示。生成式AI讓機器人能(néng)理(lǐ)解指令并生成與這(zhè)些(xiē)任務相關的圖像或視(shì)頻。
更多數據催生更智能(néng)機器人
GPT-4等大(dà)型AI模型的力量,在于從(cóng)互聯網上(shàng)囤積大(dà)量數據,但(dàn)這(zhè)并不适用(yòng)于機器人,因爲機器人需要專門(mén)爲機器人收集的數據。它們需要實物演示如何打開(kāi)洗衣機和(hé)冰箱、拿起盤子或折疊衣物。現(xiàn)在,這(zhè)些(xiē)數據非常稀缺,收集也(yě)需要很(hěn)長時(shí)間。
谷歌深度思維公司發起了(le)一項名爲“開(kāi)源X-Embodiment協作(zuò)”的新計(jì)劃,旨在改變這(zhè)種狀況。去年,該公司與34個實驗室約150名研究人員合作(zuò),從(cóng)22種不同的機器人收集數據,包括Hello Robot的Stretch 3。由此産生的數據集于2023年10月發布,其中包括機器人的527種技能(néng),例如采摘、推動和(hé)移動等。
還有一種稱爲RT-X的機器人,研究人員專門(mén)爲其構建了(le)兩個版本的模型,既可在各個實驗室的計(jì)算(suàn)機上(shàng)本地運行,也(yě)可通過網絡訪問。
更大(dà)的、可通過網絡訪問的模型是用(yòng)互聯網數據預先訓練的,以從(cóng)大(dà)型語言和(hé)圖像模型中發展出“視(shì)覺常識”。研究人員在許多不同機器人上(shàng)運行RT-X模型時(shí),就會(huì)發現(xiàn),這(zhè)種機器人學習技能(néng)的成功率,比每個實驗室獨立開(kāi)發的系統高(gāo)出50%。
總言之,是更多數據,催生出了(le)更智能(néng)的機器人。