近日,OpenAI領(lǐng)投挪威人形機(jī)器人公司1X Technologies 2350萬美金。
據(jù)悉,1X公司原名為Halodi Robotics,成立于2014年,主要生產(chǎn)人形機(jī)器人,公司共有60多人。1X公司將用這筆資金來加大其即將推出的雙足機(jī)器人模型NEO的研發(fā)力度,以及在挪威和北美大規(guī)模生產(chǎn)其首款商用機(jī)器人EVE。
3月28日,追覓科技也在上海新品發(fā)布會(huì)上也推出了兩款機(jī)器人產(chǎn)品——通用人形機(jī)器人和仿生四足機(jī)器人Eame One二代。
當(dāng)日,機(jī)器人板塊反復(fù)活躍,人形機(jī)器人相關(guān)話題被大量討論。
要知道,人形機(jī)器人的夢(mèng),已經(jīng)做了近百年。
從1927年世界博覽會(huì)上展出“Televox”,到之后的日本豐田、本田和波士頓動(dòng)力,百年來“造人”的公司前赴后繼,但囿于人形機(jī)器人動(dòng)態(tài)平衡、運(yùn)動(dòng)規(guī)劃等技術(shù)難題和批量生產(chǎn)的困難,人形機(jī)器人的大規(guī)模落地始終還是個(gè)夢(mèng)。
那么,ChatGPT的加入,能為人形機(jī)器人夢(mèng)想的落地按下加速鍵嗎?
1、構(gòu)想:人形機(jī)器人有望更智能
事實(shí)上,當(dāng)前算法和數(shù)據(jù)規(guī)模的限制,在嚴(yán)重影響著人形機(jī)器人的智能程度。
通常而言,人工智能技術(shù)和應(yīng)用飛速發(fā)展要依賴三大要素:數(shù)據(jù)、算法和算力。
算法決定了人工智能的行為模式,一個(gè)人工智能系統(tǒng)即使有當(dāng)前最先進(jìn)的計(jì)算平臺(tái)作為支撐,若沒有配備有效的算法,人形機(jī)器人只會(huì)像一個(gè)四肢發(fā)達(dá)而頭腦簡(jiǎn)單的“人”。
因此,目前市面上很多人形機(jī)器人都只能在少量垂直應(yīng)用方向上接近或超越人類的智能表現(xiàn),在很多領(lǐng)域上都屬于“弱人工智能”,即不具獨(dú)立思考能力,就像各種語音助手。
它們的動(dòng)作僵硬,本身并沒有“智能”的成分,僅因?yàn)殚L(zhǎng)得像人,所以它們的“凝視”“走路”等簡(jiǎn)單動(dòng)作,都能帶給人無盡的遐想。
那么如何完成從“弱人工智能”向“強(qiáng)人工智能”的關(guān)鍵一躍?
ChatGPT提供了新的解題思路。
ChatGPT有著先進(jìn)的算力系統(tǒng)和強(qiáng)大的自然語言理解和溝通能力,數(shù)據(jù)顯示,ChatGPT的總算力消耗約為3640PF-days(即假如每秒計(jì)算一千萬億次,需要計(jì)算3640天)。
業(yè)內(nèi)不少人士認(rèn)為,ChatGPT的AI技術(shù)可以解決機(jī)器人的自主語音交互難題,為人形機(jī)器人注入“靈魂”。
1X公司也表示,希望通過人形機(jī)器人來實(shí)現(xiàn)ChatGPT在機(jī)器人領(lǐng)域應(yīng)用落地,解決過往機(jī)器人行業(yè)軟件端算法和數(shù)據(jù)能力落后的問題。
有行業(yè)專家表示,類似ChatGPT的AI大型語言模型,在長(zhǎng)期能更好地訓(xùn)練機(jī)器人學(xué)習(xí)算法和處理更復(fù)雜更大規(guī)模數(shù)據(jù)集的能力,而且有助于機(jī)器人理解人類語言、行為和環(huán)境,加速人形機(jī)器人在任務(wù)完成、自主學(xué)習(xí)、適應(yīng)能力、仿生體驗(yàn)等領(lǐng)域的進(jìn)化。
即“ChatGPT+人形機(jī)器人”將讓機(jī)器對(duì)人類意圖的理解有跨越式的質(zhì)變提升,人形機(jī)器人即將迎來新一輪“進(jìn)化”,有望帶來更大的市場(chǎng)增長(zhǎng)。
弗若斯特沙利文預(yù)測(cè),到2026年,全球人形機(jī)器人市場(chǎng)規(guī)模將達(dá)到80億美元;高盛預(yù)計(jì),到2035年,在藍(lán)海市場(chǎng)情景下,人形機(jī)器人市場(chǎng)能夠達(dá)到1540億美元的規(guī)模。
2、現(xiàn)實(shí):日常動(dòng)作的完成仍是難題
不過,回到現(xiàn)實(shí),即使解決了人形機(jī)器人的智能問題,也還有太多的技術(shù)瓶頸亟待突破。
人形機(jī)器人的構(gòu)架通常為:大電池組+電機(jī)驅(qū)動(dòng)+剛性金屬傳動(dòng)+串并聯(lián)關(guān)節(jié)分布+視/力/位傳感器。各部位的協(xié)調(diào)配合,保障了人形機(jī)器人日常動(dòng)作的流暢。
例如,人形機(jī)器人的下肢對(duì)力量、穩(wěn)定性和肢體動(dòng)作的連貫性有著很高的要求。要達(dá)到像人類一樣自然地走路,需要與激光雷達(dá)、配套傳感器、攝像頭以及算法配合。
但大部分人形機(jī)器人都難以解決這一難題。例如小米的鐵大CyberOne,步速為3.6km/h,實(shí)際上連老年人的平均步速都跟不上。
另外,在人形機(jī)器人的關(guān)節(jié)扭矩方面,與之緊密相關(guān)的是減速機(jī)和伺服電機(jī)等零部件。以減速機(jī)為例,機(jī)器人常用的是RV減速機(jī)和諧波減速機(jī)。RV減速機(jī)用于機(jī)器人的腿部、腰部和肘部等承重關(guān)節(jié);諧波減速機(jī)用于輕型、小型的末端部位,比如小臂和腕部。
然而,諧波減速機(jī)重量輕但扭矩有限,RV減速機(jī)扭矩大,但重量體積也較大。同樣,行星減速機(jī)、單極行星減速機(jī)、雙極行星減速機(jī)等也都面臨這樣的兩難抉擇,要想讓人形機(jī)器人達(dá)到人類關(guān)節(jié)的靈活程度,幾乎不可能。
此外,抓取與力感知能力的不足,也同樣使人形機(jī)器人在運(yùn)行時(shí)極不流暢。畢竟動(dòng)態(tài)的步行只是體現(xiàn)了機(jī)器人的移動(dòng)能力,而操作性能就直接決定了機(jī)器人能夠去做什么。
譬如“擎天柱”的每只手擁有11個(gè)精細(xì)的自由度,結(jié)合控制軟件,能完成像人手般復(fù)雜靈巧的操作,并能承擔(dān)大約9公斤的負(fù)重。追覓科技的人形機(jī)器人也擁有五指,而小米“鐵大”的手并沒有手指,它能開門、抓握,但碰到一些精細(xì)活兒,只能一籌莫展。
3、落地:商業(yè)應(yīng)用困局
持續(xù)困擾著人形機(jī)器人的,還有商業(yè)化難題。
此前哈工大推出的“HIT-III”機(jī)器人能上下斜坡、“匯童”機(jī)器人可完成“摔滾走爬”等動(dòng)作,優(yōu)必選的“Wallker”則能上、下臺(tái)階,目前已經(jīng)可以彈琴、倒水和步態(tài)行走。特斯拉的擎天柱還能澆花、此前本田的阿西莫具備跑、跳、爬樓梯甚至跳舞等功能。
特斯拉擎天柱機(jī)器人,圖源網(wǎng)絡(luò)
但哪怕“大佬”如本田和波士頓動(dòng)力,也沒有成功踏入商業(yè)化進(jìn)程,波士頓動(dòng)力更是幾度被收購(gòu)。
最根本的原因,是人形機(jī)器人太“貴”了,并且沒找準(zhǔn)適用場(chǎng)景的人形機(jī)器人,也顯得過于“不實(shí)用”。
本田的阿西莫機(jī)器人售價(jià)250萬美元,波士頓動(dòng)力的Atlas,單臺(tái)售價(jià)200萬美元,小米的CyberOne,成本約60—80萬人民幣。此前高工移動(dòng)機(jī)器人曾報(bào)道,業(yè)界一臺(tái)人形機(jī)器人的造價(jià)在10—15萬美元左右。
而宣布最終價(jià)格會(huì)控制在2萬美元以下的擎天柱,也限制了其采用性能更好的材料方案,例如扭矩更大的液壓驅(qū)動(dòng),新型的皮膚材料或合成的軟體肌肉。
追覓科技走的是另一條路子,據(jù)公開報(bào)道,追覓科技已實(shí)現(xiàn)對(duì)高速馬達(dá)的自動(dòng)化生產(chǎn),推動(dòng)供應(yīng)鏈國(guó)產(chǎn)化。這能在一定程度上控制成本,有助于大規(guī)模量產(chǎn)人形機(jī)器人。
不過商業(yè)的本質(zhì),最終還是回歸到落地上。人形機(jī)器人究竟適用于哪些場(chǎng)景?對(duì)比其他機(jī)器人,造價(jià)昂貴的人形機(jī)器人落地場(chǎng)景有何創(chuàng)新之處?
如今人形機(jī)器人的商業(yè)應(yīng)用場(chǎng)景主要以娛樂社交、陪伴看護(hù)等日常生活服務(wù)為主。同時(shí),機(jī)器人產(chǎn)業(yè)總體上被視為一些國(guó)家地區(qū)出生率下降和勞動(dòng)力萎縮的解決方案。但高昂的售價(jià)與極低的性價(jià)低意味著人形機(jī)器人尚且難以實(shí)現(xiàn)面向家庭場(chǎng)景的大規(guī)模普及。
本田曾嘗試讓阿西莫成為接待員,為IBM等幾家公司提供租賃服務(wù)。
但阿西莫每個(gè)月的租賃費(fèi)用高達(dá)1萬美元,比人類接待員的薪水高出一大截,而且只能做一些簡(jiǎn)單的肢體動(dòng)作,性價(jià)比極低,讓企業(yè)望而卻步。
即便用得起,阿西莫那些看似“豐富”的功能,在應(yīng)用場(chǎng)景也有太多限制:不能提拿重物、不能適應(yīng)復(fù)雜環(huán)境、續(xù)航不長(zhǎng),語音互動(dòng)不夠智能。
面對(duì)這個(gè)問題,馬斯克的思路是,第一批機(jī)器人主要在B端應(yīng)用,服務(wù)于危險(xiǎn)、無聊、重復(fù)的工作或人們不想做的工作;第二批大規(guī)模使用的機(jī)器人,讓機(jī)器人在現(xiàn)實(shí)世界中導(dǎo)航,無需指令也能做有用的事;第三批是預(yù)計(jì)不到10年后,人們可以在家里使用的機(jī)器人。
但規(guī)劃的另一面是,2022年特斯拉出原型機(jī),然后還要再花上一年時(shí)間去探索應(yīng)用場(chǎng)景。
夢(mèng)想的落地終究還需要更多的積累與鋪墊,要挖掘出人形機(jī)器人的獨(dú)特競(jìng)爭(zhēng)力,還需要更多時(shí)間與經(jīng)驗(yàn)的雙重作用。