當(dāng)特斯拉仍在為靈巧手的工程化與可靠性問(wèn)題所困,當(dāng)小鵬汽車(chē)公開(kāi)表示靈巧手因高成本與技術(shù)難度短期內(nèi)難以普及時(shí),整個(gè)行業(yè)都面臨一個(gè)共同難題:為何靈巧手?jǐn)?shù)量眾多,卻依然難以投入實(shí)際應(yīng)用?
許多產(chǎn)品不得不在性能、壽命與成本之間做出艱難取舍:要么為性能犧牲成本,成為實(shí)驗(yàn)室中的“奢侈品”;要么為成本妥協(xié)性能,淪為“精致的玩具”。
今天,我們將分享靈巧智能如何打造真正“有用的手”。

一、產(chǎn)業(yè)之問(wèn):為何靈巧手“遍地開(kāi)花”,頭部企業(yè)仍稱(chēng)“不實(shí)用”?
一些靈巧手品牌宣傳聲勢(shì)浩大,甚至號(hào)稱(chēng)占據(jù)全球80%市場(chǎng)份額,但真正的產(chǎn)業(yè)用戶(hù)為何遲遲不愿買(mǎi)單?答案簡(jiǎn)單而殘酷:因?yàn)樗鼈兯麄鳌⒀菔旧踔潦圪u(mài)的,往往并非產(chǎn)業(yè)真正需要且敢于使用的產(chǎn)品。
以下三個(gè)問(wèn)題,或許是它們不愿透露的真相:
1)靈巧手究竟是要替代“人手”,還是“工具”?
靈巧手的目標(biāo)并非二選一,而是在“替代人手”與“替代工具”之間找到平衡,其終極愿景是“替代人手”。
替代“人手”方向 追求復(fù)制人類(lèi)手部全部功能,實(shí)現(xiàn)在任何人類(lèi)工作環(huán)境中無(wú)縫替代,核心設(shè)計(jì)理念是極致的通用性與擬人化 ,典型代表為特斯拉Optimus GEN3的22自由度靈巧手。
替代“工具”方向 則主張“為何非要是手?解決問(wèn)題的是一系列專(zhuān)用工具”,其核心是在特定任務(wù)中追求高效、可靠與低成本 ,典型代表為特斯拉Optimus GEN1的6自由度靈巧手。
2)哪些場(chǎng)景真正需要靈巧手?
以汽車(chē)制造業(yè)為例,沖壓、焊接、噴涂等前序車(chē)間自動(dòng)化率可達(dá)90%甚至100%,但總裝車(chē)間仍依賴(lài)大量人工。這并非技術(shù)不足,而是由總裝工序特性、成本效益及人機(jī)優(yōu)勢(shì)對(duì)比共同決定。
總裝涉及成千上萬(wàn)零件的組裝,許多步驟需根據(jù)實(shí)際情況微調(diào)、對(duì)位、卡扣,遠(yuǎn)非簡(jiǎn)單的“抓取-放置”,涵蓋非標(biāo)準(zhǔn)化操作、精細(xì)操作及綜合感知決策等復(fù)雜需求。
類(lèi)似這樣的場(chǎng)景正是靈巧手的核心應(yīng)用點(diǎn)——狹窄空間的精細(xì)感知與微動(dòng)操作,需要手、感知與大腦的協(xié)同作業(yè)。
3)為何靈巧手必須與場(chǎng)景深度結(jié)合?
靈巧手的“靈巧”并非固有屬性,而是在特定環(huán)境與任務(wù)中通過(guò)物理交互涌現(xiàn)的能力 。脫離具體場(chǎng)景,靈巧手便失去存在的價(jià)值與意義。
首先,硬件設(shè)計(jì)由場(chǎng)景需求驅(qū)動(dòng) 。工業(yè)裝配可能僅需“三指手”完成抓取、插入等重復(fù)任務(wù),而彈鋼琴演奏則需要“五指”協(xié)同。
其次,控制算法的有效性高度依賴(lài)場(chǎng)景知識(shí) 。靈巧手控制極為復(fù)雜,其智能體現(xiàn)在算法上,而算法的效能完全取決于對(duì)場(chǎng)景的理解。未與場(chǎng)景結(jié)合的靈巧手僅能執(zhí)行預(yù)設(shè)軌跡,無(wú)法適應(yīng)微小變化;而與場(chǎng)景深度結(jié)合的靈巧手,通過(guò)視覺(jué)、力覺(jué)、觸覺(jué)等傳感器實(shí)時(shí)獲取信息,調(diào)整抓取力、姿態(tài)與手勢(shì),實(shí)現(xiàn)魯棒且柔順的操作。
最后,學(xué)習(xí)與訓(xùn)練數(shù)據(jù)源于場(chǎng)景 ,F(xiàn)代靈巧手控制日益依賴(lài)機(jī)器學(xué)習(xí)(尤其是強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí)),而模型性能?chē)?yán)重依賴(lài)于訓(xùn)練數(shù)據(jù)的質(zhì)量與廣度。
二、靈巧智能的解決方案:突破“不可能三角”,以操作的“力”為核心,打造“有用的手”
繩驅(qū)(腱繩傳動(dòng))被公認(rèn)為實(shí)現(xiàn)類(lèi)人靈巧手的理想路徑,國(guó)內(nèi)靈巧手企業(yè)眾多,空心杯電機(jī)與腱繩供應(yīng)鏈成熟,為何繩驅(qū)靈巧手廠(chǎng)商不足5家?答案簡(jiǎn)單而殘酷:繩驅(qū)手的設(shè)計(jì)難度、量產(chǎn)工藝與可靠性挑戰(zhàn)勸退了大多數(shù)玩家。

靈巧智能選擇以機(jī)械與控制的復(fù)雜性,換取本體結(jié)構(gòu)的輕量化與擬人化 ,并在此技術(shù)路徑上提出以下實(shí)踐:
1)硬件靈巧手:以“力”為核心,解決“用手難”問(wèn)題
靈巧智能繩驅(qū)靈巧手產(chǎn)品線(xiàn)涵蓋3款產(chǎn)品,分別面向不同客戶(hù)與場(chǎng)景:
通用版五指DexHand 021:首款量產(chǎn)繩驅(qū)五指靈巧手,面向科研、教育、數(shù)據(jù)采集、具身智能及生化等行業(yè)。通過(guò)130套模具實(shí)現(xiàn)741個(gè)零件的標(biāo)準(zhǔn)化生產(chǎn),確保產(chǎn)品公差一致性;配備主動(dòng)散熱系統(tǒng),支持長(zhǎng)時(shí)間使用;通過(guò)腱繩涂層與繩頭端子設(shè)計(jì),解決腱繩蠕變與干摩擦問(wèn)題。是目前唯一投入高頻數(shù)據(jù)采集應(yīng)用的高自由度繩驅(qū)靈巧手。
入門(mén)版三指DexHand 021S:視觸雙模、雙拇指構(gòu)型的三指靈巧手,適用于教育、具身智能、工業(yè)及農(nóng)業(yè)等場(chǎng)景。無(wú)需復(fù)雜模型驅(qū)動(dòng),通過(guò)雙拇指構(gòu)型(彎曲+旋轉(zhuǎn))實(shí)現(xiàn)約70%人手功能,結(jié)合掌心視覺(jué)與指尖觸覺(jué),擴(kuò)展多場(chǎng)景操作任務(wù),為入門(mén)用戶(hù)提供具身智能最優(yōu)選。
專(zhuān)業(yè)版腕手一體五指DexHand 021pro:具備雙繩雙向傳動(dòng)、全掌感知與端側(cè)算力的腕手一體五指靈巧手。通過(guò)“外力”觸覺(jué)感知 與“內(nèi)力”傳動(dòng)控制 ,不僅具備端側(cè)抓取規(guī)劃的智能化能力,更實(shí)現(xiàn)抓取控制的力控能力。
2)高質(zhì)量數(shù)據(jù):以“力”為核心,破解“數(shù)據(jù)稀疏性”難題
機(jī)器人具備三大智能:運(yùn)動(dòng)智能、交互智能與操作智能。交互智能核心在于利用大語(yǔ)言模型實(shí)現(xiàn)人機(jī)情感交互;運(yùn)動(dòng)智能核心是“非接觸” ,使機(jī)器人掌握平衡與協(xié)調(diào);而操作智能核心在于“接觸” ,不僅關(guān)乎手部狀態(tài)與被操作物體,更與手-物接觸關(guān)系,尤其是“接觸力”信息密切相關(guān)。
基于此,靈巧智能開(kāi)發(fā)兩款產(chǎn)品:
DexCap數(shù)據(jù)采集外骨骼:通過(guò)人類(lèi)“遙操作”示教機(jī)器人,在靈巧手與物體接觸時(shí),結(jié)合觸覺(jué)傳感器與指尖振動(dòng)力反饋,實(shí)現(xiàn)沉浸式操作與數(shù)據(jù)采集。
桌面手部動(dòng)捕與觸覺(jué)手套:旨在捕獲人類(lèi)操作數(shù)據(jù),包括主視角操作視頻、上肢(含手指)運(yùn)動(dòng)軌跡、被操作物體物理特性及手-物接觸力等多維度信息。今年9月底,靈巧智能重磅開(kāi)源DexCanvas數(shù)據(jù)集。
3)操作模型:以小參數(shù)量模型,逐步解決“手的操作”難題
手是人類(lèi)極為精妙的器官,既是感知外界的窗口,也是執(zhí)行動(dòng)作與實(shí)現(xiàn)交互的關(guān)鍵載體。從出生到十歲左右,人類(lèi)通過(guò)持續(xù)的手部互動(dòng),構(gòu)建“手—感知—大腦”協(xié)調(diào)的發(fā)育閉環(huán)。將此映射至靈巧手發(fā)展,可見(jiàn)其運(yùn)動(dòng)能力已高度逼近人手,但“腦力”——即認(rèn)知與決策能力——仍處于類(lèi)似人類(lèi)三歲階段,目前僅能實(shí)現(xiàn)有限抓握功能。

古人云“隔行如隔山”,又道“紙上得來(lái)終覺(jué)淺,絕知此事要躬行”,皆揭示“行業(yè)操作數(shù)據(jù)”與“知行合一”的深刻價(jià)值。與參數(shù)動(dòng)輒超過(guò)300億的大規(guī)模視覺(jué)語(yǔ)言模型不同,靈巧智能更聚焦于“Action”本身:
一方面,通過(guò)多維數(shù)據(jù)采集與高保真物理仿真增強(qiáng),構(gòu)建參數(shù)量為30億級(jí)的靈巧操作基礎(chǔ)模型;另一方面,與場(chǎng)景需求方深度協(xié)同,共建真實(shí)環(huán)境中的數(shù)據(jù)采集工廠(chǎng),在垂直場(chǎng)景中系統(tǒng)獲取操作數(shù)據(jù),訓(xùn)練高度適配的專(zhuān)用操作模型。
靈巧手正站在從“演示可行 ”到“應(yīng)用可用 ”的關(guān)鍵十字路口。破解困局之道,并非追求參數(shù)上的極致擬人,而在于回歸“有用”這一本質(zhì):通過(guò)硬件、數(shù)據(jù)與模型的深度融合,在真實(shí)的產(chǎn)業(yè)場(chǎng)景中,將無(wú)形的智能轉(zhuǎn)化為精準(zhǔn)可控的“操作力”。道雖遠(yuǎn),篤行可至;事雖巨,堅(jiān)為必成。我們堅(jiān)信,當(dāng)靈巧手能像人手一樣,在紛繁復(fù)雜的世界中可靠地完成一個(gè)又一個(gè)具體任務(wù)時(shí),它所觸及的,將不僅是冰冷的機(jī)器與零件,更是通用智能機(jī)器人與我們共同未來(lái)的大門(mén)。
(新媒體責(zé)編:wa123)
聲明:
1、凡本網(wǎng)注明“人民交通雜志”/人民交通網(wǎng),所有自采新聞(含圖片),如需授權(quán)轉(zhuǎn)載應(yīng)在授權(quán)范圍內(nèi)使用,并注明來(lái)源。
2、部分內(nèi)容轉(zhuǎn)自其他媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3、如因作品內(nèi)容、版權(quán)和其他問(wèn)題需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)?0日內(nèi)進(jìn)行。電話(huà):010-67683008
人民交通24小時(shí)值班手機(jī):17801261553 商務(wù)合作:010-67683008轉(zhuǎn)602
Copyright 人民交通雜志 All Rights Reserved 版權(quán)所有 復(fù)制必究 百度統(tǒng)計(jì) 地址:北京市豐臺(tái)區(qū)南三環(huán)東路6號(hào)A座四層
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證號(hào):京B2-20201704 本刊法律顧問(wèn):北京京師(蘭州)律師事務(wù)所 李大偉
京公網(wǎng)安備 11010602130064號(hào) 京ICP備18014261號(hào)-2 廣播電視節(jié)目制作經(jīng)營(yíng)許可證:(京)字第16597號(hào)