Figure AI:
從美國專利看人形機器人的關鍵技術布局

這篇文章以截至2026年4月30日公開/公告的Figure AI美國專利資料作為觀察樣本,從人形本體、靈巧手、頭部感知、致動器與傳動、資料收集、AI控制模型與部署情境等面向,觀察Figure AI如何把人形機器人從單一零組件推進到整機平台布局。

重點摘要

Figure AI的專利組合值得觀察,核心在於其技術主題並非停留在單一手臂、單一夾爪或單一AI模型,而是反覆圍繞「人形機器人」、「雙足機器人」、「軀幹」、「頭部」、「腰部」、「手臂」、「末端夾爪」、「拇指」、「指組件」、「感測器」、「自然語言指令」與「雙足動作模型」展開,共同描繪出一個具有人類身形、能在真實環境中移動、觀察、抓取、接受語言指令並執行任務的整機系統。

從48筆專利摘要歸納,Figure AI的專利布局大致可分為六個面向:第一,靈巧手與欠驅動末端夾爪;第二,人形本體、腰部、軀幹與頭部外殼;第三,高扭矩致動器、傳動、肌腱、線束與過載保護;第四,頭部攝影機、感測器、照明與觸覺感測;第五,結合自然語言、視覺與動作輸出的AI控制模型;第六,資料收集、停靠支撐與商業部署。這些面向合在一起,才構成「人形機器人」的專利版圖。

小結:Figure AI正在圍繞人形整機做多層次布局,從手指連桿、拇指齒輪、腕部肌腱、髖膝軸、腰部脊柱角度、頭部感測器配置,到VLA/BAM類型的層級式動作模型與安全逆向運動學,皆呈現出將硬體本體與AI控制共同保護的方向。

22
靈巧手/末端夾爪
16
本體結構/軀幹頭部
18
致動器/傳動線束
17
感知/校正
17
AI控制/任務規劃
3
部署/商業化

一、Figure AI是誰?為什麼它被視為人形機器人獨角獸

Figure AI的市場定位,與傳統自動化設備公司不同:它以通用型人形機器人為核心敘事,並試圖把AI能力延伸到真實世界任務。

Figure AI官方將Figure 03描述為「general purpose humanoid robot」,並將Helix稱為支撐Figure 03理解與執行任務的AI能力。公開資訊顯示,Figure 03被設計成可處理家務與日常任務的通用型人形機器人,並標示身高、載重、重量、續航、速度與電動系統等整機規格。這種定位使Figure AI不只是機械零組件公司,而是試圖把機械本體、感知、動作控制、語言理解與部署場景整合成一個可規模化產品的平台公司。

它被稱為獨角獸,主要來自資本市場對「Physical AI」的想像。Figure AI於2025年宣布Series C承諾資本超過10億美元,投後估值達390億美元;同日Reuters也報導其估值由前一輪約26億美元大幅上升。這種估值背後的核心假設,是人形機器人若能進入家庭、倉儲、製造與服務場景,將可能把AI從純軟體介面延伸到真實世界勞動。

不過,專利分析必須和募資敘事分開。募資新聞能說明市場為何重視Figure AI,但真正要理解技術布局,仍要回到專利摘要本身。本資料集顯示,Figure AI不是只在抽象地談「AI機器人」,而是同時申請了手部欠驅動結構、頭部感測器配置、腰部和脊柱幾何、扭矩保護、線束穿越致動器、資料收集裝置與層級式雙足動作模型等具體技術。這些內容讓Figure AI更像是一家整合機械本體、感知、控制與AI模型的人形機器人平台公司。

二、技術布局一:靈巧手、拇指與欠驅動末端夾爪

不是普通夾爪,而是往「可操作日常物件」靠近

Figure AI多件專利集中在指組件、拇指組件與欠驅動末端夾爪。US20250205908A1描述可拆卸連接至框架的指組件,包含蝸桿驅動連桿、近端驅動連桿、近端連桿、中節連桿與中節驅動連桿。US20250214259A1則描述人形機器人的欠驅動末端夾爪,包含可拆卸的指夾組件與拇指組件,並對拇指馬達軸心與齒輪軸心的平行配置提出設計。這些摘要顯示Figure AI不是只把工業夾爪裝到機器人手臂末端,而是在設計更像手部的多連桿、多狀態末端操作機構。

US20250375897A1與US20250375905A1進一步涉及第一馬達、第二馬達、屈曲齒輪、夾持齒輪、掌腕關節、近端指關節與遠端指關節,使指部或拇指能在過伸、彎曲、未旋轉與旋轉狀態之間移動。這類布局的價值在於,人形機器人若要處理日常物件,不能只靠二指夾爪做開合,還需要更細緻的拇指對掌、抓取姿態與接觸感知。

接觸與觸覺是人形操作的重要補強

US20260102903A1與US20260102926A1將雙足機器人的軀幹、頭部、手臂組件、末端夾爪、拇指組件、第一指組件與視覺感測器連在一起,並提到偵測物體與拇指或指組件之間的接觸資訊。US20260091509A1則涉及應變規與觸覺感測器組件,用於接收外部力並產生處理後資料。這些摘要說明Figure AI手部布局的重點不只是「讓手指會動」,也包括「知道自己是否碰到物體、碰到哪裡、力如何傳遞」。

這些手部相關專利的共同重點,是把抓取能力拆成可替換指組件、拇指自由度、欠驅動機構、接觸偵測與觸覺感測等多個層次。對人形機器人而言,手部不是附屬零件,而是連接AI決策與實體世界物件的關鍵介面。

三、技術布局二:人形本體、腰部、脊柱與頭部外殼

人形機器人的本體設計,決定了它能否在以人為尺度設計的空間中移動與互動。US20250242500A1直接描述包含下半部與上半部的人形機器人,其中上半部包含軀幹、頭部、左右肩、左右臂與左右末端致動器,且上半部包含至少65%的自由度;該案還提到覆蓋不同關節範圍的撓性覆蓋件。這類專利把自由度、關節覆蓋與人形外觀/保護納入整機設計,顯示Figure AI關注的不只是單一可動部件,而是整台機器人的可用性與安全性。

US20250312911A1描述腰部結構,包含軀幹扭轉致動器、軀幹傾斜致動器與脊柱支撐組件,並在中立位置時定義軀幹扭轉軸與軀幹傾斜軸之間的脊柱角度。US12583126B2則描述中央區域包含俯仰、滾轉、偏航等軸向,使上部區域相對於下部區域具有較廣泛的運動範圍。US12611766B2進一步涉及髖屈軸、膝蓋軸與致動器扭矩關係,並描述中央部分的運動學架構。這些摘要共同指向一件事:Figure AI重視的是「整個人形身體如何協調移動」,也就是讓軀幹、腰部、下肢與上肢在任務中形成穩定的整體。

頭部外殼與照明也形成一個小型專利群。US12365094B2、US12403611B2、US12447628B1與US12466080B2分別涉及頭部照明、前殼弧長關係、頭部光源與外殼幾何。這些設計看似偏外觀或結構,但在人形機器人上具有安全、感知、互動與產品化意義。人形機器人在公共或家庭環境中工作,頭部不只是保護感測器的外殼,也可能是人機互動、方向提示與社會接受度的一部分。

四、技術布局三:致動器、傳動、線束與過載保護

人形機器人的機械難度,很多時候藏在致動器與線束裡。US20260008178A1描述扭矩額定值大於70 N-m的致動器,並判斷致動器旋轉軸是否偏移;US20260077481A1描述具有特定扭矩額定值範圍的致動器馬達。這些摘要顯示,Figure AI關注的不只是「關節能轉」,也在定義人形機器人關節所需的扭矩與幾何配置。

US20260070216A1涉及齒輪箱、輸出環、外體、內體、離合器摩擦片與液壓壓力機構,當扭矩超過預定值時使離合器摩擦片滑動,以避免齒輪箱承受過大旋轉扭矩而損壞。這對人形機器人尤其重要,因為雙足移動、搬運、跌倒、碰撞或被外力干擾時,關節與傳動系統可能承受突發負載。過載保護不是亮眼的AI功能,但它是讓機器人能在真實環境中長時間運作的基礎。

線束也是Figure AI專利中反覆出現的工程問題。US20250367837A1、US20260054369A1與US20260054379A1均涉及第一、第二致動器與線束,包含線束延伸通過致動器開口、線束不同部分具有不同形狀、線束連接至PCB終端等配置。人形機器人有大量關節、感測器、致動器與控制板,若線束沒有良好路徑,容易受到拉扯、磨耗、干涉或維修困難影響。從專利角度看,這說明Figure AI布局不只在演算法,也在量產與可靠性所需的整機工程細節。

五、技術布局四:頭部視覺、感測器配置與自我校正

多件專利摘要聚焦在頭部感測器的位置、視線與外殼遮蔽。US20250387919A1描述雙足機器人頭部外殼內第一與第二攝影機的配置,以及其延伸範圍相對於橫向面的相對位置。US20260014710A1描述第一攝影機位於頭部外殼內、位於第一外殼後方且顯示器下方,並定義攝影範圍相對於矢狀面與橫切面的關係。US20260027736A1則提到第一與第二感測器具有大致平行的視線,且不耦合至單一PCB;中間蓋與護罩的開口可對齊感測器並遮蔽部分感測器。US20260042224A1同樣描述顯示器上方與下方的第一、第二感測器,以及鏡頭沿矢狀面對齊的配置。

這些專利的價值在於,它們把「機器人看世界」轉化為非常具體的機構與幾何問題。攝影機不只是裝在頭上即可,還要考慮視線方向、外殼遮蔽、鏡頭與顯示器的相對位置、感測器是否共用PCB、以及中性狀態頭部朝前時的視野配置。對人形機器人而言,頭部感測器相當於眼睛與部分互動介面,其穩定性會影響導航、抓取、避障與人機互動。

另外,US20260084309A1與US20260084314A1將視覺資料用於運動學偏差修正與機器人零件偵測。前者描述控制人類型機器人執行預定姿勢後,利用影像感測器捕捉資料,並由雙足空間感知模型判斷修正後的運動學偏差值;後者則透過多個影像感測器與雙足空間感知模型,偵測影像資料中的機器人零件並計算三維位置與方向。這讓Figure AI的感知布局不只是對外看物體,也包括對內校正自己的身體狀態。這種「自我感知」能力,對多自由度人形機器人非常關鍵。

六、技術布局五:AI控制、雙足動作模型與任務規劃

Figure AI最具辨識度的專利群之一,是把自然語言、視覺觀察與機器人動作結合的AI控制模型。US20260070221A1描述包含alpha模型與beta模型的雙足動作模型,其中alpha模型基於視覺觀察與語言指令產生上下文嵌入,並使用參數超過十億的視覺語言模型;beta模型則基於上下文嵌入,以高於alpha模型的頻率運作並使用較少參數,產生用於人形機器人的指令。這個設計重點在於把高階理解與低階控制頻率分開,讓大模型負責語義與情境,小模型或反應層負責較高頻率的動作輸出。

US20260097492A1進一步描述以多模態輸入資料,包括視覺資料與自然語言指令,透過包含Alpha模型與Beta模型的層級式雙足動作模型處理,產生任務目標的語義註釋與指定機器人動作的運動指令註釋。US12578733B2也提到alpha模型與beta模型分別部署在第一與第二GPU上,接收自然語言指令並產生控制雙足機器人的輸出資料。US12605824B2則涉及轉換器基礎的第一AI演算法與第二AI演算法之間的資料傳遞,用於控制左腕程度。這些摘要說明Figure AI並非只把Chatbot接到機器人,而是嘗試把多模態理解、分層運動模型與機器人控制頻率整合。

在任務規劃與安全控制上,US20260070212A1與US12611767B2都描述識別機器人任務、建立安全相關限制、建構幻象逆向運動學任務,並把任務、安全限制與逆向運動學整合求解,以取得目標關節參數。US20260061611A1則描述從最高優先級的無狀態控制器開始,選擇預定義操作域包含當前狀態的控制器,且只執行該選定控制器以確保穩定性。這些技術對人形機器人很重要,因為一個會走、會伸手、會抓取的系統,必須在完成任務的同時避免失衡、碰撞、關節超限或不安全姿態。

資料收集也被納入專利布局。US20260070211A1描述固定於操作者軀幹的可穿戴式資料收集設備,包含鉸接式手臂、手套、關節感測器與手部位置感測器,可追蹤至少六個自由度的鉸接式手臂與手套至少一個自由度。US20260091507A1則描述偵測操作員手指移動,並透過可撓性連接件的彎曲反映手指屈伸。這代表Figure AI不只申請機器人本體,也關注如何取得人類示範資料,供機器人學習抓取、手部操作與任務執行。

七、技術布局六:部署、停靠、商業化與營運場景

人形機器人若要從實驗室進入真實場域,還需要支撐、充電、維護與商業模式。US20260106490A1描述基座、向上延伸的支架組件與上方支撐件,當機器人處於停靠站上的準站立位置時,上方支撐件位於機器人肩膀下方,以至少部分支撐機器人重量。這類專利提醒我們,人形機器人不是只有「走路」與「抓取」;在不工作、充電、維修或待命時,如何安全地停靠與承重也會影響產品可用性。

US20250322372A1則涉及接收第一方提供人形機器人在操作地點使用且執行多項任務的資訊,以處理補償請求,讓第一方取得指定金額的貨幣補償。從摘要可支持的判斷是,Figure AI也考慮到機器人在操作地點執行任務後,相關資訊如何被用於補償或商業流程。這不等於可以推論其最終商業模式,但至少顯示其專利布局已延伸到部署後的任務紀錄與價值結算。

因此,Figure AI的專利版圖可以被理解為一個「從硬體到營運」的閉環:機器人本體要能站立與移動,手部要能抓取與感測,頭部要能看見與保護感測器,AI模型要能理解語言並轉成動作,安全控制要避免危險姿態,資料收集要讓模型持續學習,而停靠與補償相關專利則指向產品化與場域營運。

八、結論:Figure AI的專利布局重點,是把AI與人形整機綁在一起

從這48筆美國專利摘要來看,Figure AI的布局更像是「人形整機平台」:一方面,它在末端夾爪、拇指、指組件、觸覺與接觸偵測上建立操作能力;另一方面,它在腰部、脊柱、髖膝軸、頭頸、外殼與致動器上建立人形本體;再進一步,它用頭部感測器、多影像資料、自我校正、逆向運動學、安全限制、層級式雙足動作模型與自然語言指令,把AI控制接上真實機械身體。

人形機器人的挑戰在於,它必須同時處理全身自由度、雙足平衡、頭部感知、手部靈巧操作、安全限制、語言任務與環境互動。Figure AI的專利資料呈現的正是這些面向的交會:硬體不是孤立的機械結構,AI也不是孤立的模型,而是要在真實機器人的身體上共同運作。

當然,專利摘要不能直接證明產品已經量產,也不能保證技術一定成功。但它能揭示公司認為值得保護的技術邊界。就本資料集而言,Figure AI值得關注的地方,在於它把「人形」拆成許多可申請、可保護、可工程化的模組:手、腕、腰、頭、感測器、致動器、線束、保護機構、資料收集與AI控制模型。這些模組累積起來,才是人形機器人從展示影片走向真實應用所需要的專利地基。