編譯:Lavida,zhoujin
編輯:Siqi
排版:Scout
本文編譯自 Peter H.Diamandis 和 Figure 創(chuàng)始人 Brett Adcock 的訪談。
Brett Adcock 是一位成功的連續(xù)創(chuàng)業(yè)者,在其創(chuàng)立的 eVTOL 公司 Archer Aviation 成功 IPO 之后,更早之前,他創(chuàng)立的 Vettery 則以 1 億美元被收購。今年年初,Brett Adcock ?宣布創(chuàng)立了通用人形機器人 Figure,并表示自己會投入至少 1 億美元到 Figure。Figure 的目標(biāo)是開發(fā)能夠在不同環(huán)境中工作并處理各種任務(wù)的通用型人形機器人,從倉儲到零售,甚至看護服務(wù)。上個月,Brett 發(fā)布了 Figure 的第一款通用人形機器人 Figure 01 行走的視頻。
在本篇訪談中,Brett 分享了 Figure 01 是如何被設(shè)計的,以及他對于通用人形機器人領(lǐng)域的預(yù)期。Brett 認(rèn)為人形機器人研發(fā)一定是軟硬件一體的過程,LLM 為機器人提供了強大的大腦,是軟件層面的重要補足,而硬件角度,幾乎沒有成熟的供應(yīng)鏈可供使用,要求團隊在設(shè)計產(chǎn)品的同時就要考慮到機器人重量、計算處理、現(xiàn)實環(huán)境等細(xì)節(jié)。
Figure 最先開拓的商業(yè)場景是勞動力市場,Brett Adcock 表示相較于取代人類就業(yè),人形機器人最大的價值是解決勞動力不足的現(xiàn)實情況,這些機器人可以被投入到經(jīng)濟活動中做“Dangerous, dull, dirty”的工作,讓體力勞動成為人類的一種選擇而非負(fù)擔(dān)。
01.
Figure 是什么
Peter:可以簡單介紹一下 Figure 嗎?你們的使命和目標(biāo)是什么?
Brett:Figure 是一家 AI 機器人公司,專注于設(shè)計自動通用人形機器人(Autonomous General-purpose Humanoids)。自動通用人形機器人是指具備自主能力,能夠自動執(zhí)行多種任務(wù),并且在外觀和行為上類似于人類的機器人。我們的目標(biāo)是在長期能夠部署和人類數(shù)量一樣多的人形機器人,讓體力勞動成為一種選擇而非必然。
我們所處世界的操作系統(tǒng)是與人類相適應(yīng)的,例如門把手、倉庫貨架,設(shè)計初衷都是適應(yīng)人類的形態(tài)和能力,而通用人形機器人就是一個系統(tǒng)的通用界面(General Purpose Interface),可以直接與我們的物理世界互動。它的出現(xiàn)將為人類帶來諸多益處,有助于解決勞動力市場中的重要問題,例如提高人們在工作中的生產(chǎn)率,減輕家務(wù)和護理老人的負(fù)擔(dān)。我們的遠期計劃是在全球部署 100 億個人形機器人。
未來 1-2 年內(nèi),我們的重點將放在開發(fā)具有里程碑意義的產(chǎn)品上,希望在未來一兩年內(nèi),能向公眾展示大量人形機器人產(chǎn)品的研發(fā)成果,包括 AI 系統(tǒng)、低級控制(Low-Level Control)等,最終展示能在日常生活中發(fā)揮作用的機器人。
低級控制(low-level control))是機器人或自動化系統(tǒng)的基礎(chǔ),它們負(fù)責(zé)處理底層的物理操作,主要包括運動控制、傳感器反饋、實時響應(yīng)、硬件控制等。
Peter:你預(yù)計到 2030 年或 2040 年,地球上會有多少個人形機器人?
Brett:在接下來的幾十年里,我們真正面臨的挑戰(zhàn)將是如何擴大人形機器人的生產(chǎn)規(guī)模,以及如何將足夠數(shù)量的人形機器人供應(yīng)到市場。長期來看,每個人、每個家庭都會想要一個人形機器人,就像現(xiàn)在的汽車或手機一樣。并且在勞動力市場上也會有數(shù)十億個人形機器人,去做那些對人類來說危險、單調(diào)和乏味的工作。人形機器人也將應(yīng)用于航空事業(yè),例如在太空中建立人類居住點、照看老人等各類工作場景。如果給我們足夠長的時間去進行大規(guī)模制造,我們可以制造出數(shù)十億個人形機器人。
短期內(nèi),人型機器人的性能以及可靠性是主要的限制因素,F(xiàn)igure 正在努力解決這個問題,我們希望能在兩年內(nèi)完成實際生活的機器人應(yīng)用測試演示。
Peter:如果能成功降低制造成本、提高生產(chǎn)量,一個功能完善的人形機器人制作成本能降低多少?
Brett:如果我們回顧消費品或汽車行業(yè)的發(fā)展歷史時,可以看到產(chǎn)品的價格與生產(chǎn)量之間存在強相關(guān)。根據(jù)經(jīng)驗曲線(Experience Curve),每當(dāng)生產(chǎn)數(shù)量翻倍,產(chǎn)品的價格或成本就可能下降 20%或 30%。因此,我們可以認(rèn)為價格取決于生產(chǎn)量。
Experience Curve
經(jīng)驗曲線(Experience Curve)是一個經(jīng)濟學(xué)概念,隨著個體或組織在特定領(lǐng)域的生產(chǎn)量增加,經(jīng)驗的積累會帶來生產(chǎn)效率的提高,生產(chǎn)成本將會下降。
這個原理同樣適用于人形機器人的生產(chǎn)。目前,一個人形機器人大約有 1000 個零件,重量約為 150 磅(68 公斤)。相比之下,一個電動汽車可能有大約 1 萬個零件,重量可能在 4000-5000 磅(1800-2250 公斤)之間。
因此,從長期來看,一個人形機器人的成本應(yīng)該低于一臺廉價電動汽車。這主要取決于機器人的執(zhí)行器、電機組件、傳感器的成本以及計算成本。
Peter:關(guān)于生產(chǎn)速度,未來幾年內(nèi)有可能生產(chǎn)幾百臺 Figure 機器人嗎?你預(yù)計到 2030 年會達到什么水平?
Brett:現(xiàn)階段我們需要先打造出更成熟的產(chǎn)品,才能進一步考慮生產(chǎn)速度的問題。我們當(dāng)前面臨的主要問題是確保人形機器人在客戶場景中的實用性、安全性和可靠性,讓機器人能夠持續(xù)運行,不出故障,并且不需要大量人員來維護和操作。否則,機器人的價值就沒法體現(xiàn)了。也無法為客戶創(chuàng)造理想的回報率。
如果我們能夠做到的話,我相信我們有能力在未來幾十年內(nèi)生產(chǎn)數(shù)千萬個人形機器人。以 Tesla 和福特汽車為例,它們分別花了 10 年以上的時間生產(chǎn)并投放市場 100 萬輛汽車。如果我們的目標(biāo)是全球范圍內(nèi)投放 100 萬臺機器人,可能需要 5 年或者 10-12 年的時間。
與制造汽車相比,制造機器人的過程更加簡單。特斯拉 Model 3 有大約 1 萬個零件,而我們的機器人只有大約 1 千個零件,并且更輕巧。
因此,我認(rèn)為在這 10 年的后半段,我們可以以相當(dāng)高的產(chǎn)量進行機器人制造。但在接下來的 2-4 年內(nèi),我們的首要目標(biāo)是制造出實用的人形機器人。
Peter:AI 已經(jīng)能夠用于編寫其他 AI 程序了,你認(rèn)為你們也會利用機器人來協(xié)助制造機器人,從而形成一種反饋循環(huán)嗎?
歡迎關(guān)注海外獨角獸視頻號
獲取最前沿的科技行業(yè)資訊
Brett:是的,我們的目標(biāo)是在制造過程中只有人形機器人來制造人形機器人。我覺得在制造過程中任何需要人類勞動力的工作都會發(fā)生重大變革,我們上周參觀的汽車制造基地到處都有巨大的機器臂,數(shù)量多達數(shù)百個,那是我一生中見過的自動化程度最高的地方之一,但還有另外約 10,000 名員工在工作。
Peter:工廠制造應(yīng)該是人形機器人最先投入應(yīng)用的地方,機器人離家用還有多遠?
Brett:人形機器人會優(yōu)先在相對更結(jié)構(gòu)化的環(huán)境中得到應(yīng)用,所以相較于復(fù)雜多變的家庭環(huán)境,工廠制造的產(chǎn)品具有更清晰一致的規(guī)格和參數(shù),生產(chǎn)過程更易于統(tǒng)一和自動化,也更容易控制成本、保證安全性,因此工廠會是最初的應(yīng)用場景。
為了讓人形機器人的操作技能、高級行為和感知策略更加成熟,我們需要將這些機器人投入到企業(yè)勞動力市場中,并建立一個全面的 AI 數(shù)據(jù)管道(AI data pipeline),這個過程需要時間。我的推測是預(yù)計到 2030 年左右,我們有可能看到人形機器人在家庭環(huán)境中的廣泛應(yīng)用。
Peter:讓人形機器人成為可能的一個關(guān)鍵因素是 AI 能力的飛躍,而具有物理實體的 AI 機器人將在 AI 的進化中扮演重要角色。一個被裝在盒子里或只能通過攝像頭或揚聲器觀察外界的 AI,與能真正與物理世界互動的 AI 有很大不同,你怎么看?
Brett:我相信,最終我們將有能力對 AGI 產(chǎn)生重大影響。2023 年大家持續(xù)討論的一個問題是,在模型訓(xùn)練和規(guī)模拓展中,一旦互聯(lián)網(wǎng)上沒有足夠的文本用來訓(xùn)練新一代模型,AGI 是否還能實現(xiàn)?我認(rèn)為,通過人形機器人與環(huán)境互動來獲取人類數(shù)據(jù),并使用視覺語言模型來理解和處理這些數(shù)據(jù),可能會是能持續(xù)推進 AGI 研究向前的一個主要途徑,雖然這可能需要更長時間。
Peter:Figure 的團隊是如何組建的?
Brett:我一直在努力找到世界上最優(yōu)秀的人才,還有那些鮮為人知的小眾實驗室,以更深入地了解執(zhí)行器或運動控制。同時,我也在看書學(xué)習(xí)全身逆動力學(xué)(whole-body inverse dynamics)或 NPC 控制器(NPC controller)等相關(guān)知識,我花了大量時間在這上面。
全身逆動力學(xué)(whole-body inverse dynamics)是機器人控制領(lǐng)域的一個概念,它涉及研究和計算機器人身體各部分的運動和受力情況,以便更好地理解和控制機器人的運動。這個概念通常用于開發(fā)機器人的動態(tài)控制系統(tǒng),以使機器人能夠在執(zhí)行任務(wù)時保持平衡、穩(wěn)定和高效。
NPC 控制器(NPC controller)是一種用于控制機器人的控制算法,它代表“非線性模型預(yù)測控制”(Nonlinear Model Predictive Control)。這種控制方法使用機器人的數(shù)學(xué)模型來預(yù)測未來的運動和行為,然后根據(jù)這些預(yù)測來生成控制命令,以實現(xiàn)所期望的機器人行為。NPC 控制器通常用于高級機器人應(yīng)用,如動態(tài)步行、操縱和避障等領(lǐng)域,以提高機器人的性能和穩(wěn)定性。
作為初創(chuàng)公司的創(chuàng)始人,最重要的是證明你能做出來產(chǎn)品,即使是一個最小可行產(chǎn)品(MVP),因為我們的目標(biāo)都是推出產(chǎn)品或服務(wù)。在創(chuàng)立 Archer 的時候,我在佛羅里達大學(xué)建了一個 372 平方米的 Archer Aviation eVTOL 實驗室,與一個博士團隊合作在那里制造了第三、四代電動飛行器,這個過程讓我對技術(shù)原理和產(chǎn)品的認(rèn)證決策(certification decisions)有了更深入的了解。
如果能事先知道 Archer 和 Figure 有多難,也許就不會有人去做了,因為它們確實非常有挑戰(zhàn)性。我當(dāng)時完全沒有意識到供應(yīng)鏈的成熟度問題,很多機器人的初創(chuàng)公司也是。他們可能會認(rèn)為硬件采購很容易,真正的難題在于軟件,但實際情況并非如此。因為要讓軟件順利運行就需要優(yōu)質(zhì)的硬件,特別是對于 eVTOL 飛行器和 Figure 機器人,獲取硬件供應(yīng)非常困難。
Peter:在 Figure 公司的發(fā)展過程中,有哪些技術(shù)層面的限制推動你做出了當(dāng)前的決策?是電池壽命、材料重量或者 AI 嗎?
Brett:我們花了很多時間來了解需求,整個設(shè)計流程非常嚴(yán)格,也進行了大量的交易研究,確保我們能夠做出正確決策。
我們很多決定都取決于硬軟件的供應(yīng)鏈情況,其中驅(qū)動器(actuator)、中間件(middleware)、操作系統(tǒng)、電池、控制軟件(control software)是主要的限制因素,一些情況下感知系統(tǒng)是比較容易獲得并內(nèi)置于機器人中的。
我本來以為能很容易買到現(xiàn)成的,但市場上根本沒有好的驅(qū)動器、電池、控制軟件和中間件操作系統(tǒng)解決方案。傳感器雖然有一些現(xiàn)成的,但我們幾乎都是自己制造下一代機器人的電子元件,并不是因為我們想,而是不得不。
Figure 研制的執(zhí)行器(左) vs?
具有相同扭矩的現(xiàn)成執(zhí)行器(右)
Source: IEEE Spectrum
02.
如何設(shè)計一臺人形機器人
Peter:Figure 機器人的身高是大概 168 cm,這個高度不會讓人類感到害怕,同時又足夠接觸到貨架頂層,你們在設(shè)計的時候是如何考慮的?
Brett:我們在設(shè)計機器人身高的時候經(jīng)歷了一個復(fù)雜的決策過程,因為這個過程中的兩個決定性因素之間是互相矛盾的,我們需要在二者之間找到平衡。
一方面,從物理角度來看,機器人身高低于 168cm 是最理想的,因為這樣的設(shè)計可以降低能源消耗、增強穩(wěn)定性,并且較矮的機器人部件更易于控制,并且在跌倒時能更快地恢復(fù)平衡。
然而,從商業(yè)實用性角度上,我們又需要機器人有足夠長的手臂、可以靈活從高處和低處獲取物品,就像“神探加杰特”(Inspector Gadget )中的機器人那樣具有超人的能力。
因此,綜合考慮這兩方面的因素,我們確定了這個高度作為理想身高。我們正在設(shè)計的下一代機器人會和第一代產(chǎn)品的身高保持一致。
Inspector Gadget 中擁有超長手臂的特工
Peter:你認(rèn)為機器人有必要看起來和人類一模一樣嗎?
Brett:根據(jù)恐怖谷效應(yīng),當(dāng)機器人的外觀越來越接近人類時,人們對它的信任感會增加,但是當(dāng)它們過于接近人類時,人們會感到不安和恐懼。所以我們的目標(biāo)并不是追求讓機器人在外觀上看起來像人類,比如說有五官和表情,而是希望機器人在功能上能夠模仿人類的操控和移動能力。這樣的話機器人就能夠執(zhí)行需要與人類操作系統(tǒng)交互的任務(wù)。
這也意味著我們無需改變工作環(huán)境,就能將機器人投入到人類不愿意從事的工作中,比如倉庫管理和制造業(yè),或者做家務(wù)。這正是人形機器人的目的。我們的最終目標(biāo)是讓機器人融入經(jīng)濟活動中,從事對人類有用且有益的工作。
Peter:據(jù)你了解現(xiàn)在市場上有多少人形機器人公司?比如很多人都知道特斯拉的 Optimus 機器人,現(xiàn)在應(yīng)該也聽說過 Figure ,你覺得還有多少公司像你們一樣募到了充足的資金來發(fā)展人形機器人?
Brett:我們關(guān)注到的應(yīng)該已經(jīng)獲得融資的有 6 個左右,過去十年大多數(shù)人形機器人項目仍處于研發(fā)階段,比如 Boston Dynamics 的 Atlas。美國也有許多非常優(yōu)秀的實驗室,比如加州理工學(xué)院和 UC Berkeley 也展示過他們的一些研究成果。
商業(yè)化方面,我們會去看這幾個公司是不是商業(yè)化團隊,研發(fā)的機器人是否可以行走,以及有沒有手。據(jù)我們所知,目前只有我們和特斯拉的 Optimus 滿足這三個特質(zhì)。
Peter:我們的 Abundance 360 CEO 峰會每年都會聚焦不同的機器人公司。幾年前我們邀請了波士頓動力的 Mark Robert,在峰會上演示了 Atlas 機器人。去年來自英國的 Engineered Arts 公司展示了 Ameca 人形機器人,她最大的特點是擁有面部表情,而且動作非常類似人類,雖然看起來有點怪,但讓人感覺很新鮮。Ameca 接入的是 GPT-4,Atlas 則是由自有系統(tǒng)驅(qū)動??赡艽蟛糠秩藳]有意識到的是,作為機器人,Atlas 實際上非常重,它的液壓系統(tǒng)非常危險。而你們在設(shè)計時采取了不同的方法,F(xiàn)igure 的重量相對較輕,不容易傷害到人,可以介紹一下它的其他參數(shù)嗎?
能實現(xiàn)表情功能的 Ameca 機器人
Source: Engineered Arts?
Brett:我們的目標(biāo)重量是 60 公斤,而現(xiàn)在 Figure 的實際重量略高于 61 公斤,結(jié)果還是很理想的,因為我之前做的很多項目都有明顯的超重問題,比如 Archer(拾象注:Archer Aviation 是 Brett 創(chuàng)立的一家專注于開發(fā)電動垂直起降(eVTOL)飛機的航空制造公司)。我們希望 Figure 在充滿電的狀態(tài)下能續(xù)航 5 小時,然后經(jīng)過 ~2C 快速充電后再次投入工作。
C-rate(充電倍率)指充電電流相對電芯額定容量( Ah )的倍數(shù),表示電池充電到最大容量所需要的時間,是衡量電池充電速度的一個指標(biāo),C 前面的數(shù)字越大,表示充電速度越快。1C 表示電池在一小時內(nèi)可以充滿電,文中提到的 “2C 快速充電”就是說電池在半小時內(nèi)可以充電到 100%。
另外就是讓 Figure 能以幾米/秒的步行速度快走,不需要跑步或沖刺,但有時候機器人可能需要在倉庫里走大概 400 米,所以想讓他走快點。
我們需要通過一些特定操作實現(xiàn)快速、可靠和安全的目標(biāo),當(dāng)前的硬件已經(jīng)能夠完成大部分人類工作,主要的限制在于軟件。通過軟件更新,我們將會不斷提升機器人的能力。
Peter:我很興奮你們專注于讓機器人模仿人類形態(tài)。我對另一件事情非常感興趣,那就是與肌肉相關(guān)的硬件設(shè)計。我曾經(jīng)讀過關(guān)于肌動蛋白和肌肉收縮等方面的文章,一直希望能研發(fā)出一種材料,只要施加電流就會像肌肉一樣收縮——這種材料將是人形機器人的理想驅(qū)動器,而不是傳統(tǒng)的旋轉(zhuǎn)或螺旋功能。你是否了解這方面的研究?我們是否有望看到電機肌肉技術(shù)(Electromechanical Muscle-tech)的發(fā)展?
Brett:人體的結(jié)構(gòu)非常復(fù)雜,尤其是肌肉工作和關(guān)節(jié)運動。例如,人的肩關(guān)節(jié)有三個自由度,所以我們的機器人需要通過三個不同的執(zhí)行器實現(xiàn)俯仰和翻滾,這些執(zhí)行器被設(shè)計成按特定的順序依次激活或啟動,以執(zhí)行復(fù)雜的運動任務(wù)。要使機器人達到與人類相似的自由度和效率非常困難,所以在很長時間內(nèi),機器人與人類之間的差距將持續(xù)存在。
Figure 01 肩關(guān)節(jié)設(shè)計細(xì)節(jié)
Source: IEEE Spectrum
我們已經(jīng)研究了很多種技術(shù),包括液壓技術(shù)以及其他類型的執(zhí)行器,而不僅僅局限于旋轉(zhuǎn)或線性電機。我們的電機驅(qū)動器(Electromechanical Actuator)可以滿足各種需求,因為它們具有足夠的能量、動力和自由度以及合適的速度和扭矩來執(zhí)行這些任務(wù)。只要能夠滿足需求,我們就可以進行大批量生產(chǎn),從而大幅降低生產(chǎn)成本。
我們還在進行一些有趣的學(xué)術(shù)研究,但我們認(rèn)為其中一些研究成果與實際應(yīng)用還有距離,還不能將其應(yīng)用到一個人形機器人上,并在未來幾年內(nèi)進行有用的工作。
Peter:在 Figure 的設(shè)計中,數(shù)據(jù)處理和計算任務(wù)是都在機器內(nèi)部進行,還是需要部分在云端完成處理?
Brett:我們所有的短期、低級別的處理都在機身上操作,所以我們需要在機器人上集成足夠強大的計算和圖形處理能力,以便運行機器人內(nèi)部的計算機,來驅(qū)動整個運動控制器、運行感知系統(tǒng)以及執(zhí)行我們所需的各項功能。
我們的機器人也具備與云端通信的能力,因此對于一些不需要高帶寬、不必?fù)?dān)心延遲問題的任務(wù),例如規(guī)劃機器人的下一步行動等高級行為,這些任務(wù)可以在云端進行處理。
總體而言,我們希望在機器人上盡可能多地完成任務(wù),例如在一個 5G 信號不穩(wěn)定的環(huán)境中,控制器仍能以非??斓念l率運行,所以我們的機器人需要具備在內(nèi)部高速完成大量任務(wù)的能力。
Peter:關(guān)于機器人的視覺系統(tǒng),你們的方案是什么樣的?完全使用攝像頭視覺(Camera Visual)方案還是使用激光雷達?
Brett:如果我們回顧消費品或汽車行業(yè)的發(fā)展歷史時,可以看到產(chǎn)品的價格與生產(chǎn)量之間存在強相關(guān)。根據(jù)經(jīng)驗曲線的理論,每當(dāng)生產(chǎn)數(shù)量翻倍,產(chǎn)品的價格或成本就可能下降 20%或 30%。因此,我們可以認(rèn)為價格是生產(chǎn)量的函數(shù)。
Peter:你是否關(guān)注過《星際迷航》中的 Data 機器人以及 R2-D2 、 C-3PO?他們的哪些設(shè)計是值得借鑒的?哪些不太合理?
Brett:我喜歡 C-3PO,但我不太喜歡它手臂上帶有小型執(zhí)行器的杠桿式裝置。R2-D2 的形狀和結(jié)構(gòu)我覺得不太實用,后部的加速器可能有些用處。但其實我并不是《星際迷航》的科幻迷,我童年接觸更多的是阿西莫夫這些科幻作家的作品。
星際迷航中的 Data 指揮官
Source: Memory Fandom
R2- D2 讓我想到,很多人都建議我們給機器人裝上輪子,而不是采用雙足行走這種更復(fù)雜的方式。
《星球大戰(zhàn)》中的 R2-D2 機器人
Source: Wikipedia
但我認(rèn)為固定輪距的設(shè)計是不合理的,盡管采用這種設(shè)計的機械臂在市場上表現(xiàn)出色,并且很多人也花了大量時間去實現(xiàn)這個設(shè)計。
考慮一個實際情況,如果我們讓一臺輪式機器人進入倉庫,它需要具備垂直移動的能力,這意味著它需要配備能夠上下移動的電梯。為了到達貨架的后面或者類似的地方,你需要先把它推向前方,然后再向后倒車。
為了完成這些復(fù)雜的動作,輪式機器人必須具備與雙足行走的機器人類似的復(fù)雜性、驅(qū)動力和自由度。因此,那些試圖讓我把機器人建造成 R2-D2 樣式的建議實際上是不切實際的。
03.
為什么需要軟硬件一體開發(fā)
Peter:Oculus 的創(chuàng)始人 Palmer Lucky 最近在做一家國防科技公司,在外界看來,他們像是一個專注于硬件制造的公司,但實際他們做的大概是 60% 的軟件和 40% 的硬件。Figure 的硬件和軟件的比例如何?
Brett:如果包含做控制系統(tǒng)(control)、中間件(middleware)和自主決策與行動能力(autonomy)的人,我們的軟件占比會比硬件稍微多一些,因為硬件 team 的員工只有 15 個左右,軟件規(guī)模要明顯大一些。
長遠來看,軟件會成為公司最大的業(yè)務(wù)板塊。Figure 作為一家專注于 AI 的公司,以后會有一個龐大的 autonomy 團隊,并且研發(fā)出關(guān)鍵的 AI 數(shù)據(jù)引擎。
但硬件方面也同樣重要。如果我們真的想做出實現(xiàn)高性能、高可靠性、高安全性和低成本的人形機器人,就需要開發(fā)自己的執(zhí)行器、電子設(shè)備、電池和幾乎所有軟件,因為這些都沒有現(xiàn)成的解決方案。做硬件我們經(jīng)常說“唯一的出路就是繼續(xù)前進”,因為每次啟動機器人都會出現(xiàn)各種新問題,這確實是一項嚴(yán)峻的挑戰(zhàn)。
長時間從事軟件開發(fā)再進入硬件領(lǐng)域是真的很困難,研發(fā)硬件需要經(jīng)過一個漫長的迭代周期,這也是我們受挫的主要因素。
Peter:LLM 如果能夠應(yīng)用于人形機器人,我們就可以與機器人交流,讓它理解我的意圖,進行有效對話。你們打算訓(xùn)自己的模型,還是會集成其他模型?在你們制造機器人的哪個環(huán)節(jié)會引入 LLM?
Brett:要讓人形機器人從工廠走進家庭,關(guān)鍵在于語言,所以 LLM 或視覺語言模型對我們的業(yè)務(wù)幫助很大。我們要讓機器人能夠從語義層面理解世界,做到理解和回應(yīng)用戶的需求和指令,恰好 LLM 可以做到這點。
因此,我們會逐步將視覺語言模型加入機器人的研發(fā)過程,從高層次的行為角度來幫助人形機器人理解人類在說什么,讓它能與人類進行對話,同時也能推斷和理解人們在說什么以做出回應(yīng)。我們很可能不會自己訓(xùn)模型,但我們可以在機器人系統(tǒng)上訓(xùn)練視覺語言模型,關(guān)聯(lián)傳感器數(shù)據(jù)。
打造一個正確的 AI 數(shù)據(jù)引擎對我們來說非常重要,它能確保我們對機器人產(chǎn)生的數(shù)據(jù)進行準(zhǔn)確的訓(xùn)練,對神經(jīng)網(wǎng)絡(luò)進行正確的訓(xùn)練,以便未來能夠有效地部署和使用。這也是驅(qū)動我們盡快讓產(chǎn)品進入市場的動力,我們希望將更多的機器人投放市場,收集數(shù)據(jù),從而讓我們未來的機器人隊伍將變得更加智能、學(xué)會更多技能。
Peter:人們沒有意識到機器人之間的 AI 和數(shù)據(jù)集是相互連接的,當(dāng)一個機器人學(xué)會了如何執(zhí)行某項任務(wù),或者如何應(yīng)對某種情況,不僅僅是那個機器人學(xué)會了,所有的機器人都會學(xué)到,這個是很棒的。
Brett:就像我的孩子們一樣,在他們學(xué)習(xí)做某件事的過程中,盡管可能失敗了很多次,但他們一旦掌握了就不會忘記,然后他們會不斷積累新的技能。
對于機器人也是一樣的,一旦我們成功地教會一個機器人如何成功地卸貨或處理特定情況下的箱子,整個機器人隊伍都會學(xué)到這個技能。因此,機器人的性能提升將非常迅速和顯著。
04.
機器人會取代人類就業(yè)嗎?
Peter:你預(yù)計市場最早什么時候會看到 Figure 的第一個商業(yè)應(yīng)用?
Brett:我預(yù)計會在明年,如果我們明年還做不到,那可能會延后一兩年,這是個比較理想的計劃。我們會盡量多發(fā)布一些產(chǎn)品物料讓公眾了解我們的進度并獲得市場支持,這非常重要。我們計劃在未來 2-3 個月內(nèi)發(fā)布首個人形機器人在辦公室里行走的視頻。未來,我們還將在感知、操縱和其他傳統(tǒng)操作領(lǐng)域做更多工作。
Figure 01 動態(tài)行走
Source: Figure.ai
我們發(fā)布視頻的目的不僅僅是讓機器人展示花哨的動作,而是展示它在重復(fù)性工作中的出色性能。我們會把機器人放在倉庫里,一遍又一遍地完成工作,我認(rèn)為這才是具有突破性的進展。
我們目前正與客戶合作,看怎么讓 Figure 在我們的實驗室中開始工作,并盡量模擬客戶的工作環(huán)境,這樣明年就可以更容易地將它部署到客戶的工作場景中。
Peter:高盛的預(yù)測是,未來 15 年內(nèi),機器人可能會創(chuàng)造 1540 億美元的收入,你也提到過全球 GDP 的一半來自勞動力,這是 Figure 的潛在市場。是否有人擔(dān)憂機器人尤其是人形機器人的出現(xiàn)會導(dǎo)致人們失去工作,引發(fā)類似于 AI 引起的就業(yè)問題?
Brett:我的觀點是在接下來的 10-20 年里,機器人業(yè)務(wù)的發(fā)展將與自動駕駛汽車的發(fā)展路徑類似。就像自動駕駛汽車,高速公路的測試視頻會比城市街道的更早公開,是因為城市街道有更高的安全要求和更多的不確定性。
同樣,人形機器人也會首先解決相對容易的問題,比如在預(yù)知環(huán)境和任務(wù)的情況下搬運貨物。這類任務(wù)就像在高速公路上駕駛,相對簡單易行。然而,更復(fù)雜的任務(wù),例如在家中烹飪或照顧老年人,就像在城市街道上駕駛,更具挑戰(zhàn)性。
Source: Figure Master Plan
盡管大家對人形機器人的期望往往集中在復(fù)雜任務(wù)的解決上,比如谷歌的機器人做垃圾分類,豐田研究院在雜貨店等場景的研究,但這些都是非常困難的挑戰(zhàn)。我很高興有這些研究,但從商業(yè)角度出發(fā),我們的首要任務(wù)應(yīng)該是解決那些簡單但必要的問題,然后逐漸將 AI 數(shù)據(jù)引擎應(yīng)用到更復(fù)雜的任務(wù)中。
所以 Figure 和其他研究團隊關(guān)注的事情恰恰相反。我們的目標(biāo)是在倉儲制造領(lǐng)域應(yīng)用人形機器人,這個領(lǐng)域的勞動力短缺問題最為嚴(yán)重。全球約一半的 GDP 來自勞動力,我們正在面對全球范圍內(nèi)的勞動力短缺問題。隨著嬰兒潮一代的退休和生育率的下降,這個問題將越來越嚴(yán)重。
Peter:大家沒有意識到,我們面臨的最大挑戰(zhàn)不是人口過多,而是人口不足。
Brett:這必然會是一個重大問題。我們有時候去拜訪客戶,比如一個大型財富 100 強公司時,他們首先考慮的不是如何讓機器人與員工協(xié)同工作,而是讓機器人解決勞動力短缺的問題。去年他們的倉庫員工流失率高達 140%,因為沒有人愿意做這些危險且冬冷夏熱的工作。
Peter:未來幾年內(nèi),你是否會把所有機器人首先投入到倉庫環(huán)境中,讓它們從事包裝、解包、貨運和物流等工作,并且著重去提升在這些場景下的能力?
Brett:我們現(xiàn)在大部分時間都投入到了機器人在物流方面的應(yīng)用,也在一些大型汽車制造商(OEMs)上花費了不少時間,這些制造商的生產(chǎn)設(shè)施需要大量員工來操作。上周我們?nèi)チ艘粋€美國著名 OEM 的廠房,那里有近 1 萬名員工。他們問題很多,人手不夠,很多工作都很危險,工人在機器旁做點焊工作,你都可以聞到焊接煙霧的味道。
在訂單履行和物流操作的領(lǐng)域內(nèi)也存在很多問題,因為它們需要及時進行庫存管理。我們看到每天大約有四、五百萬個零件需要人工處理,都集中在同一個設(shè)施或同一位置,這個任務(wù)量是很龐大的,此外還有大量的鋼板被移動到不同的機器上,員工需要在數(shù)百個工作站做點焊這種重復(fù)工作。
Peter:工廠是 7 × 24 無休,還是每天 8 小時?
Brett:不,他們是每天運作 21 至 22 個小時,有兩個 10 小時的班次。
Peter:所以這些機器人可以在沒有人員干預(yù)的情況下全天候工作,不需要像人類員工一樣進行藥物測試,也不需要提供假期和保險。對于這種工種,如果有一個良好的 PMF,機器人是非常理想的勞動力。
Peter:接下來你是否計劃進軍物流、倉儲和送貨服務(wù)領(lǐng)域?你認(rèn)為下一個潛在的大市場是什么,我們何時會看到這些人形機器人出現(xiàn)在這個領(lǐng)域?
Brett:我們計劃先在未來十幾年內(nèi)持續(xù)擴大在商業(yè)勞動力市場的規(guī)模。我們關(guān)注的領(lǐng)域包括醫(yī)療保健、房地產(chǎn)、建筑和零售等,我相信這些領(lǐng)域都有巨大的市場潛力。
另外,還有一些市場尚未應(yīng)用人形機器人,比如房地產(chǎn)。科技房地產(chǎn)公司開發(fā)的在線平臺可以使用人形機器人來代替人類經(jīng)紀(jì)人提供服務(wù)。人們可以通過訪問網(wǎng)站預(yù)約看房,然后由人形機器人打開門迎接他們,在一個虛擬的房屋中全程介紹。這是一個價值數(shù)萬億美元的市場,但科技公司迄今為止還未涉足,因為目前房地產(chǎn)領(lǐng)域的工作仍然過于依賴人力。
此外,還有許多行業(yè)的工作可以通過遠程操作或其他技術(shù)來完成,人形機器人可以為這些行業(yè)帶來新的發(fā)展機會。
Peter:我個人很期待人形機器人進入支持老齡人口的市場,這也是一個相對迫切需要補充勞動力的市場。如果我們希望讓機器人為老年人提供高質(zhì)量的看護服務(wù),需要哪些技術(shù)上的突破和創(chuàng)新?
Brett:這需要我們的人形機器人具備足夠的可靠性、安全性以及合理的成本。從硬件的角度來看,這種機器人將能夠執(zhí)行在家庭環(huán)境中所需的幾乎所有工作。在商業(yè)市場上,我們需要建立對產(chǎn)品的信任和其他方面的成熟度。
通過將人形機器人應(yīng)用于擁有大量勞動力的大型企業(yè)中,提高機器人的智能性、靈活性、可靠性,最終進行大規(guī)模生產(chǎn)以降低成本。機器人在老年護理領(lǐng)域的應(yīng)用將在大約十年后發(fā)生,并且非常重要,甚至可能創(chuàng)造更大的市場。但這只是我們計劃的第二步,而第一步是商業(yè)市場。
Peter:當(dāng) Figure 發(fā)展到第 5、6、7 代的時候,是否會出現(xiàn)一個擁有面部特征和個性的人形機器人,從而增加用戶的舒適感?有面部表情的機器人可以讓人感覺到它們與你建立了連接。隨著 AI 朝著 AGI 的方向發(fā)展,識別用戶的情感狀態(tài)并傳達情感回應(yīng)的能力將會變得越來越重要。你對此有什么看法?
Brett:我們完全可以做到這一點。我們的機器人頭部今天已經(jīng)有了一個全封閉的屏幕,可以傳遞信息,告訴用戶機器人正在做什么,還可以提供提示等等。我們在頭部還配備了攝像頭和各種傳感器。無論我們的機器人是照顧者還是在為企業(yè)提供服務(wù),都可以向用戶傳遞面部表情信息,以使他們感到舒適。
Figure 01 頭部可傳遞信息的全封閉屏幕
Source: Figure.ai
現(xiàn)在 NLP 已經(jīng)足夠成熟,可以讓機器人與用戶進行對話性的交流。我們也可以讓機器人的外觀看起來更舒適??紤]到我們的業(yè)務(wù)還處于早期階段,我們需要花費很多時間來實現(xiàn)。如果可以,我們一定會向消費者提供這樣的體驗。
Peter:我們聊了工業(yè)物流、制造業(yè)還有醫(yī)療保健,你最期待的下一個重要市場是什么?
Brett:我真的很愿意在消費者領(lǐng)域、家庭領(lǐng)域和照顧老年人方面提供幫助。長期而言,這些是非常重要的業(yè)務(wù),每個人都會擁有一個人形機器人作為助手來做事情。而另一個并沒有得到很多關(guān)注的市場是,我認(rèn)為人形機器人將會被應(yīng)用于宇宙探索。
Peter:你提到了我要說的領(lǐng)域,太空探索。
Brett:我們正處在太空探索的黃金時代,這讓我感到非常興奮。這是由于正在建設(shè)的基礎(chǔ)設(shè)施為火箭發(fā)射提供了支持。我認(rèn)為人形機器人將是一個對人類非常有幫助的工具,可以幫助我們在月球和火星等地建立居住地。
轉(zhuǎn)載請注明來自浙江中液機械設(shè)備有限公司 ,本文標(biāo)題:《Figure:為人類部署數(shù)十億臺人形機器人》
還沒有評論,來說兩句吧...