Nature封面:機(jī)器人乒乓球干翻人類職業(yè)選手
henry 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
要說(shuō)也真夠逗的,索尼的機(jī)器人又開(kāi)始找畫(huà)面了。
搭了個(gè)乒乓球臺(tái)子,直接找職業(yè)選手開(kāi)干。

一臺(tái)8自由度的機(jī)械臂,對(duì)戰(zhàn)日本elite級(jí)選手5場(chǎng)3勝2負(fù)。
后面半年,陸續(xù)打贏了幾位日本職業(yè)選手,包括2019年美國(guó)公開(kāi)賽女單亞軍平真由香(GPT說(shuō)相當(dāng)于國(guó)內(nèi)省隊(duì)主力),以及WTT世界排名第25位的木原美悠。
它打起來(lái)畫(huà)面大概是這樣的。
背后研究嘛,Nature也相當(dāng)賞臉,直接給了個(gè)封面。

雖說(shuō)伯克利去年就能讓宇樹(shù)G1和人類連拍106板了,港大Smash也能讓G1在室外打乒乓球。
不過(guò)這里得老實(shí)說(shuō)一句,HITTER和SMASH都不處理球的旋轉(zhuǎn),打的是陪練配合的平球,真扛不住職業(yè)選手那種旋轉(zhuǎn)。Ace正經(jīng)實(shí)打的,這個(gè)硬功夫人家確實(shí)做到了。
(完整幕后比賽視頻可參考:https://www.youtube.com/watch?v=FrGq8ltb-_E)
這場(chǎng)球是怎么打的
規(guī)則全按國(guó)際乒聯(lián)(ITTF)標(biāo)準(zhǔn)來(lái),先到11分贏,場(chǎng)地都是正規(guī)比賽場(chǎng)地。
對(duì)手則分兩檔。
第一檔是elite級(jí),定義為至少10年訓(xùn)練、每周20小時(shí)以上的業(yè)余精英,5位(3女2男)。
第二檔是職業(yè),日本T聯(lián)賽現(xiàn)役的兩位,Minami Ando和曾根翔。
這些球員此前全都沒(méi)見(jiàn)過(guò)Ace。沒(méi)有針對(duì)性錄像訓(xùn)練,沒(méi)有定制策略,上場(chǎng)就打。
結(jié)果,2025年4月在東京打的那一輪。Ace對(duì)elite 3勝2負(fù),13局里贏7局。
對(duì)職業(yè)選手0勝2負(fù),7局里搶下1局。
還算不錯(cuò)。

論文提交之后,索尼沒(méi)停手。
2025年12月又打了一輪,這次Ace贏下了平真由香。2026年3月又打了一輪,Ace贏下包括木原美悠在內(nèi)的三位職業(yè)選手。
據(jù)SonyAI DirectorPeter Dürr說(shuō),這次Ace的出球更快、落點(diǎn)更貼近球臺(tái)邊緣、回合節(jié)奏也更緊湊。
Ace從看見(jiàn)球到揮出拍,端到端20.2毫秒。頂級(jí)人類球員,230毫秒。
相差十倍。
這是怎么做到的
Ace的整套系統(tǒng)拆成三塊,看、想、做。
看這一塊,9臺(tái)APS相機(jī)擺在球臺(tái)四周,每臺(tái)配一塊FPGA芯片,相機(jī)本地先做二維小球檢測(cè),只把壓縮后的結(jié)果傳到中央服務(wù)器,再做三維定位。
整套跑完10.2毫秒,空間誤差3毫米。

但知道球在哪還不夠,還得知道球怎么轉(zhuǎn)。旋轉(zhuǎn)決定球落臺(tái)后會(huì)怎么反彈,決定你要怎么揮拍。
索尼的辦法是用自家的事件相機(jī)(event-basedvisionsensor),傳統(tǒng)相機(jī)像連拍,事件相機(jī)只在畫(huà)面有變化的像素上報(bào)數(shù)據(jù),天然低延遲。
配一套叫g(shù)aze control system的裝置,三塊可轉(zhuǎn)鏡片追著球走,一顆可電控變焦的長(zhǎng)焦鏡頭讓球一直清晰,三套從不同角度盯球上的logo怎么翻,算出角速度。
刷新率400到700Hz,平均誤差24.8弧度/秒。
想這一塊,是一個(gè)深度強(qiáng)化學(xué)習(xí)策略,每32毫秒(31.25Hz)讀一次球和機(jī)械臂狀態(tài),輸出動(dòng)作。

訓(xùn)練算法是SAC(Soft Actor-Critic),很古典。
但有一個(gè)關(guān)鍵設(shè)計(jì)叫privileged critic,訓(xùn)練時(shí)給critic(評(píng)判者)喂仿真里的真值,給policy(決策者)只喂帶噪聲的傳感器歷史。
讓老師看參考答案,讓學(xué)生只能看模糊照片解題。學(xué)生被迫學(xué)會(huì)自己做傳感器融合和軌跡預(yù)測(cè),沒(méi)人教它,它自己摸出來(lái)。
整套策略完全在仿真里訓(xùn)練,沒(méi)碰過(guò)一個(gè)真球。部署到真機(jī)上直接就能用。
作者Peter Dürr自己承認(rèn)這個(gè)路徑他一開(kāi)始不信,后來(lái)被結(jié)果打臉。
做這一塊,機(jī)械臂是定制的,8個(gè)自由度(2個(gè)直線關(guān)節(jié)負(fù)責(zé)沿球臺(tái)前后左右平移,6個(gè)旋轉(zhuǎn)關(guān)節(jié)負(fù)責(zé)球拍姿態(tài)和速度),Scalmalloy合金3D打印,做了拓?fù)鋬?yōu)化,又輕又穩(wěn)。

末端是一片蝴蝶D05膠皮配VICTASZX-GEAROUT底板,跟日本職業(yè)選手用的套膠一個(gè)級(jí)別。球拍旁邊還掛了個(gè)小杯子,單臂發(fā)球的時(shí)候托球用。
所有電機(jī)1毫秒同步一次,位置跟蹤延遲不到5毫秒,最大揮拍速度對(duì)標(biāo)職業(yè)選手正手強(qiáng)攻時(shí)的20米/秒。
看+想+做,加起來(lái)20.2毫秒。
One more thing
實(shí)話說(shuō),看到這篇Nature的時(shí)候,第一反應(yīng)不是「好厲害」,是「索尼還在做機(jī)器人啊」。
二十年前,機(jī)器人的第一梯隊(duì)毫無(wú)疑問(wèn)是日本。
1999年索尼出AIBO機(jī)器狗,3000美元一只,20分鐘賣光,賣了15萬(wàn)只。

2003年索尼又出QRIO,全球第一款能雙足奔跑的人形機(jī)器人。本田的ASIMO跟各國(guó)政要握手敲鐘,豐田的機(jī)器人會(huì)吹小號(hào)。
那時(shí)候美國(guó)人要看機(jī)器人,得飛東京。
然而,好景不長(zhǎng)。
那會(huì)兒的機(jī)器人只能表演,不能干活。表演沒(méi)法撐起研發(fā)成本,做成了科技花瓶,長(zhǎng)此以往,自然是賣不動(dòng)就砍。
2006年1月26日,索尼一天之內(nèi)砍了AIBO和QRIO兩個(gè)項(xiàng)目。
2018年ASIMO也停產(chǎn)。日本千葉縣的光福寺,每年給報(bào)廢的AIBO辦超度法事,一次800只。
快進(jìn)到2025年,全球人形機(jī)器人出貨1.3萬(wàn)臺(tái),中國(guó)占90%以上,前六名全是中國(guó)公司,日本沒(méi)有一家上榜。
機(jī)器人這件事,已經(jīng)是中美的游戲了。
Ace的共同作者里,有一個(gè)人叫Hiroaki Kitano(北野宏明),索尼計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室的CEO。

他正是當(dāng)年AIBO的發(fā)起人,人稱AIBO之父,QRIO也是他帶出來(lái)的,RoboCup也是他搞的。
兩個(gè)項(xiàng)目2006年被砍,他沒(méi)走,熬了快二十年,熬到這篇Nature。
雖然形態(tài)上還是一臺(tái)不會(huì)動(dòng)的機(jī)械臂,雖然窗外的中國(guó)人形機(jī)器人已經(jīng)在春晚上扎堆跑武術(shù)。
但能回到牌桌,可能已經(jīng)很好了吧?
[1]https://www.nature.com/articles/s41586-026-10338-5#MOESM1
[2]https://scholar.google.com/citations?user=027fc-oAAAAJ&hl=ja