字節(jié)跳動(dòng)研究團(tuán)隊(duì)最新推出了第二代機(jī)器人大模型 GR-2(Generative Robot2.0),其亮點(diǎn)在于創(chuàng)新構(gòu)建“機(jī)器人嬰兒期”學(xué)習(xí)階段,模仿人類成長(zhǎng)學(xué)習(xí)復(fù)雜任務(wù),具備卓越的泛化能力和多任務(wù)通用性。
GR-2 模型和其它很多 AI 模型一樣,包括預(yù)訓(xùn)練和微調(diào)兩個(gè)過程。
在預(yù)訓(xùn)練階段,GR-2“觀看”了多達(dá) 3800 萬個(gè)來自各類公開數(shù)據(jù)集的互聯(lián)網(wǎng)視頻以及 500 億個(gè) tokens,涵蓋了家庭、戶外、辦公室等多種日常場(chǎng)景,讓 GR-2 具備在后續(xù)策略學(xué)習(xí)中跨越廣泛機(jī)器人任務(wù)和環(huán)境的泛化能力。
在微調(diào)階段,團(tuán)隊(duì)使用機(jī)器人軌跡微調(diào)了視頻生成和動(dòng)作預(yù)測(cè),展現(xiàn)出卓越的多任務(wù)學(xué)習(xí)能力,在超過 100 個(gè)任務(wù)中實(shí)現(xiàn)了平均成功率 97.7%。
此外,GR-2 在新穎、之前未見的場(chǎng)景中表現(xiàn)出色的泛化能力,包括新的背景、環(huán)境、物體和任務(wù)。