Den amerikanske robotvirksomhed Figure har præsenteret Helix 02 — en ny version af selskabets AI-model til humanoide robotter. Hvor den oprindelige Helix kun styrede robottens overkrop, hævder Figure, at Helix 02 nu kontrollerer hele kroppen: ben, torso, arme og fingre på samme tid. Modellen kører på selskabets nyeste robot, Figure 03.

Fra overkrop til hele kroppen

Helix er en såkaldt vision-language-action-model (VLA) — en AI, der oversætter det robotten ser, og de instruktioner den får, direkte til bevægelser. Figure beskriver Helix 02 som en model til “fuld-krops-autonomi”, hvor robotten kan gå og manipulere genstande samtidig.

Sammen med softwaren har Figure tilføjet ny hardware: kameraer i håndfladerne og taktile sensorer, der ifølge selskabet kan mærke kræfter helt ned til 3 gram. Figure opsummerer princippet som “alle sensorer ind, alle aktuatorer ud” — altså at al sensordata fødes ind i ét neuralt netværk, der styrer samtlige af robottens led.

Det viser demonstrationerne

I sin annoncering fremhæver Figure blandt andet:

  • En fire minutter lang opvaske-opgave, hvor robotten selv tømmer opvaskemaskinen, navigerer i køkkenet, fylder den igen og starter den.
  • 61 sammenhængende handlinger i træk med, hvad selskabet kalder indbygget fejl-rettelse undervejs.
  • Finmotoriske opgaver som at skrue låg af flasker, tage piller ud af et glas, dosere 5 ml væske med en sprøjte og samle metaldele op fra en rodet bunke.

Figure understreger, at alle demonstrationerne er “fuldt autonome, ikke teleopererede”. Det er en vigtig påstand i sig selv: humanoid-branchen kritiseres ofte for at vise iscenesatte eller fjernstyrede demoer, så netop spørgsmålet om autonomi er afgørende — og indtil videre bygger det alene på Figures egne oplysninger.

Tallene bag

Figure deler også en række tekniske detaljer om systemet. Modellen er bygget i to lag: et hurtigt “System 0” på 10 millioner parametre, der kører 1.000 gange i sekundet (1 kHz), og et “System 1”, der kører ved 200 Hz. Ifølge selskabet er den trænet på over 1.000 timers menneskelig bevægelsesdata og finpudset i mere end 200.000 parallelle simuleringer. Figure oplyser, at hele 109.504 linjers håndskrevet C++-kode er blevet erstattet af det neurale netværk.

Hvorfor det betyder noget

Spranget fra at styre en robots overkrop til at koordinere hele kroppen er et af de sværeste i humanoid-robotik — det kræver, at AI’en på én gang holder balancen, bevæger sig og udfører finmotoriske opgaver. Lykkes det så pålideligt, som Figure beskriver, rykker det robotterne tættere på opgaver i hjemmet og på arbejdspladsen.

Som altid gælder forbeholdet, at oplysningerne kommer fra virksomheden selv og endnu ikke er efterprøvet uafhængigt. Vi følger op, når Helix 02 kan ses i brug uden for Figures egne demonstrationer.

Helix 02 bygger videre på selskabets tidligere arbejde med Helix-modellen, som vi tidligere har beskrevet.