Microsoft verwag doeltreffende 4D-opsporing met behulp van diepleermetodes

Microsoft verwag doeltreffende 4D-opsporing met behulp van diepleermetodes
Microsoft voorspel doeltreffende 4D-opsporing met behulp van diepleermetodes 1

Sommige van Microsoft se pas gepubliseerde patente bevat ‘n outomatiese vinnige taakstelsel vir Cortana, ‘n AI-toestel met ‘n vis-kamera, en ‘n stelsel vir die skepping van verhale met outomaties gegenereerde inhoud. Gister het ons ook ingelig oor ‘n taamlike onkonvensionele idee van ‘n tegnologiereus – ‘n vloeistofaangedrewe skarnier vir voutoestelle.

Microsoft het nou ‘n patent verkry vir ‘n 4D-opsporingstelsel wat diepte-opsporing van 3D-kameras gebruik. Dit maak dan gebruik van gevorderde diepleermodelle om dinamiese 4D-soliede modelleringstelsels te implementeer wat help om bedrywighede in ‘n rommel omgewing akkurater te identifiseer.

Microsoft glo dat ekstra tyd ‘n sleutelfaktor in hierdie hele proses is. Soos gesien kan word uit die bogenoemde beskrywing, is die idee van hierdie idee om die erkenning van voorwerpe en aksies in groot, oorvol gebiede te verbeter – byvoorbeeld in kantoorruimte, soos hierbo.

Microsoft voorspel doeltreffende 4D-opsporing met behulp van diepleermetodes 2 Voorbeeld van CNN-model

Hier is meer spesifiek ‘n beskrywende manier om so ‘n omgewing te ontleed. Begin met die ontvangs van dieptedata wat deur baie 3D-kameras betyds opgespoor word, word dan die besetting van die volume-pixel (voxel) bepaal. Skep ‘n 3D-voorstelling van die voorwerp waaruit die voorwerp gekies is. Die geselekteerde entiteit kan geïdentifiseer word deur gevorderde artikelklassifiseerders, soos dié wat gemodelleer word op omwentelingsneurale netwerke (CNN’s).

Op hierdie punt begin die opsporing van die geselekteerde voorwerp met behulp van dieptedata. Omdat hierdie proses mettertyd plaasvind, is dit ‘n ander manier waarop die vierde dimensie binnegaan. Hoe dan ook, die 3D-soliede volume-voorstelling word gebruik om die aksie, wat dan uitgevoer word, te herken, en die 4D-volgprosedure voltooi.

Dit kan veral die stelsel help om die interaksie tussen verskillende mense en voorwerpe in die omgewing te verstaan. Uit Microsoft se oogpunt stel dit die rekenaarmodel van visie in staat om ‘n baie meer gedetailleerde menslike visie na te boots.

Microsoft voorspel doeltreffende 4D-opsporing met behulp van diepleermetodes 3 Voorbeeld 4D-stelsel van dinamiese soliede modellering

Huidige sulke stelsels benodig diepleermetodes wat gebaseer is op verskeie datastrome. Om sodoende die probleme van voorwerpe wat mekaar gedeeltelik blokkeer of die kijkhoeke van die kamera wat verskil van die oefenhoeke te oorkom, is ‘n groot verskeidenheid kamera-instellings, voorkomsvoorkoms en meer nodig. Sommige benaderings benodig selfs spesiale toerusting vir komplekse kalibrasiemetodes en stereo-beelding van hoë gehalte.

Ter vergelyking, die voorgestelde stelsel van Microsoft sou intyds 4D-inligting verskaf sonder om deur die omslagtige toestelle of die verwerking van die verwerkingsvereistes teruggehou te word. In sommige gevalle kan die beskrewe tegniek vir dinamiese 4D-vaste modellering in werklikheid slegs een tot twee persent van die totale GPU-bronne gebruik word. Daarbenewens kan 10 mense opgespoor word met een GTX1080 TI-koppelvlak, en hul optrede kan afgelei word met 15 rame per sekonde, wat redelik vinnig is in die konteks van hierdie bespreking.

Die konsep lyk baie interessant, en Redmond noem verskillende gebruiksgevalle. Daar moet egter onthou word dat dit – soos die meeste patente – voorlopig ‘n idee is. Daar is dus geen waarborg dat Microsoft dit op ‘n sekere punt sal hanteer nie.