A Toshiba Corporation kifejlesztett egy 3D felismeréssel rendelkező mesterséges intelligenciát, amely képes a távolság mérésére egy sztereó kamera pontosságával, a kereskedelmi kamerával készített kép felhasználásával, és mély tanulás segítségével elemzi a kamera lencséje által elmosódott képet. Ez a technológia kiküszöböli a sztereó kamerák használatát, ami végül csökkenti a költségeket és a helyet. A Toshiba ezt az eredményt mutatja be a számítógépes látásról szóló nemzetközi konferencián (ICCV2019), amelyet 2019. október 30-án, délelőtt 10 órától tartanak Dél-Koreában.
A képérzékelés egyre fontosabbá válik, és az olyan alkalmazások, mint az objektumokat mozgató robotok, az önálló pilóta nélküli járművek, az infrastruktúrát ellenőrző, távirányítású drónok, nem csupán a témákról készült képeket igénylik, hanem egy kis eszközre is szükségük van a 3D-s adatok elemzéséhez, beleértve az alakot és a távolságot is. Ezért fokozták a kutatásokat egy monokuláris kamerákkal végzett méréstechnika kifejlesztésére (ezeket könnyű miniatürizálni) a mély tanulás felhasználásával a képalkotás tárgyának alakja, háttere és egyéb tájadatok jobb megismerése érdekében.
Ennek a módszernek hátránya van; a távolság pontosságát monokuláris kamera segítségével becsülik meg a megtanult tájadatok függvényében, ami pontosságcsökkenést okoz a különböző tájakon készített felvételek miatt. Ennek leküzdésére a Toshiba kifejlesztett egy színes szűrt rekesznyílás-fotót, amelyben két színszűrő van rögzítve az objektívhez, és az így kapott kép elmosódásának színét és méretét a témától való távolságnak megfelelően elemzik. Bár ez megoldja az adatfüggőség problémáját, idő és pénzbe kerül a meglévő lencsék módosítása.
A Toshiba legyőzte ezt a problémát azáltal, hogy olyan AI-t fejlesztett ki 3D-s felismerési technológiával, amely mély tanulással elemzi a kép elmosódását a lencsén elfoglalt helyének megfelelően, annak érdekében, hogy a távolságmérést ugyanolyan nagy pontossággal érje el, mint egy sztereó kamerarendszerrel., normál monokuláris kamerával, de nincs szükség díszletekre. Eddig elméletileg lehetetlennek tartották a távolság mérését az elmosódás alakja alapján, amely megegyezik a távolsággal és a távolsággal rendelkező objektumok esetében is, ha egyenlő távolságra vannak a fókusztól. Az analitikai eredmények azonban lényeges különbséget mutattak a közeli és távoli tárgyak elmosódott alakjai között, még akkor is, ha a fókuszponttól egyenlő távolságra vannak. Ezzel a Toshiba sikeresen elemezte a rögzített képek elmosódott adatait egy mély tanulási modul segítségével, amelyet a mély neurális hálózati modellel képeztek ki.
Amikor a fény áthalad a lencsén, a keletkezett elmosódás alakja a fény hullámhosszától és a lencsében elfoglalt helyzetétől függően változik. A kifejlesztett hálózatban a helyzetet és a színt külön-külön dolgozzák fel, hogy megfelelően érzékeljék az elmosódottság alakváltozásait, majd egy súlyozott figyelmi mechanizmuson való áthaladás után szabályozzák, hogy a fényerő gradiensén hol kell fókuszálni a távolság helyes mérése érdekében. A tanulás révén a hálózatot ezután frissítik, hogy csökkentse a mért távolság és a tényleges távolság közötti hibát. Ezen AI modul használatával a Toshiba megerősítette, hogy egyetlen kereskedelemben kapható kamerával készített kép ugyanolyan távolságmérési pontosságot valósít meg, amelyet sztereó kamerák biztosítanak. További információk a Toshiba ezen a hivatalos oldalán találhatók.
A Toshiba megerősíti a rendszer sokoldalúságát a kereskedelemben kapható fényképezőgépekkel és objektívekkel, és felgyorsítja a képfeldolgozást, amelynek célja a nyilvános megvalósítás a 2020-as pénzügyi évben.