Der optische Fluss ist seit Jahrzehnten ein Eckpfeiler der Computer Vision, erfasst aber nur 2D-Bewegungen in der Bildebene. Diese Forschung stellt eine Methode vor, um den optischen Fluss auf den 3D-Szenenfluss aufzurüsten, indem sie die 'optische Expansion' nutzt – die Änderung der scheinbaren Größe von Objekten, wenn sie sich in der Tiefe bewegen. Die entscheidende Erkenntnis ist, dass Expansionshinweise, kombiniert mit traditionellem Fluss, 3D-Bewegungsvektoren wiederherstellen können, ohne dass Stereo- oder Tiefensensoren erforderlich sind. Die Methode wird an Standard-Benchmarks evaluiert und zeigt signifikante Verbesserungen der 3D-Bewegungsschätzgenauigkeit. Für Computer-Vision-Forscher und Ingenieure eröffnet diese Arbeit neue Möglichkeiten für das monokulare 3D-Szenenverständnis mit direkten Anwendungen in der autonomen Navigation, Robotermanipulation und AR/VR. Der Ansatz ist recheneffizient und eignet sich für Echtzeitsysteme. Dieses Signal ist besonders relevant, da die Industrie zu leistungsfähigeren Vision-Systemen drängt, die in uneingeschränkten Umgebungen arbeiten können.
Eine neuartige Methode, die optische Expansion nutzt, um den 2D-optischen Fluss auf den 3D-Szenenfluss zu erweitern und tiefenbewusste Bewegungsschätzung zu ermöglichen.