
Applying Image Matching to Video Analysis
Die Bewältigung der täglich gesammelten Multimediadaten für nachrichtendienstliche und kriminaltechnische Untersuchungen erfordert eine umfangreiche manuelle Analyse. Ein Teil dieses Problems besteht darin, dass ein Video, das bereits analysiert wurde, erneut analysiert werden kann.
Die Identifizierung von doppelten Videosequenzen ist aufgrund der unterschiedlichen Qualität und Größe der Videos schwierig. In dieser Forschungsarbeit wird eine kd-Baumstruktur verwendet, um die Geschwindigkeit des Bildabgleichs zu erhöhen. Es werden Schlüsselpunkte generiert und zu einem kd-Baum mit einer hohen Dimensionalität (128 Dimensionen) hinzugefügt.
Alle Schlüsselpunkte für den Satz von Bildern werden verwendet, um einen globalen kd-Baum zu konstruieren, der die Suche nach dem nächsten Nachbarn ermöglicht und den Bildabgleich beschleunigt.
Der kd-Baum führte den Abgleich eines 125-Bilder-Sets 1. 6-mal schneller als Scale Invariant Feature Transform (SIFT).
Die Bilder wurden in der gleichen Zeit abgeglichen wie mit Speeded Up Robust Features (SURF). Für einen Satz von 298 Bildern war der kd-Baum mit RANSAC 5,5 Mal schneller als SIFT und 2. 42-mal schneller als SURF.
Ohne RANSAC war der kd-Baum 6,4-mal schneller als SIFT und 2,8-mal schneller als SURF. Die Reihenfolge, in der Bilder mit denselben Bildern unterschiedlicher Qualität verglichen werden, führte nicht zu signifikant mehr Übereinstimmungen, wenn ein Bild höherer Qualität mit einem Bild niedrigerer Qualität verglichen wurde oder umgekehrt. Die Größenvergleiche variierten viel stärker als die Qualitätsvergleiche, was darauf hindeutet, dass die Größe einen größeren Einfluss auf die Übereinstimmung hat als die Qualität.