Dieser Showcase ist ein Ergebnis aus dem Forschungsprojekt "ATTENTION – Artificial Intelligence for real-time injury prediction" des Bundesministeriums für Wirtschaft und Klimaschutz.
Im Rahmen dieses Projektes entstand das Paper "Context-based Interpretable Spatio-Temporal Graph Convolutional Network for Human Motion Forecasting".
Die Vorhersage menschlicher Bewegungen ist nach wie vor ein offenes Problem, das für autonomes Fahren und Sicherheitsanwendungen von großer Bedeutung ist. Aufgrund der komplexen räumlich-zeitlichen Beziehung von Bewegungssequenzen bleibt dies ein herausforderndes Problem, nicht nur für die Bewegungsvorhersage, sondern auch für eine vorläufige Interpretation der Gelenkverbindungen.
In dieser Arbeit stellen wir ein kontextbasiertes interpretierbares räumlich-zeitliches Faltungsnetzwerk (CIST-GCN) als effizientes 3D-Modell zur Vorhersage menschlicher Posen vor, das auf GCNs basiert und spezifische Schichten umfasst, die die Interpretierbarkeit des Modells unterstützen und Informationen liefern, die bei der Analyse der Bewegungsverteilung und des Körperverhaltens nützlich sein könnten. Unsere Architektur extrahiert aussagekräftige Informationen aus Pose-Sequenzen, aggregiert Verschiebungen und Beschleunigungen in das Eingabemodell und sagt schließlich die Ausgangsverschiebungen voraus. Ausführliche Experimente mit den Datensätzen Human 3.6M, AMASS, 3DPW und ExPI zeigen, dass CIST-GCN bisherige Methoden bei der Vorhersage menschlicher Bewegungen übertrifft und robuster ist. Da die Idee, die Interpretierbarkeit von Bewegungsvorhersagen zu verbessern, durchaus ihre Vorteile hat, stellen wir hier Experimente dazu vor und liefern erste Auswertungen solcher Erkenntnisse.