Partager sur Facebook Imprimer la page
http://fuscia.info/

Action recognition from video: some recent results

Rechercher un programme

Rechercher un programme

Téléchargements

Formulaire de téléchargement
UNT Partenaires

Action recognition from video: some recent results

While recognition in still images has received a lot of attention over the past years, recognition in videos is just emerging. In this talk I will present some recent results.
Bags of features have demonstrated good performance for action recognition in videos. We briefly review the underlying principles and introduce trajectory-based video features, which have shown to outperform the state of the art. These features are obtained by dense point sampling in each frame and tracking them based on displacement information from a dense optical flow field. Trajectory descriptors are obtained from motion boundary histograms, which are robust to camera motion.
We then show how to integrate temporal structure into a bag-of-features model based on so-called actom sequences. We localize actions based on sequences of atomic actions, i.e., represent the temporal structure by sequences of histograms of actom-anchored visual features. This representation is flexible, sparse and discriminative. The resulting model is shown to significantly improve performance over existing methods for temporal action localization. Finally, we show how to move towards more structured representations by explicitly modeling human-object interactions. We learn how to represent human actions as interactions between persons and objects. We localize in space and track over time both the object and the person, and represent an action as the trajectory of the object with respect to the person position, i.e., our human-object interaction features capture the relative trajectory of the object with respect to the human. This is shown to improve over existing methods for action localization.

Date de réalisation :

01/12/2011

Durée du programme :

44 minute(s) et 9 secondes

Classification Dewey :

Vision par ordinateur

Catégorie :

Conférences

Niveau :

niveau Master (LMD)
niveau Doctorat (LMD)

Disciplines :

Informatique

Fiche LOM-FR :

Obtenir la fiche

Langue :

Anglais


Générique :

Editeur(s) :

INRIA
Université de Nice Sophia Antipolis
CNRS - Centre National de la Recherche Scientifique

Producteur(s) :

Région PACA
INRIA

Réalisateur(s) :

VSP - Vidéo Sud Production

SCHMID Cordelia

Cordelia Schmid

Cordelia Schmid est diplômée en informatique de l'université de Karlsruhe, elle a obtenu un doctorat
et une habilitation à diriger les recherches de l'Institut National Polytechnique de Grenoble (INPG).
Elle est directrice de recherche à l'INRIA où elle est responsable de l'équipe-projet LEAR http://lear.inrialpes.fr et fait
partie de la commission d'évaluation. Cordelia Schmid est l'auteur de plus de 80 publications
techniques dans le domaine de la vision artificielle, notamment dans le domaine de la
reconnaissance visuelle. Elle fait partie du comité éditorial de journaux internationaux tels que
International Journal of Computer Vision et IEEE Transactions on Pattern Analysis and Machine
Intelligence, et a co-organisé le congrès international CVPR'05, ainsi que plusieurs autres
symposiums. Elle a reçu le prix de thèse de l'INPG en 1996, et le prix Longuet-Higgins pour ses
contributions à la vision artificielle en 2006.