-
- Label UNT : Unisciel, UNIT
-
- Date de réalisation : 1 Décembre 2011
- Durée du programme : 45 mns
- Classification Dewey : Vision par ordinateur
-
- Catégorie : Conférences
- Niveau : niveau Master (LMD), niveau Doctorat (LMD)
- Disciplines : Informatique, Informatique
- Collections : Colloquium Jacques Morgenstern : recherches en STIC - nouveaux thèmes scientifiques, nouveaux domaines d’application, et enjeux
- ficheLom : Voir la fiche LOM
-
- Auteur : SCHMID Cordelia
- producteur : Région PACA , INRIA (Institut national de recherche en informatique et automatique)
- Réalisateur : VSP - Vidéo Sud Production
- Editeur : INRIA (Institut national de recherche en informatique et automatique) , UNS , CNRS - Centre National de la Recherche Scientifique
-
- Langue : Anglais
- Mots-clés : apprentissage, analyse video, interprétation scène, reconnaissance video
Action recognition from video: some recent results
While recognition in still images has received a lot of attention over the past years, recognition in videos is just emerging. In this talk I will present some recent results.
Bags of features have demonstrated good performance for action recognition in videos. We briefly review the underlying principles and introduce trajectory-based video features, which have shown to outperform the state of the art. These features are obtained by dense point sampling in each frame and tracking them based on displacement information from a dense optical flow field. Trajectory descriptors are obtained from motion boundary histograms, which are robust to camera motion.
We then show how to integrate temporal structure into a bag-of-features model based on so-called actom sequences. We localize actions based on sequences of atomic actions, i.e., represent the temporal structure by sequences of histograms of actom-anchored visual features. This representation is flexible, sparse and discriminative. The resulting model is shown to significantly improve performance over existing methods for temporal action localization. Finally, we show how to move towards more structured representations by explicitly modeling human-object interactions. We learn how to represent human actions as interactions between persons and objects. We localize in space and track over time both the object and the person, and represent an action as the trajectory of the object with respect to the person position, i.e., our human-object interaction features capture the relative trajectory of the object with respect to the human. This is shown to improve over existing methods for action localization.
Colloquium Jacques Morgenstern
Le but du colloquium est d’offrir une vision d’ensemble des recherches les plus actives et les plus prometteuses dans le domaine des Sciences et Technologies de l’Information et de la Communication (STIC). Nouveaux thèmes scientifiques, nouveaux domaines d’application, enjeux sociaux et philosophiques. Les exposés couvrent une problématique suffisamment large pour intéresser tous les chercheurs, ingénieurs et étudiants concernés par l’avenir des STIC. Les orateurs, français ou étrangers, sont des personnalités de premier plan, informaticiens, mathématiciens ou spécialistes de domaines où l'informatique est appelée à jouer un rôle majeur. Le colloquium porte le nom de Jacques Morgenstern, professeur de mathématiques à l’université de Nice Sophia Antipolis, spécialiste de la théorie de la complexité algébrique et l’un des pionniers du calcul formel. Il a dirigé jusqu’à son décès tragique en 1994 une équipe commune à l’université de Nice, Inria et le CNRS. Le colloquium est un élément de la formation de l’Ecole Doctorale STIC.

commentaires
Ajouter un commentaire Lire les commentaires