Canal-U

Mon compte
Université d'Avignon et des pays de Vaucluse

"Fiabilité de la comparaison de voix dans le cadre judiciaire". thèse de Moez AJILI


Copier le code pour partager la vidéo :
<div style="position:relative;padding-bottom:56.25%;padding-top:10px;height:0;overflow:hidden;"><iframe src="https://www.canal-u.tv/video/universite_d_avignon_et_des_pays_de_vaucluse/embed.1/fiabilite_de_la_comparaison_de_voix_dans_le_cadre_judiciaire_these_de_moez_ajili.38757?width=100%&amp;height=100%" style="position:absolute;top:0;left:0;width:100%;height: 100%;" width="550" height="306" frameborder="0" allowfullscreen scrolling="no"></iframe></div> Si vous souhaitez partager une séquence, indiquez le début de celle-ci , et copiez le code : h m s
Contacter le contributeur
J’aime
Imprimer
partager facebook twitter Google +

"Fiabilité de la comparaison de voix dans le cadre judiciaire". thèse de Moez AJILI

"Fiabilité de la comparaison de voix dans le cadre judiciaire".
La soutenance aura lieu le mardi 28 Novembre 2017 à 10h dans l’amphi ADA du CERI.
Le jury de soutenance sera composé de:
Prof. Didier MEUWLY (Netherlands Forensic Institute, NFI, Netherlands) - Rapporteur
Prof. Martine ADDA-DECKER (Laboratoire de Phonétique et Phonologie, LPP, France) - Rapporteur
DR. Tomi KINNUNEN (Joensuu University, Finland) - Examinateur
Prof. Georges LINHARES (Université d'Avignon, LIA, France) - Examinateur
Prof. Jean-François BONASTRE (Université d'Avignon, LIA, France) - Directeur de thèse
MCF. Solange ROSSATO (Université Grenoble Alpes, LIG, France) - Co-Encadrante de thèse


Résumé :
Dans les procédures judiciaires, des enregistrements de voix sont de plus en plus fréquemment présentés comme élément de preuve. En général, il est fait appel à un expert scientifique pour établir si l’extrait de voix en question a été prononcé par un suspect donné (prosecution hypothesis) ou non (defence   hypothesis).

Ce prosessus est connu sous le nom de “Forensic Voice Comparison (FVC)” (comparaison de voix dans le cadre judiciaire). Depuis l’émergence du modèle DNA typing, l’approche Bayesienne est devenue le nouveau “golden standard” en sciences criminalistiques. Dans cette approche, l’expert exprime le résultat de son analyse sous la forme d’un rapport de vraisemblance (LR). Ce rapport ne favorise pas seulement une des hypothèses (“prosecution” ou “defence”) mais il fournit également le poids de cette décision.

Bien que le LR soit théoriquement suffisant pour synthétiser le résultat, il est dans la pratique assujetti
à certaines limitations en raison de son processus d’estimation. Cela est particulièrement vrai lorsque des systèmes de reconnaissance automatique du locuteur (ASpR) sont utilisés. Ces systèmes produisent un score dans toutes les situations sans prendre en compte les conditions spécifiques au cas étudié. Plusieurs facteurs sont presque toujours ignorés par le processus d’estimation tels que la qualité et la quantité d’information dans les deux enregistrements vocaux, la cohérence de l’information entre les deux enregistrements, leurs contenus phonétiques ou encore les caractéristiques intrinsèques des locuteurs. Tous ces facteurs mettent en question la notion de fiabilité de la comparaison de voix dans le cadre judiciaire. Dans cette thèse, nous voulons adresser cette problématique dans le cadre des systèmes automatiques (ASpR) sur deux points principaux.
Le premier consiste à établir une échelle hiérarchique des catégories phonétiques des sons de parole selon la quantité d’information spécifique au locuteur qu’ils contiennent. Cette étude montre l’importance du contenu phonétique: Elle met en évidence des différences intéressantes entre les phonèmes et la forte influence de la variabilité intra-locuteurs. Ces résultats ont été confirmés par une étude complémentaire sur les voyelles orales basée sur les paramètres formantiques, indépendamment de tout système de reconnaissance du locuteur.
Le deuxième point consiste à mettre en oeuvre une approche afin de prédire la fiabilité du LR à partir des deux enregistrements d’une comparaison de voix sans recours à un ASpR. À cette fin, nous avons défini une mesure d’homogénéité (NHM) capable d’estimer la quantité d’information et l’homogénéité de cette information entre les deux enregistrements considérés. Notre hypothèse ainsi définie est que l’homogénéité soit directement corrélée avec le degré de fiabilité du LR. Les résultats obtenus ont confirmé cette hypothèse avec une mesure NHM fortement corrélée à la mesure de fiabilité du LR.

Nos travaux ont également mis en évidence des différences significatives du comportement de NHM entre les comparaisons cibles et les comparaisons imposteurs.
Nos travaux ont montré que l’approche “force brute” (reposant sur un grand nombre de comparaisons) ne suffit pas à assurer une bonne évaluation de la fiabilité en FVC. En effet, certains facteurs de variabilité peuvent induire des comportements locaux des systèmes, liés à des situations particulières. Pour une meilleure compréhension de l’approche FVC et/ou d’un système ASpR, il est nécessaire d’explorer le comportement du système à une échelle aussi détaillée que possible (le diable se cache dans les détails).


Abstract :
It is common to see voice recordings being presented as a forensic trace in court. Generally, a forensic expert is asked to analyse both suspect and criminal’s voice samples in order to indicate whether the evidence supports the prosecution (same-speaker) or defence (different-speakers) hypotheses. This process is known as Forensic Voice Comparison (FVC). Since the emergence of the DNA typing model, the likelihood-ratio (LR) framework has become the new “golden standard” in forensic sciences. The LR not only supports one of the hypotheses but also quantifies the strength of its support. However, the LR accepts some practical limitations due to its estimation process itself. It is particularly true when Automatic Speaker Recognition (ASpR) systems are considered as they are outputting a score in all situations regardless of the case specific conditions. Indeed, several factors are not taken into account by the estimation process like the quality and quantity of information in both voice recordings, their phonological content or also the speakers intrinsic characteristics, etc. All these factors put into question the validity and reliability of FVC. In this Thesis, we wish to address these issues.
First, we propose to analyse how the phonetic content of a pair of voice recordings affects the FVC accuracy. We show that oral vowels, nasal vowels and nasal consonants bring more speakerspecific
information than averaged phonemic content. In contrast, plosive, liquid and fricative do not have a significant impact on the LR accuracy. This investigation demonstrates the importance of the phonemic content and highlights interesting differences between inter-speakers effects and intra-speaker’s ones. A further study is performed in order to study the individual speaker-specific information for each vowel based on formant parameters without any use of ASpR system. This study has revealed interesting differences between vowels in terms of quantity of speaker information. The results show clearly the importance of intra-speaker variability effects in FVC reliability estimation.
Second, we investigate an approach to predict the LR reliability based only on the pair of voice recordings. We define a homogeneity criterion (NHM) able to measure the presence of relevant
information and the homogeneity of this information between the pair of voice recordings. We are expecting that lowest values of homogeneity are correlated with the lowest LR’s accuracy
measures, as well as the opposite behaviour for high values. The results showed the interest of the homogeneity measure for FVC reliability. Our studies reported also large differences of
behaviour between FVC genuine and impostor trials. The results confirmed the importance of intra-speaker variability effects in FVC reliability estimation.
The main takeaway of this Thesis is that averaging the system behaviour over a high number of factors (speaker, duration, content...) hides potentially many important details. For a better understanding of FVC approach and/or an ASpR system, it is mandatory to explore the behaviour of the system at an as-detailed-as-possible scale (The devil lies in the details).

  •  
  •  
    Date de réalisation : 28 Novembre 2017
    Durée du programme : 133 min
    Classification Dewey : Médias documentaires, éducatifs, d'information, journalisme, édition
  •  
    Catégorie : Conférences, Autres
    Niveau : Tous publics / hors niveau, niveau Doctorat (LMD), Recherche
    Disciplines : En cours de classement
    Collections : COLLOQUES
    ficheLom : Voir la fiche LOM
  •  
  •  
    Langue : Français
    Mots-clés : Internet, réseaux sociaux
 

commentaires


Ajouter un commentaire Lire les commentaires
*Les champs suivis d’un astérisque sont obligatoires.
Aucun commentaire sur cette vidéo pour le moment (les commentaires font l’objet d’une modération)
 

Dans la même collection

 [SÉMINAIRE] ECC 2017-2018 Eric Triquet « Débats de société sur les data au musée et sur les réseaux sociaux numériques »
 [SÉMINAIRE] ECC 2017-2018 Florence Andreacola « Intérieur – Extérieur. Comment les dispositifs numériques mobiles font tomber les cimaises ? »
 [SÉMINAIRE] ECC 2017-2018 avec Emmanuel Ethis « Comprendre l’activité des publics du cinéma aujourd’hui »
 [SÉMINAIRE] ECC 2017-2018 avec Marie-Sylvie Poli « Les écritures changeantes des textes au musée »
 [SÉMINAIRE] ECC 2017-2018 avec André Gunthert « L'intelligence des images, crise de l'information » l’Equipe Culture et Communication (Centre Norbert Elias – UMR 8562)
 [SÉMINAIRE] SYMPOSIUM AGORANTIC
 [SÉMINAIRE] SYMPOSIUM AGORANTIC séance de l'Après-midi
 test diffusion avignon 2018
 Impact de la mobilité internationale sur l'insertion professionnelle des ancien.ne.s étudiant.e.s en informatique de l'Université d'Avignon (table ronde)
 CERI-Alumni : « Retour des anciens »
 Introduction au cycle de conférences « Vivre et faire vivre la laïcité »
 video n°5 Quid de l'alerte en France à l'horizon 2020 ?
 vidéo n°4 L'alerte dans les pays du Sud : retours d'expérience et perspectives
 vidéo n°3 Développement d'applications sous Smartphone : quelles attentes ?
 vidéo n°2 Usage des réseaux sociaux : retours d'expérience et expérimentations
 vidéo n°1 Faire face aux inondations : constats et besoins de recherche
 Conférence French Culture Tech #Université
 20eme Biennale de géographie Géopoint 2014
 Forum d’Avignon 2013 “Culture : les pouvoirs de la jeunesse”
 COLLOQUE : DÉCENTRALISATION : A LA RECHERCHE D’UN NOUVEAU SOUFFLE. Métropoles, ruralités et financements des collectivités. 9h30 12h30
 COLLOQUE :DECENTRALISATION : A LA RECHERCHE D’UN NOUVEAU SOUFFLE Métropoles, ruralités et financements des collectivités Séance de 14h00 18h00
 Forum d’Avignon 2012 Conférence/Débat] 15-25 ans, quelle culture les générations numériques reçoivent-elles, créent-elles, transmettent-elles ?
 Communes, intercommunalités, régions : QUE FAIRE ENSEMBLE ? Séances 9h30 12h30
 Communes, intercommunalités, régions : QUE FAIRE ENSEMBLE ? séance 14h 19h
 Les nouvelles intercommunalités et leurs outils 21 octobre 2011 9h30 12h30
 Les nouvelles intercommunalités et leurs outils 21 octobre 2011 14h00 18h00
FMSH
 
Facebook Twitter Google+
Mon Compte