On temporal coherency of probabilistic models for audio-to-score alignment

Résumé : Cette thèse porte sur l'alignement automatique d'un enregistrement audio avec la partition de musique correspondante. Nous adoptons une approche probabiliste et proposons une démarche théorique pour la modélisation algorithmique de ce problème d'alignement automatique. La question est de modéliser l'évolution temporelle des événements par des processus stochastiques. Notre démarche part d'une spécificité de l'alignement musical : une partition attribue à chaque événement une durée nominale, qui est une information a priori sur la durée probable d'occurrence de l'événement. La problématique qui nous occupe est celle de la modélisation probabiliste de cette information de durée. Nous définissons la notion de cohérence temporelle à travers plusieurs critères de cohérence que devrait respecter tout algorithme d'alignement musical. Ensuite, nous menons une démarche axiomatique autour du cas des modèles de semi-Markov cachés. Nous démontrons que ces critères sont respectés lorsque des conditions mathématiques particulières sont vérifiées par les lois a priori du modèle probabiliste de la partition. Ces conditions proviennent de deux domaines mathématiques jusqu'ici étrangers à la question de l'alignement : les processus de Lévy et la totale positivité d'ordre deux. De nouveaux résultats théoriques sont démontrés sur l'interrelation entre ces deux notions. En outre, les bienfaits pratiques de ces résultats théoriques sont démontrés expérimentalement sur des algorithmes d'alignement en temps réel.
Type de document :
Thèse
Sound [cs.SD]. Université Pierre et Marie Curie - Paris VI, 2016. English. 〈NNT : 2016PA066532〉
Liste complète des métadonnées

Littérature citée [139 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/tel-01448687
Contributeur : Abes Star <>
Soumis le : mardi 23 mai 2017 - 10:16:08
Dernière modification le : mardi 11 juillet 2017 - 01:13:03
Document(s) archivé(s) le : vendredi 25 août 2017 - 00:26:25

Fichier

these_archivage_3150918o.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01448687, version 2

Collections

Citation

Philippe Cuvillier. On temporal coherency of probabilistic models for audio-to-score alignment. Sound [cs.SD]. Université Pierre et Marie Curie - Paris VI, 2016. English. 〈NNT : 2016PA066532〉. 〈tel-01448687v2〉

Partager

Métriques

Consultations de la notice

877

Téléchargements de fichiers

89