Facebook recherche une fonction de décomposition spatiale pour optimiser le rendu binaural

2021-05-14 Cet article est traduit par un logiciel

Le site officiel de Facebook a récemment inclus deux articles publiés par une équipe composée de l'Université de technologie de Cologne et de Facebook Reality Labs. Les deux ont le même thème, et les deux décrivent l'optimisation de la fonction de décomposition de l'espace de rendu binaural, mais ils ne sont publiés qu'à des occasions différentes. L'article intitulé "Optimizations of the Spatial Decomposition Method for Binaural Reproduction" a été publié en janvier de cette année et est destiné au "Journal of the Audio Engineering Society", intitulé "Optimizing the Spatial Decomposition Method for Binaural Rendering". en février pour EAA/SFA e-Forum Acusticum (e-FA).

La méthode de décomposition spatiale (SDM) paramétrise le champ sonore en une série d'ondes planes en attribuant une direction d'arrivée (DOA) à chaque échantillon de réponses impulsionnelles de la pièce (RIR). Par conséquent, il peut être analysé et reproduit sur la base du champ sonore de la réponse impulsionnelle de la pièce multicanal mesurée. Initialement, cette fonction a été développée pour l'utilisation de réseaux de microphones ouverts, en utilisant la différence de temps d'arrivée (TDOA) entre les microphones pour générer des estimations de DOA. Dans l'article, l'équipe a comparé les résultats de simulation et de mesure du réseau vectoriel de pseudo-intensité avec les résultats de TDOA, et a étudié les meilleurs paramètres d'analyse en utilisant la différence de temps et des réseaux ouverts.

L'utilisation de l'ensemble de données de fonction de transfert lié à la tête dense (HRTF) pour tracer les données SDM peut atteindre une résolution spatiale élevée. Cependant, l'équipe a découvert que cela pouvait entraîner de graves dégradations timbrales. Au fur et à mesure que le RIR entre dans la phase tardive de réverbération et que plusieurs réflexions se chevauchent, l'estimation du DOA devient instable et la fiabilité deviendra de pire en pire. Inversement, des échantillons consécutifs du RIR sont mappés à différents emplacements, détruisant les informations à bande étroite, augmentant ainsi l'énergie à large bande. Cet effet sera plus important lors de l'utilisation de HRTF spatialement denses, car de petites fluctuations dans l'estimation DOA peuvent entraîner des erreurs dans la cartographie des échantillons vers plusieurs directions HRTF adjacentes. L'article étudie l'application d'une grille de quantification régulière dans l'estimation DOA de la réflexion précoce et de la réverbération tardive.

Lors du rendu direct du RIR analysé par SDM, un autre résultat de l'estimation de DOA changeant rapidement est le blanchiment de la réverbération tardive.Tervo et al résolvent davantage ce problème en proposant une égalisation temps-fréquence. Cette égalisation est la plus appropriée pour la reproduction du haut-parleur, car le filtre à variation temporelle résultant est généré en comparant le flux du haut-parleur rendu avec le RIR omnidirectionnel d'origine. Lors de l'utilisation d'ensembles de données HRTF spatialement denses pour le rendu binaural, cette méthode devient peu pratique en raison de limitations de calcul, car un grand nombre de flux de locuteurs intermédiaires doivent être rendus avant d'utiliser la méthode de locuteur virtuel pour la binauralisation. Dans cet article, l'équipe a proposé une égalisation alternative, y compris le processus de correction de réverbération (RTMod) et le traitement de la réponse impulsionnelle binaurale de la salle (BRIR) et du filtre passe-tout en cascade (RTMod+AP).

Documents associés : Optimisation de la méthode de décomposition spatiale pour le rendu binaural

Documents associés : Optimisation de la méthode de décomposition spatiale pour le rendu binaural

Dans l'expérience perceptive, les chercheurs ont étudié la résolution spatiale minimale requise pour le rendu SDM binaural en comparant directement les signaux binauraux avec de vrais haut-parleurs. Les résultats préliminaires montrent que l'effet auditif de la réponse impulsionnelle d'une salle binaurale est aussi crédible qu'un vrai locuteur.



from: news.nweon.com/85707

© 2020 www.ourvrworld.com