Rédigé par deux étudiants en master, Nadav Bhonker (déjà diplômé) et Shunit Haviv Hakimi, accompagnés par le Professeur Ran El-Yaniv de la Faculté d'Informatique Henry et Marilyn Taub du Technion - Israel Institute of Technology, l'article indique qu'il est possible de modéliser des réponses optimales aux préférences individuelles en matière de jazz.
Produire de la musique constitue un défi permanent pour l'intelligence artificielle ; créer des morceaux qui répondent aux attentes et aux goûts en est un également.
Dans le projet BebopNet, Bhonker et Haviv Hakimi, tous deux musiciens de jazz amateurs, se sont concentrés sur la génération personnalisée d'improvisations de jazz monophoniques (diffusées sur un seul canal) et basées sur des symboles.
Pour atteindre cet objectif, ils ont développé un processus comprenant plusieurs étapes : apprentissage supervisé à l'aide d'un corpus de solos, apprentissage métrique haute résolution des préférences de l'utilisateur et génération optimisée grâce à la planification (recherche de faisceau). Le corpus était constitué de centaines de solos de jazz originaux interprétés par des géants du saxophone tels que Charlie Parker, Stan Getz, Sonny Stitt et Dexter Gordon.
Ils ont ensuite présenté une étude empirique approfondie dans laquelle ils ont appliqué ce concept pour en extraire des modèles individuels. Cette approche permet un examen objectif de modèles subjectifs personnalisés dont les performances sont quantifiables.
Une analyse de plagiat a également été réalisée afin de garantir l’authenticité des solos générés, et afin de s’assurer qu'il ne s'agissait pas d'une synthèse de phrases présentes dans le corpus.
"Bien que nos solos générés par ordinateur soient cohérents et souvent agréables, ils n'ont pas les qualités des solos de jazz professionnels", ont déclaré les auteurs.
Le Professeur El-Yaniv espère relever ce défi dans ses futures recherches. Les modèles préliminaires, basés sur un petit ensemble de données, étaient plus faibles. Il est possible qu'un ensemble de données plus grand permette d'obtenir un modèle sensiblement meilleur. Afin d'obtenir un corpus aussi important, il pourrait être nécessaire d'abandonner l'approche basée sur les symboles et de s'appuyer sur des enregistrements audio pouvant être recueillis en bien plus grande quantité.
"Peut-être que l'un des principaux obstacles à la génération de l'art grâce à l'IA, y compris celle de l'improvisation de jazz, est la manière d'évaluer la qualité de manière significative. Notre travail souligne la nécessité de développer des méthodes efficaces pour évaluer la qualité de la création d'art personnalisé par l'IA. De telles techniques sont essentielles au développement de nombreuses applications ludiques", a noté le Professeur El-Yaniv.
Recevez les actualités du Technion France
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form