Automatic Generation of Audio Jingles

This page accompanies the report Génération automatique de jingles audio. Please refer to this document for context.

Comparison of the different frameworks

Warning: some sounds can be loud.

Diffusion paradigm	Data format	# learnable parameters	# training steps
EDM	Float. codes	231.6 M	2 M (our best model)
DDPM	CQT	56.9 M	500 k
EDM	CQT	56.9 M	500 k
DDPM	Float. codes	75.4 M	500 k
EDM	Float. codes	75.4 M	500 k
DiscDPM	Disc. codes	87.9 M	500 k
DiscDPM	Disc. codes	133.1 M	670 k (stopped by scheduler)