논문 링크: https://arxiv.org/abs/2010.11672 ABSTACT 이전에 non-parallel VC를 위해 CycleGAN-VC/VC2 등이 있었다. However, owing to the ambiguity of the effectiveness of CycleGAN-VC/VC2 for mel-spectrogram conversion, they are typically used for mel-cepstrum conversion even when comparative methods employ mel-spectrogram as a conversion target. 이를 다루기 위해, CycleGAN-VC/VC2의 응용을 mel-spectrogram 변환으로 사용했다. 초기 실험으로, d..
논문 링크: https://arxiv.org/abs/1904.04631 ABSTRACT CycleGAN-VC가 잘했지만, real target과 converted speech에는 아직 gap이 있었다. 따라서 CycleGAN-VC에 새로운 3개의 technique을 추가한 CycleGAN-VC2를 제안한다. improved objective(two-step adversarial losses) imporved generator(2-1-2D CNN) improved discriminator(PatchGAN) INTRODUCTION 기존에는 parallel VC가 많았지만 실용적이지 않았다. 이를 해결하기 위해 non-parallel VC 접근 등장 non-parallel의 한 단점으로 데이터 분포를 정확히 ..
논문 링크: https://ieeexplore.ieee.org/document/8553236 ABSTRACT non-parallel voice-conversion (VC) 방법을 제안한다. 이 방법은 CycleGAN-VC라고 불리며, cycle-consistent adversarial network (CycleGAN)를 사용한다. 이 CycleGAN은 gated convolutional neural networks와 identity-mapping loss를 통합한다. CycleGAN은 adversarial loss와 cycle-consistency loss를 사용하여 forward와 inverse mappings을 동시에 학습한다. 이는 non-parallel data에서 최적의 pseudo pair를 ..