#not convincing model.

1 messages · Page 1 of 1 (latest)

winter turretBOT
#
Rate the model

To rate this model, either use /rate or click the buttons below.

winter turretBOT
alpine canyon
#

I honestly feel kinda unsure to post this here, but please read the warning section of the post description.

#

Anyways, this is my first model trained on the Kaggle notebook of Applio made by Vidal, with FP32 precision + sync graphs enabled.

quartz burrow
#

no suena mucho como el

alpine canyon
#

tal vez el pitch de las muestras

#

igual yo veo que suena como el, comparé el dataset con las muestras y la mayoría de las muestras tienen un parecido con la voz del dataset

#

tal vez estes escuchando mal o no se xd

alpine canyon
tulip crane
#

Y siento que te faltó aplicarle más limpieza al audio que usaste para hacer el dataset.

#

Además que es obvio que la voz de Galo no está hecha para cantar debido a que el dataset es de pura habla.

#

Aunque almenos si suena usable para cualquier tontería.

alpine canyon
tulip crane
#

Yo con el Bandit V2 + Mel Karaoke/o Roformer + DeNoise de X Minus + edicion con RX10 estoy hecho.

alpine canyon
#

Las muestras estan algo ruidosas tambien porque creo que los inputs no estaban muy limpios, supongo

tulip crane
alpine canyon
tulip crane
#

Porque ahí siento que está mal el contexto

alpine canyon
#

Queria aplicar de-plosive al audio pero no, arruinaria un poco el modelo.

#

PD: You are responsible of what do you do with this model, if you're using it for bad stuff, you may get reported.

alpine canyon
# tulip crane Y siento que te faltó aplicarle más limpieza al audio que usaste para hacer el d...
  1. Al parecer BS Roformer me dejó con un par de errores en el dataset y no me percaté porque el dataset lo hice a la noche y estaba algo agotado, pero Mel Roformer si hizo un buen trabajo.
  2. Bandit Plus/Bandit V2 no serviría de mucho, ya que BS Roformer removió los SFX del dataset.
  3. Mel karaoke no es necesario ya que no hay vocales de fondo, solo ruidos de micrófono e instrumentales (?)
  4. De-plosive ayudaría creo, pero me arruinaría el audio.
tulip crane
alpine canyon
tulip crane
tulip crane
alpine canyon
#

Creo que estoy considerando solo usar Mel roformer en vez de BS roformer

#

Ya que estoy viendo que Mel roformer remueve una cantidad genial de ruido en el audio y supuestamente funciona en voces de anime.