El problema, GILDHARD, es que el sonido se solapa. Del modo que dices se tendría que hacer haciendo extracciones usando la forma espectral, pero al estar solapado no hay modo de aislar lo que se quiere ya que se extrae también parte de lo que no se quiere. En fin, no sé; yo no lo veo.
X.
X.