Los trozos que olles con voz de pitufo es porque los estás reproduciendo a más velocidad de lo que deberías (por como fueron grabados).
Si tuvieras forma de reproducir la cinta en esos cachos a su velocidad adecuada/original, supongo que sería lo mejor. Así ya capturas esos cachos bien, como el resto de la cinta.
Y si no, supongo que deberías capturar esos trozos usando una frecuencia mayor al resto de la cinta para no disminuir la calidad en ellos. Dicho aumento de frecuencia en la captura debería ser proporcional a la mayor velocidad que tienen esos trozos respecto al resto de la cinta. Luego esos trozos, si los capturases exactamente con esa frecuencia que comentaba, los modificas para que se reproduzcan a una frecuencia "normal" (la usada en el resto de la cinta) y no con la que los has capturado y ya debería oírse normal.
Si capturas toda la cinta por un igual, los trozos afectados al reducirles la velocidad, se reproducirán con su velocidad normal pero tendrán menos muestras tomadas por segundo que el resto de la cinta. Igual el programa les añade muestras, pero ya no son muestras tomadas del original, si no "inventadas".