voice_recognition/README.md at 47c4a98381a4fd694d7ef2fbf749797bb098f781 - voice_recognition - Gitea: Git with a cup of tea

aime.rolandi/voice_recognition

Files

aime.rolandi 47c4a98381 requisitos para el server

2025-06-17 08:56:35 -03:00

1.1 KiB

Raw Blame History

Necesario para el funcionamiento del server

1. Crear entorno virtual

py -3.11 -m venv realtime-env311

2. Activar el entorno virtual

En Windows:

.\realtime-env311\Scripts\activate

3. Instalar dependencias

⚠️ Asegúrase de tener los drivers CUDA correctamente instalados en el sistema para la aceleración por GPU.

pip install openwakeword
pip install "ctranslate2[cuda]" faster-whisper openai websockets sounddevice numpy
pip install pyaudio
pip install soundfile
pip install pvporcupine
pip install webrtcvad-wheels
pip install --upgrade torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

4. Notas adicionales

openwakeword: Modelo de activación por palabra clave.
ctranslate2[cuda] + faster-whisper: Transcripción optimizada en tiempo real.
sounddevice, pyaudio, soundfile: Manejo de entrada/salida de audio.
pvporcupine: Wake word detection alternativo.
webrtcvad-wheels: Detección de voz activa (VAD).
torch, torchaudio: Backend de redes neuronales y audio.