1.1 KiB
1.1 KiB
Necesario para el funcionamiento del server
1. Crear entorno virtual
py -3.11 -m venv realtime-env311
2. Activar el entorno virtual
En Windows:
.\realtime-env311\Scripts\activate
3. Instalar dependencias
⚠️ Asegúrase de tener los drivers CUDA correctamente instalados en el sistema para la aceleración por GPU.
pip install openwakeword
pip install "ctranslate2[cuda]" faster-whisper openai websockets sounddevice numpy
pip install pyaudio
pip install soundfile
pip install pvporcupine
pip install webrtcvad-wheels
pip install --upgrade torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
4. Notas adicionales
openwakeword
: Modelo de activación por palabra clave.ctranslate2[cuda]
+faster-whisper
: Transcripción optimizada en tiempo real.sounddevice
,pyaudio
,soundfile
: Manejo de entrada/salida de audio.pvporcupine
: Wake word detection alternativo.webrtcvad-wheels
: Detección de voz activa (VAD).torch
,torchaudio
: Backend de redes neuronales y audio.