diff --git a/README.md b/README.md new file mode 100644 index 00000000..8c2e8750 --- /dev/null +++ b/README.md @@ -0,0 +1,42 @@ +## Necesario para el funcionamiento del server + +### 1. Crear entorno virtual + +```bash +py -3.11 -m venv realtime-env311 +``` + +### 2. Activar el entorno virtual + +**En Windows:** +```bash +.\realtime-env311\Scripts\activate +``` + +--- + +### 3. Instalar dependencias + +> ⚠️ Asegúrase de tener los **drivers CUDA** correctamente instalados en el sistema para la aceleración por GPU. + +```bash +pip install openwakeword +pip install "ctranslate2[cuda]" faster-whisper openai websockets sounddevice numpy +pip install pyaudio +pip install soundfile +pip install pvporcupine +pip install webrtcvad-wheels +pip install --upgrade torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 +``` + +--- + +### 4. Notas adicionales + +- `openwakeword`: Modelo de activación por palabra clave. +- `ctranslate2[cuda]` + `faster-whisper`: Transcripción optimizada en tiempo real. +- `sounddevice`, `pyaudio`, `soundfile`: Manejo de entrada/salida de audio. +- `pvporcupine`: Wake word detection alternativo. +- `webrtcvad-wheels`: Detección de voz activa (VAD). +- `torch`, `torchaudio`: Backend de redes neuronales y audio. +