CLIENT=cuda
DEFAULT_DEVICE_ID=0
MEMORY_FRACTION=0.8
PORT=4003

BATCH_SIZE=1
BATCH_TIMEOUT=0
MODEL=openai/whisper-large-v3

XLA_TARGET=cuda12