Latencia < 500ms en tiempo real

Habla en tu idioma.
Conecta en cualquier idioma.

VoxTwin traduce tu voz en tiempo real durante videollamadas y la reproduce con tu propio timbre, manteniendo una conversación natural, fluida y sin acento artificial. Además, integra un asistente de IA en vivo para ayudarte mientras hablas.

Zoom, Meet, Teams Múltiples idiomas Cancela en cualquier momento
VoxTwin — Sesión activa ● En vivo
Latencia: 340ms Frases: 12 Sesión: 00:08:42 🤖 Asistente ON
Original:
"Tengo experiencia en microservicios con Docker y Kubernetes."
Traducción:
"I have experience in microservices with Docker and Kubernetes."
STT: 280ms · Trad: 60ms · SPEC HIT
VISITANTE
Original:
"Can you describe a time you solved a race condition?"
Traducción:
"¿Puedes describir una vez que resolviste una condición de carrera?"
STT: 310ms · Trad: 55ms
🤖 ASISTENTE IA [10:23:41]
Escuchando: "Can you describe a time you solved a race condition?"
Una race condition ocurre cuando dos hilos acceden al mismo recurso sin sincronización. La resolví usando un mutex (threading.Lock en Python) para serializar el acceso a la caché compartida. También consideré usar una cola (queue.Queue) que es thread-safe por diseño...

¿Cómo funciona?

En tres pasos, sin interrumpir tu videollamada

01

Habla con normalidad

Únete a tu videollamada como siempre. VoxTwin escucha tu voz y la del otro participante al mismo tiempo, sin interrumpir ni modificar la llamada.

02

Traducción instantánea

Tu voz se traduce al idioma del otro participante en menos de 500ms. La app aprende el contexto de la conversación y mejora la precisión a medida que avanza la sesión.

03

El otro te escucha como tú

La traducción se reproduce con tu propio timbre de voz a través de la videollamada. Tu interlocutor te escucha en su idioma sin percibir que estás usando un traductor.

Todo lo que necesitas

Construido específicamente para videollamadas en Windows

Traducción bidireccional

Traduce tu voz al idioma del visitante y la del visitante al tuyo, al mismo tiempo. Ambos participantes se entienden con naturalidad, sin esperas ni interrupciones.

🎙️

Tu voz, en cualquier idioma

La traducción no suena como una voz genérica de computadora — suena como tú. El otro participante no percibe que estás usando un traductor.

🤖

Asistente IA en tiempo real

Un asistente de IA monitorea la conversación y te sugiere respuestas o contexto en tu idioma mientras la llamada transcurre. Ideal para entrevistas o reuniones técnicas.

🧠

Mejora con el contexto

Cuanto más dura la sesión, mejor entiende el tema. VoxTwin recuerda los términos usados y mantiene coherencia en la traducción de principio a fin.

📋

Resumen post-llamada

Al cerrar la sesión, recibes automáticamente un resumen de la conversación, los puntos clave tratados y un glosario bilingüe de los términos más relevantes.

🔧

Configurable sin código

Configura el par de idiomas, el tipo de voz y las preferencias directamente desde la interfaz de la app. Sin archivos de configuración ni conocimientos técnicos.

Compatible con: 📹 Zoom 📹 Google Meet 📹 Microsoft Teams 📹 Discord 📹 Skype Windows 10/11

Planes simples y transparentes

Cancela en cualquier momento. Sin compromisos.

Básico
Gratis
Para siempre
  • Traducción en tiempo real
  • Reconocimiento de voz de alta precisión
  • Captura de audio del sistema
  • Asistente IA en tiempo real
  • Resumen post-llamada con IA
  • Clonación de voz
Crear cuenta gratis →
Completo
$49
/mes
~$1.63 USD por día
  • Todo lo del plan Intermedio
  • Clonación de tu voz
  • El visitante escucha tu timbre real
  • Configuración de voz personalizada
  • Todos los modelos de IA disponibles
  • Soporte prioritario

🔒 Pago seguro con Stripe · Cancela en cualquier momento desde tu panel

Preguntas frecuentes

Sí. El audio se enruta a través de VB-Cable (incluido en las instrucciones de instalación), que actúa como micrófono virtual. Cualquier aplicación de videollamada que permita seleccionar el micrófono de entrada funciona.
VoxTwin soporta todos los idiomas disponibles en los proveedores configurados. Deepgram soporta más de 30 idiomas para STT, y DeepL/Claude/OpenAI cubren los principales idiomas del mundo. El par de idiomas se configura en la app antes de cada sesión.
Sí, el STT, la traducción y el TTS son servicios en la nube. Una conexión estable de al menos 5 Mbps es suficiente. El consumo de datos es mínimo — principalmente audio comprimido en tiempo real.
Con el plan Completo, configuras tu voz clonada en ElevenLabs (necesitas su cuenta y unos minutos de grabación). La app usa ese voice ID para que la traducción suene con tu timbre. El proceso de clonación es externo — en VoxTwin solo ingresas el ID de tu voz.
Desde tu panel de usuario → "Mi plan" → "Cancelar suscripción". La cancelación es inmediata y conservas el acceso hasta el fin del período pagado. Sin penalizaciones ni preguntas.
Sí. VoxTwin usa tus propias API keys de Deepgram (STT), DeepL o Anthropic/OpenAI (traducción) y ElevenLabs (TTS). Esto te da control total sobre el uso y costos. La mayoría ofrece niveles gratuitos suficientes para sesiones normales.