Breaking
Markets
EUR/USD1.1773 0.11%GBP/USD1.3616 0.04%USD/JPY156.66 0.07%USD/CHF0.7774 0.14%AUD/USD0.7243 0.13%USD/CAD1.3669 0.08%USD/CNY6.8159 0.22%USD/INR94.48 0.01%USD/BRL4.9175 0.07%USD/ZAR16.39 0.20%USD/TRY45.37 0.01%Gold$4,715.70BTC$81,063 0.70%ETH$2,340 1.12%SOL$94.49 1.79%
Tecnología

Wispr Flow apuesta por la IA de voz en India con dictado en Hinglish, pese a las dificultades del mercado

TechCrunchhace 8 h
Micrófono de smartphone con onda de voz
Photo: Thomas Lineweaver / Pexels

La startup estadounidense de IA de voz Wispr Flow afirma que su base de usuarios en India se ha duplicado en los últimos siete meses — un crecimiento que llegó tras el lanzamiento de un modelo de dictado personalizado para el Hinglish, la mezcla natural de hindi e inglés. Wispr Flow, fundada en 2022 en San Francisco por el ex ingeniero de Apple Tanay Kothari y el graduado de Brown Sahaj Garg, se presenta como una aplicación de transcripción rápida de voz a documento. La empresa dice que el ritmo de crecimiento en India es distinto al de sus otros mercados.

La parte india del ingreso anual recurrente (ARR) de Wispr Flow ha crecido un 180 % desde el lanzamiento de Hinglish el pasado octubre. Con unos 100.000 suscriptores globales, la parte india ha pasado a representar alrededor del 18 % del total — frente al 7 % anterior. Kothari declaró a TechCrunch: «La IA de voz en India es un juego distinto al de Estados Unidos o Europa. Los usuarios no solo quieren escribir en inglés; en su lengua real cambian al inglés a mitad de frase y vuelven al hindi. Ese fenómeno es el Hinglish, y tenemos que captarlo bien».

El Hinglish es lo que los lingüistas llaman code-mixing — un fenómeno en el que dos lenguas se cruzan en una misma frase y las reglas gramaticales derivan de ambas. Alrededor de 250 millones de personas en India hablan Hinglish; es cerca del 75 % de la población de Estados Unidos. Un sistema estándar de traducción inglés-hindi procesa el Hinglish de forma fragmentada y produce errores; el enfoque de Wispr Flow consiste en reentrenar el modelo desde cero para reconocer ambas lenguas en una sola pasada.

El enfoque técnico parte de una base de modelado de habla de tipo Whisper de código abierto, pero entrenada con un conjunto de datos específico para India. El conjunto comprende 1.500 horas de habla Hinglish, recogidas entre usuarios de Bengaluru, Bombay, Delhi e Hyderabad. Kothari dice que el modelo logra una tasa de error por palabra (WER) del 4,7 % en Hinglish; para inglés estándar, Wispr Flow apunta al 2,1 %. «Lo que hemos hecho para el Hinglish es técnicamente más difícil que lo que hicimos para el inglés en Estados Unidos — pero tenemos una ventana temprana en este mercado».

La estrategia india de Wispr Flow se aparta de una tendencia más amplia de la IA de voz en India. La mayoría de las empresas ha esquivado los huecos de localización dejados por grandes plataformas como Siri de Apple, porque los grupos lingüísticos indios tienen necesidades muy diversas — hindi, tamil, telugu, bengalí, maratí y decenas de lenguas más pequeñas. Wispr Flow eligió el Hinglish como objetivo único, que representa un segmento homogéneo de la base india de usuarios educados y urbanos.

El panorama competitivo en India es difícil. ElevenLabs, Deepgram y Speechly ofrecen IA de voz desde Estados Unidos, pero ninguna ha lanzado un modelo específico de Hinglish. Entre los actores locales indios, Krutrim AI y Sarvam AI, con sede en Bengaluru, han creado modelos centrados en el hindi, pero ninguna ha abordado la dimensión específica del Hinglish. La ventaja de Wispr Flow procede de adaptarse pronto a la hibridación lingüística.

En ingresos, Wispr Flow aplica en India una tarifa distinta a la de su modelo global. La suscripción mensual de 12 dólares en Estados Unidos se vende en India por 4 dólares — un ajuste a las realidades del mercado indio de electrónica de consumo. La empresa compensa el menor margen con mayor volumen. El ARR de India es de unos 1,8 millones de dólares; para toda la compañía es una pequeña parte del ARR total, que ronda los 36 millones de dólares al año, pero estratégicamente importante por la tasa de crecimiento.

La durabilidad real del crecimiento indio de Wispr Flow es objeto de debate entre los analistas del sector. El analista de IA con sede en Bengaluru Pranay Bhardwaj dijo: «La ventaja de Wispr Flow puede durar al menos dos años; pero en cuanto Krutrim AI u OpenAI lancen modelos Hinglish, el poder de fijación de precios de Wispr Flow se debilitará. La ventana para el liderazgo es de dos años». La propia proyección de Wispr Flow es que el ARR de India alcance los 5 millones de dólares en los próximos 18 meses.

La inversión total en Wispr Flow, completada como una serie A de 30 millones de dólares, incluyó a CapitalG de Google, Conviction Partners y Ribbit Capital. La empresa se prepara para buscar 50 millones de dólares adicionales en una ronda complementaria para ampliar las operaciones en India; la estrategia es elevar la base india de usuarios hasta unos 5 millones de dólares en ARR y financiar la expansión de la infraestructura de IA.

Kothari cerró con una nota prospectiva: «India es ahora mismo uno de los mercados de IA de voz que más rápido crece del mundo, pero también uno de los más difíciles. El Hinglish no es solo una característica técnica; es un espejo de la cultura digital india. Si quieres entrar en este mercado tienes que construir un modelo que cargue con la complejidad real de la lengua. De lo contrario los usuarios no te responderán».

Este artículo es un resumen editorial asistido por IA basado en TechCrunch. La imagen es una foto de archivo de Thomas Lineweaver en Pexels.