Breaking
Markets
EUR/USD1.1773 0.11%GBP/USD1.3616 0.04%USD/JPY156.66 0.07%USD/CHF0.7774 0.14%AUD/USD0.7243 0.13%USD/CAD1.3669 0.08%USD/CNY6.8159 0.22%USD/INR94.48 0.01%USD/BRL4.9175 0.07%USD/ZAR16.39 0.20%USD/TRY45.37 0.01%Gold$4,715.70BTC$81,063 0.70%ETH$2,340 1.12%SOL$94.49 1.79%
Tech

Wispr Flow mise sur l'IA vocale en Inde avec une dictée Hinglish, malgré les difficultés du marché

TechCrunchil y a 8 h
Microphone de smartphone avec onde sonore
Photo: Thomas Lineweaver / Pexels

La start-up américaine d'IA vocale Wispr Flow indique que sa base d'utilisateurs en Inde a doublé au cours des sept derniers mois — une croissance survenue après le lancement d'un modèle de dictée personnalisé pour le Hinglish, mélange naturel d'hindi et d'anglais. Wispr Flow, fondée en 2022 à San Francisco par l'ancien ingénieur d'Apple Tanay Kothari et le diplômé de Brown Sahaj Garg, se positionne comme une application de transcription voix-document rapide. L'entreprise affirme que le rythme de croissance en Inde se distingue de ses autres marchés.

La part indienne du revenu annuel récurrent (ARR) de Wispr Flow a augmenté de 180 % depuis le lancement de Hinglish en octobre dernier. Avec environ 100 000 abonnés dans le monde, la part indienne est passée à environ 18 % du total — contre 7 % auparavant. Kothari a déclaré à TechCrunch : « L'IA vocale en Inde, c'est un jeu différent des États-Unis ou de l'Europe. Les utilisateurs ne veulent pas seulement écrire en anglais ; dans leur langue vécue ils passent en milieu de phrase à l'anglais puis reviennent à l'hindi. Ce phénomène, c'est le Hinglish, et il nous faut le saisir correctement. »

Le Hinglish relève de ce que les linguistes appellent le code-mixing — un phénomène dans lequel deux langues se rencontrent dans une même phrase et où les règles grammaticales dérivent des deux. Environ 250 millions de personnes en Inde parlent Hinglish ; c'est environ 75 % de la population des États-Unis. Un système classique de traduction anglais-hindi traite le Hinglish de manière fragmentée et produit des erreurs ; l'approche de Wispr Flow consiste à réentraîner le modèle de zéro pour reconnaître les deux langues en un seul passage.

L'approche technique part d'une base de modélisation vocale open source de type Whisper mais entraînée sur un jeu de données construit spécifiquement pour l'Inde. Le jeu de données comprend 1 500 heures de discours Hinglish, collectées auprès d'utilisateurs à Bengaluru, Mumbai, Delhi et Hyderabad. Kothari dit que le modèle atteint un taux d'erreur de mots (WER) de 4,7 % en Hinglish ; pour l'anglais standard, Wispr Flow vise 2,1 %. « Ce que nous avons fait pour le Hinglish est techniquement plus difficile que ce que nous avons fait pour l'anglais aux États-Unis — mais nous avons une fenêtre précoce sur ce marché. »

La stratégie indienne de Wispr Flow s'éloigne d'une tendance plus large de l'IA vocale en Inde. La plupart des entreprises ont esquivé les lacunes de localisation laissées par les grandes plateformes comme Siri d'Apple, parce que les groupes linguistiques indiens ont des besoins très divers — hindi, tamoul, télougou, bengali, marathi et des dizaines de langues plus petites. Wispr Flow a choisi le Hinglish comme cible unique, qui représente un segment homogène de la base d'utilisateurs éduqués et urbains de l'Inde.

Le paysage concurrentiel en Inde est difficile. ElevenLabs, Deepgram et Speechly proposent toutes de l'IA vocale depuis les États-Unis mais aucune n'a livré de modèle spécifique Hinglish. Parmi les acteurs indiens locaux, Krutrim AI et Sarvam AI, basées à Bengaluru, ont conçu des modèles centrés sur l'hindi mais aucune ne s'est attaquée à la dimension spécifique du Hinglish. L'avantage de Wispr Flow vient de son adaptation précoce à l'hybridité linguistique.

Côté revenu, Wispr Flow applique en Inde une tarification différente de son modèle global. L'abonnement mensuel à 12 dollars aux États-Unis se vend 4 dollars en Inde — un ajustement aux réalités du marché de l'électronique grand public en Inde. L'entreprise compense la marge plus faible par un volume plus élevé. L'ARR en Inde s'élève à environ 1,8 million de dollars ; pour l'ensemble de la société, cela représente une petite part de l'ARR total, qui atteint environ 36 millions de dollars par an, mais c'est stratégiquement important en raison du rythme de croissance.

La durabilité réelle de la croissance indienne de Wispr Flow est mise en doute par certains analystes du secteur. L'analyste IA Pranay Bhardwaj, basé à Bengaluru, a dit : « L'avance de Wispr Flow peut durer au moins deux ans ; mais dès que Krutrim AI ou OpenAI livreront leurs propres modèles Hinglish, le pouvoir de tarification de Wispr Flow s'affaiblira. La fenêtre pour le leadership est de deux ans. » La projection de Wispr Flow est que l'ARR indien atteigne 5 millions de dollars dans les 18 prochains mois.

L'investissement total dans Wispr Flow, conclu sous forme de série A de 30 millions de dollars, inclut CapitalG de Google, Conviction Partners et Ribbit Capital. L'entreprise prépare une levée complémentaire de 50 millions de dollars pour développer ses opérations en Inde ; la stratégie est de porter la base d'utilisateurs indienne à environ 5 millions de dollars d'ARR et de financer l'extension de l'infrastructure d'IA.

Kothari a conclu sur une note prospective : « L'Inde est aujourd'hui l'un des marchés de l'IA vocale qui croissent le plus vite au monde, mais aussi l'un des plus difficiles. Le Hinglish n'est pas seulement une fonctionnalité technique ; c'est un miroir de la culture numérique indienne. Si vous voulez entrer sur ce marché, vous devez bâtir un modèle qui porte la vraie complexité de la langue. Sinon les utilisateurs ne vous répondront pas. »

Cet article est un résumé éditorial assisté par IA basé sur TechCrunch. L'image est une photo d'archive de Thomas Lineweaver sur Pexels.