Wispr Flow, Hindistan'da ses yapay zekası için Hinglish'e bahse giriyor

ABD merkezli ses yapay zekası girişimi Wispr Flow, Hindistan'daki kullanıcı tabanının son yedi ayda ikiye katlandığını duyurdu — bu büyüme, şirketin Hinglish (Hintçe ile İngilizce'nin doğal bir karışımı) için özelleştirilmiş bir dikte modeli yayımlamasının ardından geldi. Wispr Flow, Apple'ın eski mühendisi Tanay Kothari ve Brown Üniversitesi mezunu Sahaj Garg tarafından 2022'de San Francisco'da kurulan bir girişim; sesli olarak yazılan metinleri belge olarak hızlı çevirmeyi sağlayan bir uygulama olarak konumlandırılıyor. Şirket, Hindistan'da bu büyüme ivmesinin diğer pazarlardakinden farklı olduğunu söylüyor.
Wispr Flow'un yıllık abonelik gelirinin (ARR) Hindistan'dan gelen kısmı, geçen Ekim'deki Hinglish lansmanından bu yana %180 arttı. Toplam global aboneliği yaklaşık 100.000'a kalan şirket için, Hindistan abonelerinin oranı %18'e yükseldi — daha önce %7'ydi. Kothari, TechCrunch'a yaptığı açıklamada, "Hindistan'da ses yapay zekası, ABD veya Avrupa'dan farklı bir oyun. Kullanıcılar, sadece İngilizce yazmak istiyor değil; gerçek dil hayatlarında, bir cümlenin ortasında İngilizce'ye geçiyor ve sonra tekrar Hintçe'ye dönüyor. Bu fenomen, Hinglish, ve onu doğru tutmamız gerekiyor" dedi.
Hinglish, dil bilimcilerin "kod karıştırma" (code-mixing) olarak adlandırdığı bir fenomen — iki dilin tek bir cümlede karşı karşıya geldiği ve gramatik kuralları her ikisinden de türeyen bir konuşma şekli. Hindistan'da yaklaşık 250 milyon kişi Hinglish konuşur; bu rakam, ABD'nin tamamına ait popülasyonun yaklaşık 75%'i kadardır. Standart bir İngilizce-Hintçe çeviri sistemi, Hinglish'i parçalı şekilde işler ve hatalar yapar; Wispr Flow'un yaklaşımı, modelinin tek seferde her iki dili tanımak için yeniden eğitilmesidir.
Şirketin teknik yaklaşımı, Whisper benzeri açık kaynak ses modellemesi temellerinden başlar, ancak Hindistan'a özelleştirilmiş bir veri seti üzerine eğitilmiştir. Veri seti, 1.500 saatlik Hinglish konuşmadan oluşur; bu, Bangalore, Mumbai, Delhi ve Hyderabad'daki kullanıcılardan toplandı. Kothari, modelin doğruluğunun (kelime hatası oranı, WER) Hinglish'te %4,7 olduğunu söylüyor; standart İngilizce için Wispr Flow %2,1 WER hedefler. "Hinglish için yaptığımız çalışma, ABD'nin İngilizce için yaptığımızdan teknik olarak daha zor; ancak elimizde, bu pazarın bizim girdiğimiz erken bir an var."
Wispr Flow'un Hindistan stratejisi, Hindistan ses yapay zekası pazarının daha geniş bir trendinden farklı. Çoğu şirket, Apple'ın Siri'si gibi büyük platformların lokalizasyon eksikliğinden kaçınıyor, çünkü Hindistan'da farklı dilsel grupların ihtiyaçları çok geniş — Hintçe, Tamilce, Telugu, Bengalce, Marathi ve onlarca daha küçük dil. Wispr Flow ise Hinglish'i tek bir hedef olarak seçti; bu, Hindistan'ın eğitimli ve şehirleşmiş kullanıcılarının tek bir homojen segmentini temsil ediyor.
Hindistan pazarındaki rekabet ortamı zorlu. ElevenLabs, Deepgram ve Speechly, ABD'den ses yapay zekası sunan şirketler ama hiçbiri Hinglish'e özelleştirilmiş bir model yayımlamadı. Hindistan yerli oyuncuları arasında, Bangalore merkezli Krutrim AI ve Sarvam AI, Hintçe odaklı modeller geliştirmiştir; ancak ikisi de Hinglish'in özel boyutuna girmemiştir. Wispr Flow'un avantajı, dil hibridliğine erken adapte olmasından geliyor.
Gelir modeli olarak, Wispr Flow Hindistan'da global pricing'inden farklı bir fiyatlandırma uyguluyor. ABD'de aylık $12 olan abonelik, Hindistan'da $4 olarak satılıyor; bu, Hindistan tüketici elektronik pazarındaki gelir gerçeklerine göre ayarlandı. Şirket, daha düşük marj oranını yüksek hacim ile dengeliyor. Mevcut Hindistan ARR'si yaklaşık $1,8 milyon; tüm şirket için bu miktar yıllık $36 milyona ulaşan toplam ARR'sinin küçük bir kısmı, ancak büyüme oranı nedeniyle stratejik olarak önemli.
Wispr Flow'un Hindistan büyümesinin asıl sürdürülebilirliği, sektör analistleri tarafından sorgulanıyor. Bangalore'daki yapay zeka analisti Pranay Bhardwaj, "Wispr Flow'un avantajı, en az iki yıl boyunca sürebilir; ancak Krutrim AI veya OpenAI gibi daha büyük oyuncular Hinglish modelleri yayımladıklarında, Wispr Flow'un fiyatlandırma esnekliği zayıflar. Pazarın liderlik için iki yıllık penceresi var" dedi. Wispr Flow, kendi değerlendirmesinde, Hindistan ARR'sinin önümüzdeki 18 ay içinde $5 milyon olmasını hedefliyor.
Wispr Flow'un toplam yatırım turu, $30 milyon ile A serisi olarak tamamlandı; başlıca yatırımcılar arasında Google'ın Capital G fonu, Conviction Partners ve Ribbit Capital yer alıyor. Şirket, Hindistan operasyonlarını genişletmek için takip yatırım turunda $50 milyon daha aramaya hazırlanıyor; ana strateji, Hindistan'daki kullanıcı tabanını $5 milyona kadar büyütmek ve yapay zeka altyapısının genişletilmesini finanse etmek.
Kothari, sözlerini gelecek perspektifiyle bitirdi: "Hindistan, şu anda dünyanın en hızlı büyüyen ses yapay zekası pazarlarından biri ama aynı zamanda en zoru. Hinglish, sadece bir teknik özellik değil; Hindistan'ın dijital kültürünün bir aynası. Bu pazara girmek istiyorsanız, dilin gerçek karmaşıklığını taşıyan bir model üretmelisiniz. Aksi takdirde, kullanıcılar size cevap vermez."