C-sorozatú finanszírozásával már 3,3 milliárd dollárra értékeli a piac a természetes beszédszintézis kialakításában világelső lengyel startupot. Rendszere az AI segítségével képes több nyelvet megszólaltatni számos akcentussal, intonációk, érzelmek széles skáláját felvonultatva.
Az AI-audio fejlesztésében világelsők közé tartozó ElevenLabs 180 millió dollárnyi új tőkéhez jutott, C-sorozatban. A befektetést az a16z (Andreessen Horowitz) amerikai kockázatitőke-befektető cég és az ICONIQ Growth közösen vezette. A TechCrunch információi szerint az új befektetők közé tartozik a NEA, a World Innovation Lab (WiL), a Valor, az Endeavour Catalyst Fund és az Abu Dhabi Lunate.
Unikornis, még nagyobb nagy tervekkel
A vállalkozás értéke ezzel egy csapásra 3,3 milliárd dollárra emelkedett. Éppen egy esztendeje, 2024 januárjában a startup 80 millió dolláros Series B kört zárt. Akkor is az a16z volt a befektetés irányítója. Az ElevenLabs akkor érte el az unikornis státuszt, 1,1 milliárd dolláros értékelésével.
E mostani finanszírozást a cég audioeszközeinek további fejlesztésére fordítja, valamint új piacok szerzésére.
A startup célja, hogy mesterségesen hozzon létre az emberi beszédhez a lehető legjobban hasonlító hangot. A felhasználók számára így lehetővé válik, hogy a mesterséges intelligenciához kapcsolódóan sokféle nyelven alkossanak és tervezzenek hangokat. E hangokat a rendszer képes számos akcentussal, intonációval, érzelmek kifejezésével megszólaltatni. Emellett élethűen tudja átalakítani a szövegeket beszéddé.
A podcastok új jövője
A tőkebevonást a piacon nagy érdeklődés kísérte, mert nagy az igény az ElevenLabs fejlesztéseire. Nagy kiadók és tartalomkészítők tartanak rá igényt. Így játékgyártók, a média világa, továbbá tech startupok tudják, tudnák hasznosítani technológiáját hangfunkcióik működtetésére.
2024-ben a lengyel vállalat piacra dobta első, tisztán a fogyasztóknak szánt termékét, az ElevenLabs Reader nevű alkalmazást, amely cikkeket, szövegeket és dokumentumokat olvas fel. Még újabb szoftverük pedig dokumentumokból és weboldalakból generatív AI-hangokkal már podcastot is tud készíteni.
Előnyben a biztonság
A TechCrunch úgy tudja, hogy az ICONIQ partnere, Seth Pierrepont is csatlakozik a cég igazgatótanácsához. Abban már ott ülnek az a16z képviselői, valamint a cég társalapítói: Mati Staniszewski CEO, és Piotr Dabkowski.
„Szeretnénk jobban megérteni, mit mondanak egy beszélgetés során. Azon dolgozunk, hogy elmozduljunk a csak tartalomgenerálástól a beszéd megértéséig és átírásáig. Sokan azt mondják, hogy a beszédről szövegre történő átvitel megoldott probléma. De sok nyelv esetében ez még elég rossz. Úgy gondoljuk, hogy jobb beszédfelismerő modelleket tudunk építeni, mert vannak házon belüli csapataink, melynek tagjai megjegyzést fűznek az adatokhoz, és gyors visszajelzést adnak nekünk” – fogalmazza Mati Staniszewski vezérigazgató.
Mindehhez azt is hozzáteszi, hogy a technológia kidolgozása során felelősségüknek érzik a megfelelő biztonsági mechanizmus kialakítását. Ezért gyakran részesítik előnyben a biztonságot a telepítés sebességének növelésével, vagy a kereskedelmi haszonnal szemben.
Ez valóban lényeges kérdés. 2024-ben ugyanis valaki a cég hangplatformját használta arra, hogy elkészítse Joe Biden hangjának hamisítását.
(Nyitókép: ElevenLabs)



