Nejauši pieslēdzos twitter speisam. Kāda melnā maģija viņiem nodrošina tik lielisku automātisko transkriptu / captionus latviešu valodā?
Sakarā ar to, ka Twitter ir slēdzis bezmaksas piekļuves savam API, šis projekts var tikt uzskatīts par mirušu sākot ar 2023. gada 15. jūniju.
Šis ir tvitera pavediens. No senākā uz svaigāko. Tvītu skaits: 26
Nejauši pieslēdzos twitter speisam. Kāda melnā maģija viņiem nodrošina tik lielisku automātisko transkriptu / captionus latviešu valodā?
Tēma mani absolūti neinteresēja, bet kā apburts skatījos uz to, cik korekti un pareizi tiek nodrošinātā runātā teksta pārveidošana latviešu valodā. Neko tādu vēl nebiju redzējis.
@laacz Pie tam, reizēm pēc brīža pielabo. Sajūta ka vadoties pēc tālāk teiktā konteksta. https://www.reddit.com/r/blackmagicfuckery/ materiāls.
Pēc pāris niansēm izskatās, ka tas ir Microsoft TTS. Laikam jau tas tagad ir de facto risinājums.
@MiksMikelsons Visticamākais, ka tur ir vairāk modeļi, kuriem tas viss iet cauri. Ieskaitot tādu, kurš dala pa fragmentiem, bet cits to visu laiku analizē, tādejādi, uzlabojot teikuma atpazīšanu inkrementāli.
@laacz Tilde aizmugurē?
@jaavens Tildes TTS tur aliņu Microsoft TTS.
@laacz Man bija gadījums, kad tika perfekti transkriptēts runātājs un fonā skanošā prāta vētra tika atsevišķi norādīta kā Speaker 2 un speaker 3. Dzīvojam nākotnē.
@laacz Kas liecina, ka tas ir Microsoft TTS? Starp citu ir arī text to speech http://hugo.lv, ja nemaldos ir pieejams publisks API.
@ValdisBluzma TB, Microsoft STT. Liecina tas, ka esmu spēlējies ar Microsoft un Hugo. Microsoft ir vienkārši kosmiski labs, bet šī konkrētā dzīvā teksta atpazīšana ir next level. Hugo stūrītī nervozi pīpē.
@laacz @jaavens Desmitiem gadu esam baroti no karotītes, ka Microsoft bez Tildes vispār ir nekas.
@peterispuritis @jaavens Tur nav viennozīmīga komentāra. Tilde ir darījusi un turpina darīt ļoti daudz labu lietu. BET. MS resurss un iespējas noteikti ļauj tam izdarīt vēl vairāk.
@laacz @jaavens Teorētiski, lai apmācītu AI, materiāla pietiek, es tikai brīnos, vai tiešām ir latviešu filologu komanda Sietlā, kas čeko.
@laacz @peterispuritis @jaavens Pēc publiskām intervijām no Tildes vienmēr saprotu, ka MS latviešu valodas rīki iet roku rokā ar Tildi. Ja nemaldos, hugo dot lv apakšā arī ir tildes daļa.
@peterispuritis @jaavens Apmācībai materiāls ir mazākais. Datu tīrība iekš ML aizņem 80% laika. Savukārt, 90% naudas patērē modeļa apmācīšana. Piemēram, GPT-3, kas tagad ir all the rage, apmācībā izmantoto resursu sākotnējās izmaksas tiek lēstas uz apmēram 10-20M. Realitātē tas noteikti jāreizina ar divi
@ValdisBluzma @peterispuritis @jaavens Hugo ir Tildes produkts. Microsoft Speech ir Microsoft produkts. Pēdējais ir par kārtu labāks par pirmo.
@laacz @ValdisBluzma http://Hugo.lv jau ir 3+ gadus veca versija, jāplāno refresh.
@janisz @ValdisBluzma Tu gribi teikt, ka jaunā versija būs līdzvērtīga MS?
@laacz @ValdisBluzma @peterispuritis Man ir kaut kādas senas atmiņas, ka pirmsākumos MS latviskojumi bija Tilde. Tad laikam kas mainījās.
@jaavens @ValdisBluzma @peterispuritis Jā, pirmssākumos viņiem bija cieša sadarbība. Bet tas bija tik ļoti sen. :)
@laacz Es pirmo reizi dzīvē piedžoinoju spejsu lai uz to paskatītos un tā tiešām ir kaut kāda melnā maģija. @_rihards tavs darbs?
@laacz @jaavens Ideālos audio apstākļos pilns ar kļūdām. Varbūt speisā ir jaunāka versija. https://azure.microsoft.com/en-us/services/cognitive-services/speech-to-text/#features
@peterispuritis @jaavens Es eksperimentēju ar Azure mākoņa versiju. Bija ļoti labi.
@laacz Transkripts kaut kur ir pieejams?
@jjerums HVZ.