Kas ir https://listen.technology/? Latviski tiem sanāk daudz labāk nekā Tildei. Google skaņa ir daudz metāliskāka, bet papildus šim ir arī labākas intonācijas un pauzes, kur tām jābūt.
Sakarā ar to, ka Twitter ir slēdzis bezmaksas piekļuves savam API, šis projekts var tikt uzskatīts par mirušu sākot ar 2023. gada 15. jūniju.
Šis ir tvitera pavediens. No senākā uz svaigāko. Tvītu skaits: 34
Kas ir https://listen.technology/? Latviski tiem sanāk daudz labāk nekā Tildei. Google skaņa ir daudz metāliskāka, bet papildus šim ir arī labākas intonācijas un pauzes, kur tām jābūt.
Izskatās, ka risinājums nāk no Krievijas vai arī ir cieši saistīts ar to reģionu (spriežot pēc MX ieraksta).
@laacz kļūdas teksta piemērā ir apzinātas?
@hronists Kas to lai zin?
@laacz Tu ar savu tekstu mēģināji? Demo jau var būt fake
@laacz Izskatās, ka šis ir tas pats, ko http://jauns.lv izmanto portālā.
@savejais_ Jā. No turienes arī nāk.
@normis http://Jauns.lv rakstu tts izmanto šo.
@laacz Skan tīri labi, ir dažādas sīkas kļūdiņas, bet kopumā — esmu pārsteigts cik labi.
@mairisskuja Es teiktu, ka aizdomīgi labi.
@laacz @savejais_ Tagad baigā topā ir Speech 2 Text risinājumu meklēšana, Vairākās valsts iestādēs notiek projekti. Diemžēl ir baiss darbs jāiegulda AI lai apmācītu saprast. Diemžēl, http://hugo.lv ir viens no sliktākajiem atpazinējiem, salīdzinot ar sonix un Microsoft Speech
@JAMikdiena @savejais_ Microsoft speech latviešu valodai nav publiski pieejama servisa (tanī pašā Azure). LETA ir savs, bet trenēts uz diktoru balsīm. Tilde turpina attīstīt savējo (Hugo, AFAIK, nav bleeding edge), bet vēl tāls ceļš. Google arī nav nekas izcils.
@JAMikdiena @laacz @savejais_ tāpēc, ka http://Hugo.lv ir ļoti vispārīga atpazīšana, t.i., pēc iespējas visiem dzīves gadījumiem, nevis mērķēta uz konkrētām tēmām. Vai viens no sliktākajiem - negribētu piekrist, ja atpazīst pie normālas skaņas 70-80%, tad post edit būs ātrāk nekā visu pārrakstīt.
@janisz @JAMikdiena @savejais_ Protams, specifiskam gadījumam trenēts modelis būs efektīvāks tanī jomā. Bet retais var atļauties tādu individualizētu modeļu izstrādi un uzturēšanu.
@JAMikdiena @laacz @savejais_ un ja par lietojumu - tad 2020.gadā http://Hugo.lv atpazīšanai izdzīts cauri audio 241 dienas garumā un atpazīti 35M vārdi.
@laacz @savejais_ Micorsoftam ir LV valoda. Speech studio ir pieejams. Pats ielādēju audito zipu un atpazina. Labāk kā hugo pēc noklusējuma parametriem.
@janisz @JAMikdiena @savejais_ Es gan būtu pagaidām piesardzīgs ar STT risinājumiem biznesā. Nozares attīstība patlaban notiek tādiem septiņjūdžu zābakiem, ka ir diezgan liela iespēja nopirkt risinājumu, kurš pēc gada vairs nav aktuāls.
@laacz @janisz @savejais_ Viena liela Eiropas institūcija taisa risinājumu uz MS S2T bāzes visām tās institūcijas dalībvalstīm. Redzēs, kas tur sanāks.
@JAMikdiena @savejais_ Man īsti neizdevās ieraudzīt Latvian.
@laacz Izskatās, ka tiek izmantots pa tiešo vai pārpakotā veidā (kāds palīdzēja integrēt) Azure TTS. Iekopējot kādu tekstu no Jauns raksta Azure TTS demo (ar Nila balsi), skan tieši tas pats un tieši tāpat kā "Klausīties audio formātā" https://azure.microsoft.com/en-us/services/cognitive-services/text-to-speech/#features
@ilmarmors Jep, jau atklājām.
@JAMikdiena @savejais_ Atradu. Ir daudz labāk par Hugo.
@JAMikdiena @laacz @janisz @savejais_ Ar laiku sanāks kļūdaini pieņemti lēmumi, kurus, ilgstoši pētot, varēs identificēt kā S2T+ML/AI algoritma kļūdas. Un tad visi teiks, ka “tas taču loģiski” un “gan jau iestādē kāds tāpat būtu kļūdījies arī bez šiem algoritmiem”
@Rauhvargers @JAMikdiena @janisz @savejais_ Vispār jau kļūdu izķeršana jāparedz procesos, nekarinot uz ML augsta riska lēmumu pieņemšanu. Tieši tā mēs darām uzņēmumā. ML tomēr ir minēšana un interpolācija.
@laacz @Rauhvargers @janisz @savejais_ Tieši ta. Lēmumus pieņem cilveks. Mašīna palīdz tehniskā darbā.
@JAMikdiena @Rauhvargers @janisz @savejais_ Ne gluži. Lēmumus pieņem arī ML. Bet tikai tos, kurš atvieglo dzīvi, analīzes rezultātam ticamība (varbūtība) ir augsta un kļūdīšanās sekas ir nelielas.
@laacz @Rauhvargers @janisz @savejais_ S2t katrs burts, vārds, teikums ir ML lēmums, tas gan 😁
@JAMikdiena @Rauhvargers @janisz @savejais_ Nē, tu nesaprati manu domu. Lēmums tiek pieņemts ne jau no STT vien. Lēmums tiek pieņemts no STT rezultāta teksta analīzes rezultāta (:D).
@laacz @Rauhvargers @janisz @savejais_ Kurš analizē STT rezultātu?
@JAMikdiena @laacz @janisz @savejais_ Datorsistēma. Kas to varbūt saber vēl kopā ar tvītu sentimenta analīzi par konkrēto subjektu (piem., https://www.bancaditalia.it/pubblicazioni/altri-atti-convegni/2018-bigdata/Cerchiello_Twitter_Sentiment_Banks.pdf) un pie vajadzības iededz sarkano lampiņu cilvēka acu priekšā. Vai kļūdās un lampiņu neiededz.
@Rauhvargers @JAMikdiena @janisz @savejais_ Ja lampiņai nav liela nozīme, tad vienalga, ja tā kļūdās. ML vienmēr kļūdīsies. Tas ir fakts. Tas nekad nebūs 100% precīzs.
@Rauhvargers @JAMikdiena @janisz @savejais_ PS Pateicoties šodienas pavedienam es uzzināju, ka Azure piedāvā on-prem konteinerus (manuāli izvērtējot katru on-prem pieprasījumu). Tas jau sāk palikt ļoti interesanti.
@laacz @Rauhvargers @janisz @savejais_ Tilde arī Kubernetus
@JAMikdiena @Rauhvargers @janisz @savejais_ LU MII arī dockeri :)