Ja nu jums šķiet, ka fraktūra ir īzī pīzī, tad te ir viens raksts un trīs dažādi "ā".
Sakarā ar to, ka Twitter ir slēdzis bezmaksas piekļuves savam API, šis projekts var tikt uzskatīts par mirušu sākot ar 2023. gada 15. jūniju.
Šis ir tvitera pavediens. No senākā uz svaigāko. Tvītu skaits: 7
Ja nu jums šķiet, ka fraktūra ir īzī pīzī, tad te ir viens raksts un trīs dažādi "ā".
@laacz It kā varētu domāt, ka tas ir mēģinājums šķirt lauzto un krītošo intonāciju, bet izskatās, ka tomēr nē.
@didzvein :D
@laacz Vajag pagatavot vecās drukas kapču un pamest pūlim atšifrēšanai. Tiesa, cik gan atlicis to ļaužu, kas to pazīst, iesūtīs vēl kļūdainus šifrējumus.
@PavilsJurjans OCR patlaban, līdz ar ML attīstību, ir par kārtu labāks, nekā tas bija pirms 10 gadiem. Un arī OCR precizitāte fraktūrai ar zināmu treniņu ir mind-blowing (bija kaut kur links, bet nevaru atrast tagad).
@laacz Bet nu mēs runājam par tādu ML OCR, kurš kabatā arī spellčeku pataisa, lai precizētu minējumu?
@PavilsJurjans Nē, patlaban ir tikai tīrs OCR. Spellčeks jau ir cits levelis. Arī rakstība vārdiem mainās laika gaitā, kas spellčeku sarežģī. IMHO svarīgi ir saglabāt oriģinālo tekstu (atpazītā formā) un pieglabāt vārdus visās rakstībās (tipa, aita, vuška, wushka, utt).