Ievelku elpu un spiežu "Tweet". Šis nu iet tautās. Simts gadus senas preses apskati. Katru dienu. Kamēr kaut kas nenobruks. https://laacz.lv/2020/02/06/gadsimtu-senas-preses-apskats-katru-dienu/
Sakarā ar to, ka Twitter ir slēdzis bezmaksas piekļuves savam API, šis projekts var tikt uzskatīts par mirušu sākot ar 2023. gada 15. jūniju.
Šis ir tvitera pavediens. No senākā uz svaigāko. Tvītu skaits: 18
Ievelku elpu un spiežu "Tweet". Šis nu iet tautās. Simts gadus senas preses apskati. Katru dienu. Kamēr kaut kas nenobruks. https://laacz.lv/2020/02/06/gadsimtu-senas-preses-apskats-katru-dienu/
@laacz @ParaTr00per Tikai šodienas avīzes, vai var arī vakardienas dabūt? Izcili :)
@tjigra @ParaTr00per https://dev.laacz.lv/periodika2/?yesterday
@laacz @normundsbergs Atklāju, ka OCR text recogn softs netiek galā ar t.s. veco druku. Es rekomendētu to atslēgt - jēga no tāda text ir 0. http://periodika.lv/periodika2-viewer/view/index-dev.html?lang=fr#panel:pa|issue:/kuva1920n031|article:DIVL75|issueType:P
@pArt07 @normundsbergs Tiek galā. Ne sevišķi labi, bet tiek. OCR tika veikts projekta ietvaros. Tas bija sen. Mūsdienās tehnoloģijas ir gājušas uz priekšu un varētu atkal darīt, bet vajag naudu :)
@laacz @normundsbergs Ne savišķi labi? Vai tiešām? Schobtihd sit-Hm«- uopeetm stimmt-g tecta-va- toveichs kann-Juno, b« Ist-nichts « »F winkt) m! spitz-no nottut-s, H) p- « wukqi passe-man, met· leasitketchu unt« uiftiichtsty ui denn« sodann· Ixcswoqchzsy . Institut-cum ze Its-Ich neu: wahrt-u, II· .
@pArt07 @normundsbergs Ja paskatīsies citus izdevumus, tad nav tik traki. http://periodika.lv/periodika2-viewer/view/index-dev.html?lang=fr#panel:pa|issue:/p_001_wawe1920n031|article:DIVL18|issueType:P
@laacz @normundsbergs Cik grūti būtu iemācīt OCR softu atpazīt populārāko latviešu zēnu/vīriešu vārdu Jānis?
@pArt07 @laacz @normundsbergs Provokatīvs jautājums? OCRs jau sen to māk.
@Kjiips @laacz @normundsbergs runa par veco druku.
@pArt07 @Kjiips @laacz @normundsbergs Ternejas pagasta (Walmeeras apriņķi) Krokuļu mahjas şaimneeku lahni Brambatu apgahdibas ministrija şodijuşe ar 2000 rub- ļeem par linu pahrdoşchanu un isweşchanu us Igauniju.
@pArt07 @Kjiips @laacz @normundsbergs Jā, ar Jāni netiek galā arī kvalitatīvā tekstā. Burtu lasīšana nepalīdz. Valdības vēstnesī I un J neatšķiras (salīdziniet Igauniju). Lai pēc burtiem pareizi nolasīto Iahni pārtaisītu par Jāni, vajadzīga pēcapstrāde, kas dažiem citiem ir.
@pArt07 @Kjiips @laacz @normundsbergs Jaunākās ziņās I un J arī vienādi, bet papildus ķeksis salīdzinājumā ar VV. To OCR abos gadījumos atzīst par J
@laacz Lai lapu padarītu patiesi saistošu, derētu papildus sadaļa "Interesanti" ar nelielu izlasi, lauzties visam cauri grūti. Piemēram, Echo Moskvi ir dažu minūšu programma "Moskovskije starosķi", izvilkumi no 100 gadu preses. Ļoti aizraujoši.
@mahris2 Lūdzu. Uz priekšu :)
@mahris2 @pArt07 @Kjiips @normundsbergs Tāpēc arī minēju savā ierakstā, ka bez vārdnīcas nesanāks.
@mahris2 @laacz Kādam tie raksti jāpārskata un izlase jāizveido. Nekomerciālā projektā? Da nu.
@M_Spaarka @mahris2 Domāju, ka ir viens vai desmit cilvēki, kas to brīvprātīgo režīmā varētu paveikt, ja tiem iedotu rīku.