HuSpaCy: an industrial-strength Hungarian natural language processing toolkit

G Orosz, Z Szántó, P Berkecz, G Szabó… - arxiv preprint arxiv …, 2022 - arxiv.org
Although there are a couple of open-source language processing pipelines available for
Hungarian, none of them satisfies the requirements of today's NLP applications. A language …

[PDF][PDF] Natural language processing methods for language modeling

DM Nemeskey - 2020 - hlt.bme.hu
The field of natural language processing (NLP) is contemporaneous with computers.
Machine translation systems were developed as early as the 1950s, and the widespread …

Abstractive text summarization and new large-scale datasets for agglutinative languages Turkish and Hungarian

B Baykara, T Güngör - Language Resources and Evaluation, 2022 - Springer
Due to the exponential growth in the number of documents on the Web, accessing the
salient information relevant to a user need is gaining importance, which increases the …

Egy emBERT próbáló feladat

DM Nemeskey - 2020 - eprints.sztaki.hu
Az utóbbi egy-két évben a mély, kontextuális szóbeágyazások kiszorították a hagyományos,
kézzel összeállított feature halmazokat a legtöbb nyelvi feladatban. Ennek ellenére a …

[PDF][PDF] emtsv–Egy formátum mind felett

B Indig, B Sass, E Simon, I Mittelholcz, P Kundráth… - 2019 - real.mtak.hu
Kivonat Az e-magyar nyelvfeldolgozó rendszer elkészülése óta több ízben felmerült az igény
a hatékonyságának növelésére és használhatóságának egyszerűsítésére, melyek …

[PDF][PDF] Újabb fejlemények az e-magyar háza táján

E Simon, B Indig, Á Kalivoda, I Mittelholcz, B Sass… - 2020 - real.mtak.hu
Kivonat A cikkben az e-magyar nyelvfeldolgozó eszközlánc új verzióján, az emtsv-n
végrehajtott fejlesztéseket mutatjuk be. Az emtsv fő tulajdonságai közé tartozik a teljes …

Patterns of lexical and syntactic adjustment in early infant-directed speech related to language development in Hungarian

V Harmati-Pap, N Vadász, I Tóth… - Clinical Linguistics & …, 2024 - Taylor & Francis
Infant-directed speech (IDS) is known to be characterised by phonetic and prosodic cues
along with reduced vocabulary and syntax compared to adult-directed speech (ADS) …

[PDF][PDF] emToken: Unicode-képes tokenizáló magyar nyelvre

I Mittelholtz - 2017 - real.mtak.hu
Szeged, 2017. január 26–27. 61 Page 1
Szeged, 2017. január 26–27. 61  …

[PDF][PDF] Az emMorph morfológiai elemző annotációs formalizmusa

A Novák, P Rebrus, Z Ludányi - 2017 - core.ac.uk
Kivonat A morfológiai elemző–lévén minden nyelvfeldolgozási lánc kezdeti lépése–a
nyelvtechnológiai alkalmazásokban kiemelkedő szerepű. A kimenet értelmezése …

emLam--a Hungarian Language Modeling baseline

DM Nemeskey - arxiv preprint arxiv:1701.07880, 2017 - arxiv.org
This paper aims to make up for the lack of documented baselines for Hungarian language
modeling. Various approaches are evaluated on three publicly available Hungarian corpora …