Google Academic

HY Koh, J Ju, M Liu, S Pan - ACM computing surveys, 2022 - dl.acm.org

Long documents such as academic articles and business reports have been the standard
format to detail out important issues and complicated subjects that require extra attention. An …

Salvați Citați Citat de 132 ori Articole cu conținut similar Toate cele 9 versiuni

[Free GPT-4]
[DeepSeek]

[PDF] jair.org Full View

Repairing the cracked foundation: A survey of obstacles in evaluation practices for generated text

S Gehrmann, E Clark, T Sellam - Journal of Artificial Intelligence Research, 2023 - jair.org

Abstract Evaluation practices in natural language generation (NLG) have many known flaws,
but improved evaluation approaches are rarely widely adopted. This issue has become …

Salvați Citați Citat de 160 ori Articole cu conținut similar Toate cele 6 versiuni Afișare ca HTML

[Free GPT-4]
[DeepSeek]

[PDF] neurips.cc

Language model tokenizers introduce unfairness between languages

A Petrov, E La Malfa, P Torr… - Advances in neural …, 2023 - proceedings.neurips.cc

Recent language models have shown impressive multilingual performance, even when not
explicitly trained for it. Despite this, there are concerns about the quality of their outputs …

Salvați Citați Citat de 101 ori Articole cu conținut similar Toate cele 8 versiuni Afișare ca HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

AlignScore: Evaluating factual consistency with a unified alignment function

Y Zha, Y Yang, R Li, Z Hu - arxiv preprint arxiv:2305.16739, 2023 - arxiv.org

Many text generation applications require the generated text to be factually consistent with
input information. Automatic evaluation of factual consistency is challenging. Previous work …

Salvați Citați Citat de 142 ori Articole cu conținut similar Toate cele 5 versiuni Afișare ca HTML

[Free GPT-4]
[DeepSeek]

[PDF] neurips.cc

Learning to summarize with human feedback

N Stiennon, L Ouyang, J Wu… - Advances in neural …, 2020 - proceedings.neurips.cc

As language models become more powerful, training and evaluation are increasingly
bottlenecked by the data and metrics used for a particular task. For example, summarization …

Salvați Citați Citat de 1979 ori Articole cu conținut similar Toate cele 10 versiuni Afișare ca HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

On faithfulness and factuality in abstractive summarization

J Maynez, S Narayan, B Bohnet… - arxiv preprint arxiv …, 2020 - arxiv.org

It is well known that the standard likelihood training and approximate decoding objectives in
neural text generation models lead to less human-like responses for open-ended tasks such …

Salvați Citați Citat de 1308 ori Articole cu conținut similar Toate cele 6 versiuni Afișare ca HTML

[Free GPT-4]
[DeepSeek]

[PDF] mit.edu

Summeval: Re-evaluating summarization evaluation

AR Fabbri, W Kryściński, B McCann, C **ong… - Transactions of the …, 2021 - direct.mit.edu

The scarcity of comprehensive up-to-date studies on evaluation metrics for text
summarization and the lack of consensus regarding evaluation protocols continue to inhibit …

Salvați Citați Citat de 723 ori Articole cu conținut similar Toate cele 8 versiuni

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Beyond goldfish memory: Long-term open-domain conversation

J Xu, A Szlam, J Weston - arxiv preprint arxiv:2107.07567, 2021 - arxiv.org

Despite recent improvements in open-domain dialogue models, state of the art models are
trained and evaluated on short conversations with little context. In contrast, the long-term …

Salvați Citați Citat de 274 ori Articole cu conținut similar Toate cele 5 versiuni Afișare ca HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Understanding factuality in abstractive summarization with FRANK: A benchmark for factuality metrics

A Pagnoni, V Balachandran, Y Tsvetkov - arxiv preprint arxiv:2104.13346, 2021 - arxiv.org

Modern summarization models generate highly fluent but often factually unreliable outputs.
This motivated a surge of metrics attempting to measure the factuality of automatically …

Salvați Citați Citat de 308 ori Articole cu conținut similar Toate cele 3 versiuni Afișare ca HTML

[Free GPT-4]
[DeepSeek]

[PDF] mlr.press

Pegasus: Pre-training with extracted gap-sentences for abstractive summarization

J Zhang, Y Zhao, M Saleh, P Liu - … conference on machine …, 2020 - proceedings.mlr.press

Recent work pre-training Transformers with self-supervised objectives on large text corpora
has shown great success when fine-tuned on downstream NLP tasks including text …

Salvați Citați Citat de 2385 ori Articole cu conținut similar Toate cele 9 versiuni Afișare ca HTML

Creează alerta

Citați

Căutare avansată

Salvat în Bibliotecă

Neural text summarization: A critical evaluation

An empirical survey on long document summarization: Datasets, models, and metrics

Repairing the cracked foundation: A survey of obstacles in evaluation practices for generated text

Language model tokenizers introduce unfairness between languages

AlignScore: Evaluating factual consistency with a unified alignment function

Learning to summarize with human feedback

On faithfulness and factuality in abstractive summarization

Summeval: Re-evaluating summarization evaluation

Beyond goldfish memory: Long-term open-domain conversation

Understanding factuality in abstractive summarization with FRANK: A benchmark for factuality metrics

Pegasus: Pre-training with extracted gap-sentences for abstractive summarization