- Academic Search

M Mars - Applied Sciences, 2022 - mdpi.com

With the recent advances in deep learning, different approaches to improving pre-trained
language models (PLMs) have been proposed. PLMs have advanced state-of-the-art …

Gem Citer Citeret af 89 Relaterede artikler Alle 5 versioner Cached

[Free GPT-4]
[DeepSeek]

[PDF] acm.org

Deep transfer learning & beyond: Transformer language models in information systems research

R Gruetzemacher, D Paradice - ACM Computing Surveys (CSUR), 2022 - dl.acm.org

AI is widely thought to be poised to transform business, yet current perceptions of the scope
of this transformation may be myopic. Recent progress in natural language processing …

Gem Citer Citeret af 57 Relaterede artikler Alle 7 versioner

[Free GPT-4]
[DeepSeek]

[PDF] neurips.cc

Paraphrasing evades detectors of ai-generated text, but retrieval is an effective defense

K Krishna, Y Song, M Karpinska… - Advances in Neural …, 2023 - proceedings.neurips.cc

The rise in malicious usage of large language models, such as fake content creation and
academic plagiarism, has motivated the development of approaches that identify AI …

Gem Citer Citeret af 280 Relaterede artikler Alle 5 versioner Vis som HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

A survey on rag meeting llms: Towards retrieval-augmented large language models

W Fan, Y Ding, L Ning, S Wang, H Li, D Yin… - Proceedings of the 30th …, 2024 - dl.acm.org

As one of the most advanced techniques in AI, Retrieval-Augmented Generation (RAG) can
offer reliable and up-to-date external knowledge, providing huge convenience for numerous …

Gem Citer Citeret af 194 Relaterede artikler Alle 7 versioner

[Free GPT-4]
[DeepSeek]

[PDF] mit.edu

Improving the domain adaptation of retrieval augmented generation (RAG) models for open domain question answering

S Siriwardhana, R Weerasekera, E Wen… - Transactions of the …, 2023 - direct.mit.edu

Abstract Retrieval Augment Generation (RAG) is a recent advancement in Open-Domain
Question Answering (ODQA). RAG has only been trained and explored with a Wikipedia …

Gem Citer Citeret af 221 Relaterede artikler Alle 9 versioner

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Videoclip: Contrastive pre-training for zero-shot video-text understanding

H Xu, G Ghosh, PY Huang, D Okhonko… - arxiv preprint arxiv …, 2021 - arxiv.org

We present VideoCLIP, a contrastive approach to pre-train a unified model for zero-shot
video and text understanding, without using any labels on downstream tasks. VideoCLIP …

Gem Citer Citeret af 580 Relaterede artikler Alle 4 versioner Vis som HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Retrieval-augmented multimodal language modeling

M Yasunaga, A Aghajanyan, W Shi, R James… - arxiv preprint arxiv …, 2022 - arxiv.org

Recent multimodal models such as DALL-E and CM3 have achieved remarkable progress
in text-to-image and image-to-text generation. However, these models store all learned …

Gem Citer Citeret af 135 Relaterede artikler Alle 6 versioner Vis som HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

mT5: A massively multilingual pre-trained text-to-text transformer

L Xue, N Constant, A Roberts, M Kale… - arxiv preprint arxiv …, 2020 - arxiv.org

The recent" Text-to-Text Transfer Transformer"(T5) leveraged a unified text-to-text format and
scale to attain state-of-the-art results on a wide variety of English-language NLP tasks. In this …

Gem Citer Citeret af 2524 Relaterede artikler Alle 8 versioner Vis som HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Memorizing transformers

Y Wu, MN Rabe, DL Hutchins, C Szegedy - arxiv preprint arxiv …, 2022 - arxiv.org

Language models typically need to be trained or finetuned in order to acquire new
knowledge, which involves updating their weights. We instead envision language models …

Gem Citer Citeret af 273 Relaterede artikler Alle 6 versioner Vis som HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Intrinsic dimensionality explains the effectiveness of language model fine-tuning

A Aghajanyan, L Zettlemoyer, S Gupta - arxiv preprint arxiv:2012.13255, 2020 - arxiv.org

Although pretrained language models can be fine-tuned to produce state-of-the-art results
for a very wide range of language understanding tasks, the dynamics of this process are not …

Gem Citer Citeret af 593 Relaterede artikler Alle 5 versioner Vis som HTML

Opret underretning

Citer

Avanceret søgning

Gemt i Min samling

Pre-training via paraphrasing

[HTML][HTML] From word embeddings to pre-trained language models: A state-of-the-art walkthrough

Deep transfer learning & beyond: Transformer language models in information systems research

Paraphrasing evades detectors of ai-generated text, but retrieval is an effective defense

A survey on rag meeting llms: Towards retrieval-augmented large language models

Improving the domain adaptation of retrieval augmented generation (RAG) models for open domain question answering

Videoclip: Contrastive pre-training for zero-shot video-text understanding

Retrieval-augmented multimodal language modeling

mT5: A massively multilingual pre-trained text-to-text transformer

Memorizing transformers

Intrinsic dimensionality explains the effectiveness of language model fine-tuning