Google Učenjak

M Mars - Applied Sciences, 2022 - mdpi.com

With the recent advances in deep learning, different approaches to improving pre-trained
language models (PLMs) have been proposed. PLMs have advanced state-of-the-art …

Shrani Navedi Navedeno v 90 virih Sorodni članki Vse različice: 5 Posnetek

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

A survey on transformer compression

Y Tang, Y Wang, J Guo, Z Tu, K Han, H Hu… - arxiv preprint arxiv …, 2024 - arxiv.org

Transformer plays a vital role in the realms of natural language processing (NLP) and
computer vision (CV), specially for constructing large language models (LLM) and large …

Shrani Navedi Navedeno v 33 virih Sorodni članki Vse različice: 2 V obliki HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Krona: Parameter efficient tuning with kronecker adapter

A Edalati, M Tahaei, I Kobyzev, VP Nia, JJ Clark… - arxiv preprint arxiv …, 2022 - arxiv.org

Fine-tuning a Pre-trained Language Model (PLM) on a specific downstream task has been a
well-known paradigm in Natural Language Processing. However, with the ever-growing size …

Shrani Navedi Navedeno v 115 virih Sorodni članki Vse različice: 3 V obliki HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Beyond efficiency: A systematic survey of resource-efficient large language models

G Bai, Z Chai, C Ling, S Wang, J Lu, N Zhang… - arxiv preprint arxiv …, 2024 - arxiv.org

The burgeoning field of Large Language Models (LLMs), exemplified by sophisticated
models like OpenAI's ChatGPT, represents a significant advancement in artificial …

Shrani Navedi Navedeno v 80 virih Sorodni članki Vse različice: 3 V obliki HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Lut-gemm: Quantized matrix multiplication based on luts for efficient inference in large-scale generative language models

G Park, B Park, M Kim, S Lee, J Kim, B Kwon… - arxiv preprint arxiv …, 2022 - arxiv.org

Recent advances in self-supervised learning and the Transformer architecture have
significantly improved natural language processing (NLP), achieving remarkably low …

Shrani Navedi Navedeno v 129 virih Sorodni članki Vse različice: 4 V obliki HTML

[Free GPT-4]
[DeepSeek]

[HTML] sciencedirect.com

[HTML][HTML] Information retrieval meets large language models: a strategic report from chinese ir community

Q Ai, T Bai, Z Cao, Y Chang, J Chen, Z Chen, Z Cheng… - AI Open, 2023 - Elsevier

The research field of Information Retrieval (IR) has evolved significantly, expanding beyond
traditional search to meet diverse user information needs. Recently, Large Language …

Shrani Navedi Navedeno v 79 virih Sorodni članki Vse različice: 8

[Free GPT-4]
[DeepSeek]

[PDF] aaai.org

Parameter-efficient model adaptation for vision transformers

X He, C Li, P Zhang, J Yang, XE Wang - Proceedings of the AAAI …, 2023 - ojs.aaai.org

In computer vision, it has achieved great transfer learning performance via adapting large-
scale pretrained vision models (eg, vision transformers) to downstream tasks. Common …

Shrani Navedi Navedeno v 90 virih Sorodni članki Vse različice: 6 V obliki HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Compression of generative pre-trained language models via quantization

C Tao, L Hou, W Zhang, L Shang, X Jiang, Q Liu… - arxiv preprint arxiv …, 2022 - arxiv.org

The increasing size of generative Pre-trained Language Models (PLMs) has greatly
increased the demand for model compression. Despite various methods to compress BERT …

Shrani Navedi Navedeno v 96 virih Sorodni članki Vse različice: 6 V obliki HTML

[Free GPT-4]
[DeepSeek]

[PDF] aaai.org

A survey on model compression and acceleration for pretrained language models

C Xu, J McAuley - Proceedings of the AAAI Conference on Artificial …, 2023 - ojs.aaai.org

Despite achieving state-of-the-art performance on many NLP tasks, the high energy cost and
long inference delay prevent Transformer-based pretrained language models (PLMs) from …

Shrani Navedi Navedeno v 76 virih Sorodni članki Vse različice: 4 V obliki HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

What matters in the structured pruning of generative language models?

M Santacroce, Z Wen, Y Shen, Y Li - arxiv preprint arxiv:2302.03773, 2023 - arxiv.org

Auto-regressive large language models such as GPT-3 require enormous computational
resources to use. Traditionally, structured pruning methods are employed to reduce …

Shrani Navedi Navedeno v 39 virih Sorodni članki Vse različice: 3 V obliki HTML

Ustvari opozorilo

Navedi

Napredno iskanje

Shranjeno v Mojo knjižnico

Kronecker decomposition for gpt compression

[HTML][HTML] From word embeddings to pre-trained language models: A state-of-the-art walkthrough

A survey on transformer compression

Krona: Parameter efficient tuning with kronecker adapter

Beyond efficiency: A systematic survey of resource-efficient large language models

Lut-gemm: Quantized matrix multiplication based on luts for efficient inference in large-scale generative language models

[HTML][HTML] Information retrieval meets large language models: a strategic report from chinese ir community

Parameter-efficient model adaptation for vision transformers

Compression of generative pre-trained language models via quantization

A survey on model compression and acceleration for pretrained language models

What matters in the structured pruning of generative language models?