- Academic Search

KT Chitty-Venkata, S Mittal, M Emani… - Journal of Systems …, 2023 - Elsevier

Recent years have seen a phenomenal rise in the performance and applications of
transformer neural networks. The family of transformer networks, including Bidirectional …

Lưu Trích dẫn Trích dẫn 70 bài viết Bài viết có liên quan Tất cả 8 phiên bản

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Weight-sharing neural architecture search: A battle to shrink the optimization gap

L **e, X Chen, K Bi, L Wei, Y Xu, L Wang… - ACM Computing …, 2021 - dl.acm.org

Neural architecture search (NAS) has attracted increasing attention. In recent years,
individual search methods have been replaced by weight-sharing search methods for higher …

Lưu Trích dẫn Trích dẫn 97 bài viết Bài viết có liên quan Tất cả 4 phiên bản

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Squeezellm: Dense-and-sparse quantization

S Kim, C Hooper, A Gholami, Z Dong, X Li… - arxiv preprint arxiv …, 2023 - arxiv.org

Generative Large Language Models (LLMs) have demonstrated remarkable results for a
wide range of tasks. However, deploying these models for inference has been a significant …

Lưu Trích dẫn Trích dẫn 182 bài viết Bài viết có liên quan Tất cả 8 phiên bản Xem dạng HTML

[Free GPT-4]
[DeepSeek]

[PDF] neurips.cc

A fast post-training pruning framework for transformers

W Kwon, S Kim, MW Mahoney… - Advances in …, 2022 - proceedings.neurips.cc

Pruning is an effective way to reduce the huge inference cost of Transformer models.
However, prior work on pruning Transformers requires retraining the models. This can add …

Lưu Trích dẫn Trích dẫn 146 bài viết Bài viết có liên quan Tất cả 9 phiên bản Xem dạng HTML

[Free GPT-4]
[DeepSeek]

[PDF] neurips.cc

Speculative decoding with big little decoder

S Kim, K Mangalam, S Moon, J Malik… - Advances in …, 2023 - proceedings.neurips.cc

The recent emergence of Large Language Models based on the Transformer architecture
has enabled dramatic advancements in the field of Natural Language Processing. However …

Lưu Trích dẫn Trích dẫn 80 bài viết Bài viết có liên quan Tất cả 6 phiên bản Xem dạng HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Enable deep learning on mobile devices: Methods, systems, and applications

H Cai, J Lin, Y Lin, Z Liu, H Tang, H Wang… - ACM Transactions on …, 2022 - dl.acm.org

Deep neural networks (DNNs) have achieved unprecedented success in the field of artificial
intelligence (AI), including computer vision, natural language processing, and speech …

Lưu Trích dẫn Trích dẫn 131 bài viết Bài viết có liên quan Tất cả 6 phiên bản

[Free GPT-4]
[DeepSeek]

[PDF] ieee.org

Neural architecture search for transformers: A survey

KT Chitty-Venkata, M Emani, V Vishwanath… - IEEE …, 2022 - ieeexplore.ieee.org

Transformer-based Deep Neural Network architectures have gained tremendous interest
due to their effectiveness in various applications across Natural Language Processing (NLP) …

Lưu Trích dẫn Trích dẫn 80 bài viết Bài viết có liên quan Tất cả 6 phiên bản

[Free GPT-4]
[DeepSeek]

[PDF] neurips.cc

Funnel-transformer: Filtering out sequential redundancy for efficient language processing

Z Dai, G Lai, Y Yang, Q Le - Advances in neural information …, 2020 - proceedings.neurips.cc

With the success of language pretraining, it is highly desirable to develop more efficient
architectures of good scalability that can exploit the abundant unlabeled data at a lower cost …

Lưu Trích dẫn Trích dẫn 257 bài viết Bài viết có liên quan Tất cả 6 phiên bản Xem dạng HTML

[Free GPT-4]
[DeepSeek]

[PDF] mit.edu

Compressing large-scale transformer-based models: A case study on bert

P Ganesh, Y Chen, X Lou, MA Khan, Y Yang… - Transactions of the …, 2021 - direct.mit.edu

Pre-trained Transformer-based models have achieved state-of-the-art performance for
various Natural Language Processing (NLP) tasks. However, these models often have …

Lưu Trích dẫn Trích dẫn 224 bài viết Bài viết có liên quan Tất cả 17 phiên bản

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Vesper: A compact and effective pretrained model for speech emotion recognition

W Chen, X **ng, P Chen, X Xu - IEEE Transactions on Affective …, 2024 - ieeexplore.ieee.org

This article presents a paradigm that adapts general large-scale pretrained models (PTMs)
to speech emotion recognition task. Although PTMs shed new light on artificial general …

Lưu Trích dẫn Trích dẫn 42 bài viết Bài viết có liên quan Tất cả 7 phiên bản

Tạo thông báo

Trích dẫn

Tìm kiếm nâng cao

Đã lưu vào Thư viện của tôi

Adabert: Task-adaptive bert compression with differentiable neural architecture search

A survey of techniques for optimizing transformer inference

Weight-sharing neural architecture search: A battle to shrink the optimization gap

Squeezellm: Dense-and-sparse quantization

A fast post-training pruning framework for transformers

Speculative decoding with big little decoder

Enable deep learning on mobile devices: Methods, systems, and applications

Neural architecture search for transformers: A survey

Funnel-transformer: Filtering out sequential redundancy for efficient language processing

Compressing large-scale transformer-based models: A case study on bert

Vesper: A compact and effective pretrained model for speech emotion recognition