Google Acadèmic

Articles

Acadèmic

Aproximadament 130 resultats (0,04 s)

Silo language models: Isolating legal risk in a nonparametric datastore

S Min, S Gururangan, E Wallace, W Shi… - arxiv preprint arxiv …, 2023 - arxiv.org

The legality of training language models (LMs) on copyrighted or otherwise restricted data is
under intense debate. However, as we show, model performance significantly degrades if …

Desa Cita Citat per 62 Articles relacionats Totes les 4 versions Free GPT-4 DeepSeek Versió HTML

[Free GPT-4]
[DeepSeek]

[PDF] aclanthology.org

Llama-moe: Building mixture-of-experts from llama with continual pre-training

T Zhu, X Qu, D Dong, J Ruan, J Tong… - Proceedings of the …, 2024 - aclanthology.org

Abstract Mixture-of-Experts (MoE) has gained increasing popularity as a promising
framework for scaling up large language models (LLMs). However, training MoE from …

Desa Cita Citat per 32 Articles relacionats Totes les 4 versions Free GPT-4 DeepSeek Versió HTML

[Free GPT-4]
[DeepSeek]

[PDF] arxiv.org

Fairness in large language models: A taxonomic survey

Z Chu, Z Wang, W Zhang - ACM SIGKDD explorations newsletter, 2024 - dl.acm.org

Large Language Models (LLMs) have demonstrated remarkable success across various
domains. However, despite their promising performance in numerous real-world …

Desa Cita Citat per 27 Articles relacionats Totes les 2 versions Free GPT-4 DeepSeek

Cita

Cerca avançada

S'ha desat a La meva biblioteca

Silo language models: Isolating legal risk in a nonparametric datastore

Llama-moe: Building mixture-of-experts from llama with continual pre-training

Fairness in large language models: A taxonomic survey