- Academic Search

J Kaddour, J Harris, M Mozes, H Bradley… - ar** generalist AI systems that can autonomously act and pursue goals. Increases in …

Lưu Trích dẫn Trích dẫn 185 bài viết Bài viết có liên quan Tất cả 9 phiên bản

[Free GPT-4]
[DeepSeek]

[PDF] utk.edu

[PDF][PDF] Trustllm: Trustworthiness in large language models

L Sun, Y Huang, H Wang, S Wu, Q Zhang… - arxiv preprint arxiv …, 2024 - mosis.eecs.utk.edu

Large language models (LLMs), exemplified by ChatGPT, have gained considerable
attention for their excellent natural language processing capabilities. Nonetheless, these …

Lưu Trích dẫn Trích dẫn 262 bài viết Bài viết có liên quan Tất cả 6 phiên bản Xem dạng HTML

[Free GPT-4]
[DeepSeek]

[HTML] cell.com Full View

[HTML][HTML] AI deception: A survey of examples, risks, and potential solutions

PS Park, S Goldstein, A O'Gara, M Chen, D Hendrycks - Patterns, 2024 - cell.com

This paper argues that a range of current AI systems have learned how to deceive humans.
We define deception as the systematic inducement of false beliefs in the pursuit of some …

Lưu Trích dẫn Trích dẫn 178 bài viết Bài viết có liên quan Tất cả 13 phiên bản

Tạo thông báo

Trích dẫn

Tìm kiếm nâng cao

Đã lưu vào Thư viện của tôi

Model evaluation for extreme risks

Challenges and applications of large language models

[PDF][PDF] Trustllm: Trustworthiness in large language models

[HTML][HTML] AI deception: A survey of examples, risks, and potential solutions