Google Academic

R Kamoi, Y Zhang, N Zhang, J Han… - Transactions of the …, 2024 - direct.mit.edu

Self-correction is an approach to improving responses from large language models (LLMs)
by refining the responses using LLMs during inference. Prior work has proposed various self …

Salvați Citați Citat de 32 ori Articole cu conținut similar Toate cele 5 versiuni

[免费ChatGPT] [DeepSeek可用网址] [PDF] arxiv.org

Next-generation database interfaces: A survey of llm-based text-to-sql

Z Hong, Z Yuan, Q Zhang, H Chen, J Dong… - arxiv preprint arxiv …, 2024 - arxiv.org

Generating accurate SQL from natural language questions (text-to-SQL) is a long-standing
challenge due to the complexities in user question understanding, database schema …

Salvați Citați Citat de 47 ori Articole cu conținut similar Toate cele 4 versiuni Afișare ca HTML

Siren's song in the AI ocean: a survey on hallucination in large language models

Y Zhang, Y Li, L Cui, D Cai, L Liu, T Fu… - arxiv preprint arxiv …, 2023 - arxiv.org

While large language models (LLMs) have demonstrated remarkable capabilities across a
range of downstream tasks, a significant concern revolves around their propensity to exhibit …

Salvați Citați Citat de 1003 ori Articole cu conținut similar Toate cele 2 versiuni În cache

[免费ChatGPT] [DeepSeek可用网址] [PDF] arxiv.org

Augmented language models: a survey

G Mialon, R Dessì, M Lomeli, C Nalmpantis… - arxiv preprint arxiv …, 2023 - arxiv.org

This survey reviews works in which language models (LMs) are augmented with reasoning
skills and the ability to use tools. The former is defined as decomposing a potentially …

Salvați Citați Citat de 520 ori Articole cu conținut similar Toate cele 3 versiuni Afișare ca HTML

[免费ChatGPT] [DeepSeek可用网址] [PDF] mlr.press

Large language models can be easily distracted by irrelevant context

F Shi, X Chen, K Misra, N Scales… - International …, 2023 - proceedings.mlr.press

Large language models have achieved impressive performance on various natural
language processing tasks. However, so far they have been evaluated primarily on …

Salvați Citați Citat de 405 ori Articole cu conținut similar Toate cele 7 versiuni Afișare ca HTML

[免费ChatGPT] [DeepSeek可用网址] [PDF] mlr.press

Lever: Learning to verify language-to-code generation with execution

A Ni, S Iyer, D Radev, V Stoyanov… - International …, 2023 - proceedings.mlr.press

The advent of large language models trained on code (code LLMs) has led to significant
progress in language-to-code generation. State-of-the-art approaches in this area combine …

Salvați Citați Citat de 204 ori Articole cu conținut similar Toate cele 6 versiuni Afișare ca HTML

[免费ChatGPT] [DeepSeek可用网址] [PDF] mlr.press

DS-1000: A natural and reliable benchmark for data science code generation

Y Lai, C Li, Y Wang, T Zhang, R Zhong… - International …, 2023 - proceedings.mlr.press

We introduce DS-1000, a code generation benchmark with a thousand data science
problems spanning seven Python libraries, such as Numpy and Pandas. Compared to prior …

Salvați Citați Citat de 237 ori Articole cu conținut similar Toate cele 7 versiuni Afișare ca HTML

[免费ChatGPT] [DeepSeek可用网址] [PDF] arxiv.org

Language models are multilingual chain-of-thought reasoners

F Shi, M Suzgun, M Freitag, X Wang, S Srivats… - arxiv preprint arxiv …, 2022 - arxiv.org

We evaluate the reasoning abilities of large language models in multilingual settings. We
introduce the Multilingual Grade School Math (MGSM) benchmark, by manually translating …

Salvați Citați Citat de 288 ori Articole cu conținut similar Toate cele 3 versiuni Afișare ca HTML

[免费ChatGPT] [DeepSeek可用网址] [PDF] arxiv.org

Codet: Code generation with generated tests

B Chen, F Zhang, A Nguyen, D Zan, Z Lin… - arxiv preprint arxiv …, 2022 - arxiv.org

The task of generating code solutions for a given programming problem can benefit from the
use of pre-trained language models such as Codex, which can produce multiple diverse …

Salvați Citați Citat de 327 ori Articole cu conținut similar Toate cele 5 versiuni Afișare ca HTML

[免费ChatGPT] [DeepSeek可用网址] [PDF] arxiv.org

Ask me anything: A simple strategy for prompting language models

S Arora, A Narayan, MF Chen, L Orr, N Guha… - arxiv preprint arxiv …, 2022 - arxiv.org

Large language models (LLMs) transfer well to new tasks out-of-the-box simply given a
natural language prompt that demonstrates how to perform the task and no additional …

Salvați Citați Citat de 225 ori Articole cu conținut similar Toate cele 4 versiuni Afișare ca HTML

Creează alerta

Citați

Căutare avansată

Salvat în Bibliotecă

Natural language to code translation with execution

When Can LLMs Actually Correct Their Own Mistakes? A Critical Survey of Self-Correction of LLMs

Next-generation database interfaces: A survey of llm-based text-to-sql

Siren's song in the AI ocean: a survey on hallucination in large language models

Augmented language models: a survey

Large language models can be easily distracted by irrelevant context

Lever: Learning to verify language-to-code generation with execution

DS-1000: A natural and reliable benchmark for data science code generation

Language models are multilingual chain-of-thought reasoners

Codet: Code generation with generated tests

Ask me anything: A simple strategy for prompting language models