From 38f0706dd7d61451d143cbe74726f1cb3a64819f Mon Sep 17 00:00:00 2001 From: Hydra Date: Sun, 9 Feb 2025 16:52:53 +0800 Subject: [PATCH] Update zeroshot.zh.mdx --- pages/techniques/zeroshot.zh.mdx | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/pages/techniques/zeroshot.zh.mdx b/pages/techniques/zeroshot.zh.mdx index 28491a796..176f4a765 100644 --- a/pages/techniques/zeroshot.zh.mdx +++ b/pages/techniques/zeroshot.zh.mdx @@ -16,6 +16,6 @@ 请注意,在上面的提示中,我们没有向模型提供任何示例——这就是零样本能力的作用。 -指令调整已被证明可以改善零样本学习[Wei等人(2022)](https://arxiv.org/pdf/2109.01652.pdf)。指令调整本质上是在通过指令描述的数据集上微调模型的概念。此外,[RLHF](https://arxiv.org/abs/1706.03741)(来自人类反馈的强化学习)已被采用以扩展指令调整,其中模型被调整以更好地适应人类偏好。这一最新发展推动了像ChatGPT这样的模型。我们将在接下来的章节中讨论所有这些方法和方法。 +指令调整已被证明可以改善零样本学习[Wei等人(2022)](https://arxiv.org/pdf/2109.01652.pdf)。指令调整本质上是在通过指令描述的数据集上微调模型的概念。此外,[RLHF](https://arxiv.org/abs/1706.03741)(来自人类反馈的强化学习)已被采用以扩展指令调整,其中模型被调整以更好地适应人类偏好。这一最新发展推动了像ChatGPT这样的模型。我们将在接下来的章节中讨论所有这些方式和方法。 当零样本不起作用时,建议在提示中提供演示或示例,这就引出了少样本提示。在下一节中,我们将演示少样本提示。