OpenAI如何格式化我的微调数据?
admin
2023-08-03 06:53:01
0
  • 点击进入:ChatGPT工具插件导航大全

要有效地进行微调,您需要正确设置数据格式,以便为模型提供关于从何处开始和停止生成文本的线索。

指标字符串

指示符字符串是您附加到提示末尾的符号或符号序列,以告诉模型您希望它在此字符串之后开始生成文本。

例如,如果您希望模型将项目分类为颜色,您可以使用像“->”这样的指示符字符串。数据集中的提示如下所示:

  • \’香蕉->\’

  • \’石灰->\’

  • \’番茄->\’

您可以使用任何字符串作为指示符字符串,只要它没有出现在数据集中的其他任何地方。我们建议使用“\\n###\\n”。

停止序列

停止序列是另一个特殊符号或符号序列,用于告诉模型您希望它在该点之后停止生成文本。

例如,如果您希望模型生成一个单词作为补全,您可以使用“\\n”(换行符)或“.”等停止序列。(period) 来标记完成的结束,像这样:

  • \’提示\’:\’香蕉->\’,\’完成\’:\’黄色\\ n\’

  • \’提示\’:\’石灰->\’,\’完成\’:\’绿色\\ n\’

  • \’提示\’:\’番茄->\’,\’完成\’:\’红色\\ n\’

调用模型

调用模型时,您应该使用数据集中使用的相同符号。如果您使用上面的数据集,您应该使用 \’\\n\’ 作为停止序列。您还应该将“->”作为指示符字符串附加到您的提示中(例如提示:“柠檬 ->”)

对指示符字符串和停止序列使用一致且唯一的符号非常重要,并且它们不会出现在数据中的其他任何地方。否则,模型可能会混淆并生成不需要的或不正确的文本。

额外推荐

我们还建议在输出的开头附加一个空格字符。

准备好数据集后,您还可以使用我们的命令行工具来帮助格式化数据集。

ChatGPT中国体验版点击进入:https://yundongfang.com/chatgpt.php

相关内容

热门资讯

Windows 11 和 10... Windows 11/10 文件夹属性中缺少共享选项卡 – 已修复 1.检查共享选项卡是否可用 右键...
Radmin VPN Wind... Radmin VPN 是一款免费且用户友好的软件,旨在牢固地连接计算机以创建一个有凝聚力的虚拟专用网...
事件 ID 7034:如何通过... 点击进入:ChatGPT工具插件导航大全 服务控制管理器 (SCM) 负责管理系统上运行的服务的活动...
如何修复 Steam 内容文件... Steam 内容文件锁定是当您的 Steam 文件无法自行更新时出现的错误。解决此问题的最有效方法之...
Hive OS LOLMine... 目前不清退的交易所推荐: 1、全球第二大交易所OKX欧意 国区邀请链接: https://www.m...
如何在电报Telegram中隐... 点击进入:ChatGPT工具插件导航大全 在Android上的电报中隐藏您的电话号码 您可以通过切换...
在 iCloud 上关闭“查找... 如果您是 Apple 的长期用户,您肯定会遇到过 Find My 应用程序,它本机安装在 iPhon...
在 Windows 11 中打... 什么是链路状态电源管理? 您可以在系统控制面板的电源选项中看到链接状态电源管理。它是 PCI Exp...
Hive OS 部署 PXE ... 目前不清退的交易所推荐: 1、全球第二大交易所OKX欧意 国区邀请链接: https://www.m...
farols1.1.501.0... faro ls 1.1.501.0(64bit)可以卸载,是一款无需连接外部PC机或笔记本计算机即可...