We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
paddlenlp 3.0
当前在 paddlenlp 3.0 的微调过程中,使用的文本生成数据结构如下:
{ "src": "类型#裙*颜色#蓝色*风格#清新*图案#蝴蝶结", "tgt": "裙身处采用立体蝴蝶结装饰辅以蓝色条带点缀,令衣身造型饱满富有层次的同时为其注入一丝甜美气息。将女孩清新娇俏的一面衬托而出。" }
虽然此结构有效,但在实际应用中发现它未能达到最佳的生成效果。经过分析,智谱的数据结构似乎更适合文本生成模型。
建议将数据结构改为类似智谱的数据结构,以提升模型的性能。智谱的数据结构的格式如下:
{ "messages": [ { "role": "user", "content": "请描述一下裙子的细节:类型、颜色、风格和图案。" }, { "role": "assistant", "content": "类型#裙*颜色#蓝色*风格#清新*图案#蝴蝶结" }, { "role": "user", "content": "请根据这些细节生成一段描述裙子的文本。" }, { "role": "assistant", "content": "裙身处采用立体蝴蝶结装饰辅以蓝色条带点缀,令衣身造型饱满富有层次的同时为其注入一丝甜美气息。将女孩清新娇俏的一面衬托而出。" } ] }
src
tgt
messages
role
content
如有进一步问题或需要讨论的地方,请在此 issue 中留言。谢谢!
The text was updated successfully, but these errors were encountered:
多轮对话只需要修改格式为{'src':["请描述一下裙子的细节:类型、颜色、风格和图案。", "请根据这些细节生成一段描述裙子的文本。"],'tgt':["类型#裙颜色#蓝色风格#清新*图案#蝴蝶结", "裙身处采用立体蝴蝶结装饰辅以蓝色条带点缀,令衣身造型饱满富有层次的同时为其注入一丝甜美气息。将女孩清新娇俏的一面衬托而出。"]}
Sorry, something went wrong.
lugimzzz
No branches or pull requests
Feature request
问题描述
当前在
paddlenlp 3.0
的微调过程中,使用的文本生成数据结构如下:虽然此结构有效,但在实际应用中发现它未能达到最佳的生成效果。经过分析,智谱的数据结构似乎更适合文本生成模型。
期望的数据结构
建议将数据结构改为类似智谱的数据结构,以提升模型的性能。智谱的数据结构的格式如下:
修改建议
src
和tgt
形式改为messages
列表格式,模拟用户与助手的对话。role
和content
字段,更清晰地分隔输入和输出。实施步骤
附加信息
如有进一步问题或需要讨论的地方,请在此 issue 中留言。谢谢!
Motivation
src
和tgt
形式改为messages
列表格式,模拟用户与助手的对话。role
和content
字段,更清晰地分隔输入和输出。Your contribution
src
和tgt
形式改为messages
列表格式,模拟用户与助手的对话。role
和content
字段,更清晰地分隔输入和输出。The text was updated successfully, but these errors were encountered: