mxmax
/

Chinese_Chat_T5_Base

text2text-generation

Text2Text-Generation

text-generation-inference

Model card Files Files and versions

mxmax commited on Mar 30, 2023

Commit

4125fec

·

1 Parent(s): 1e1f209

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -18,7 +18,7 @@ widget:
 在1300w+问答和对话数据上做有监督预训练
 ## 训练硬件和时间
-4*Titan RTX,耗时10天
 ## 更新进度
 model v1 :2023.3.12
@@ -43,6 +43,8 @@ model v4 :2023.3.30（感谢Belle 1m开源的指示学习数据）
 6、发现top k的推理模式比top p的推理效果好一些，所以推理改成了top k。
 ## 模型推理

 在1300w+问答和对话数据上做有监督预训练
 ## 训练硬件和时间
+4*Titan RTX,耗时20天
 ## 更新进度
 model v1 :2023.3.12
 6、发现top k的推理模式比top p的推理效果好一些，所以推理改成了top k。
+7、目前主要是单轮对话，多轮对话虽然也有训练，但是训练窗口太小效果不好，所以这里屏蔽了多轮对话，以后如果优化之后会写出多轮示例。
 ## 模型推理