许可证: mit
pipeline_tag: 文本生成
标签:
中文轻小说40k模型
本模型listenrwt/chinese_light_novel_40k是基于llama3-8b基础模型进行微调的版本,使用了40,000组小说上下文数据进行训练。
模型详情
- 模型名称: listenrwt/chinese_light_novel_40k
- 基础模型: llama3-8b
- 微调数据集: 40,000组小说上下文
演示案例
输入:
在一间凌乱,昏暗的房间里,一朵暗红的兰花倒卧在一滩水上,被砸的稀碎的瓦片包围着。在房间的正中心,一个少女体型的躯体被白布覆盖,正上方挂着一圈湿麻绳。
输出:
在那圈湿麻绳的中央,有个装满水的小桶。桶里有团东西,这就是那名少女的脸和头发。
这是什么地方?这是在做什么?
我不确定这是哪儿,但很明显是间屋子。我想,虽然我不知道那个地方叫什么名字,也不知道它在哪里,但我大概知道这就是那个小孩所说的「房间」。也许那个小孩就是我现在遇到的少女。
在我们走进这间屋子的前一刻,我们已经看到了这些事。也许是因为天气转暖了,或者是因为某种什么原因,这里似乎有些人活过来了。我不知道有多少人,但至少有人。
我们从那个小孩口中听到的话,那些「房间」和「箱子」的说法,只能是我们在这里面的一个不完整的故事。这或许是某个人死后发生的事,或者是某人的生平。我不知道哪个才是对的,但我知道那是个非常悲伤、可怕的故事。
我们走进这个屋子之时,我们看到了两个被砸的瓦片,一边是倒在地毯上的一朵兰花,那就是刚才的小孩所说的「箱子」,另一边则是个被白布覆盖的少女。
我不知道这个故事,虽然有点可怕,但至少有一点很好玩。
「我们的目标就在那里。」小孩说。
我不知道他在说什么,却听见一声轻笑响起。
「为什么不试试看一下呢?」
我知道这是个女人的声音。
我们看过那些瓦片,那些被覆盖着白布的东西以及那条水。小孩和我对望了一眼,然后他说:「好吧。」
那时,我们两人已经站在那座屋子。
使用方法
使用listenrwt/chinese_light_novel_40k
模型的步骤如下:
-
安装transformers
库:运行pip install transformers
-
在Python脚本中导入必要库:
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
- 加载分词器和模型:
tokenizer = AutoTokenizer.from_pretrained("listenrwt/chinese_light_novel_40k")
model = AutoModelForCausalLM.from_pretrained("listenrwt/chinese_light_novel_40k")
- 使用模型生成文本:
text_generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
prompt = "在一间凌乱,昏暗的房间里,一朵暗红的兰花倒卧在一滩水上,被砸的稀碎的瓦片包围着。在房间的正中心,一个少女体型的躯体被白布覆盖,正上方挂着一圈湿麻绳。"
output = text_generator(prompt, max_length=100)
可根据需要调整max_length
参数控制输出长度。
局限性
需注意模型的回答是基于训练时学习到的模式生成的,可能并不总是准确或符合上下文。因此建议审查和验证生成内容。
致谢
listenrwt/chinese_light_novel_40k
模型使用Hugging Face的transformers
库和微调技术训练完成。我们感谢llama3-8b模型的原始作者和用于微调的训练数据集创建者。
许可证
listenrwt/chinese_light_novel_40k
模型采用MIT许可证发布。更多详情请参阅Hugging Face模型仓库。