gpt2-large-japanese开源日语模型 - 免费支持高质量日语文本生成任务

首页

Gpt2 Large Japanese

由 abeja 开发

由ABEJA公司训练的日语大型GPT-2模型，支持日语文本生成任务

大型语言模型

Transformers

支持多种语言开源协议:MIT #日语文本生成 #大语言模型 #日文写作辅助

下载量 960

发布时间 : 8/29/2022

模型简介

这是一个基于GPT-2架构的大型日语语言模型，专门针对日语文本生成任务进行优化训练。

模型特点

日语专用模型

专门针对日语文本进行训练和优化

多样化生成

支持多种采样策略生成多样化的文本

预训练数据丰富

使用了日语CC-100、日语维基百科和日语OSCAR等多个高质量数据集

模型能力

日语文本生成

上下文理解

多样化文本采样

使用案例

内容创作

文章续写

根据给定的开头续写完整的文章

生成流畅、连贯的日语文本

AI辅助写作

创意写作

帮助作家进行创意构思和内容生成

提供多样化的写作思路

🚀 gpt2-large-japanese

本仓库提供了一个大尺寸的日语GPT - 2模型。该模型由ABEJA, Inc训练。

🚀 快速开始

📦 安装指南

首先，安装sentencepiece。我们已确认其在2022年8月的最新版本下的运行情况。（若无需安装可跳过。）

pip install sentencepiece

💻 使用示例

基础用法

当使用pipeline进行文本生成时：

from transformers import pipeline

generator = pipeline("text-generation", model="abeja/gpt2-large-japanese")
generated = generator(
    "人とAIが協調するためには、",
    max_length=30,
    do_sample=True,
    num_return_sequences=3,
    top_p=0.95,
    top_k=50,
    pad_token_id=3
)
print(*generated, sep="\n")

"""
[out]
{'generated_text': '人とAIが協調するためには、社会的なルールをきちんと理解して、人と共存し、協働して生きていくのが重要だという。'}
{'generated_text': '人とAIが協調するためには、それぞれが人間性を持ち、またその人間性から生まれるインタラクションを調整しなければならないことはいうまで'}
{'generated_text': '人とAIが協調するためには、AIが判断すべきことを人間が決める必要がある。人工知能の目的は、人間の知性、記憶、理解、'}
"""

高级用法

使用PyTorch时：

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("abeja/gpt2-large-japanese")
model = AutoModelForCausalLM.from_pretrained("abeja/gpt2-large-japanese")

input_text = "人とAIが協調するためには、"
input_ids = tokenizer.encode(input_text, return_tensors="pt")

gen_tokens = model.generate(
    input_ids,
    max_length=100,
    do_sample=True,
    num_return_sequences=3,
    top_p=0.95,
    top_k=50,
    pad_token_id=tokenizer.pad_token_id
)
for gen_text in tokenizer.batch_decode(gen_tokens, skip_special_tokens=True):
    print(gen_text)

使用TensorFlow时：

from transformers import AutoTokenizer, TFAutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("abeja/gpt2-large-japanese")
model = TFAutoModelForCausalLM.from_pretrained("abeja/gpt2-large-japanese", from_pt=True)

input_text = "人とAIが協調するためには、"
input_ids = tokenizer.encode(input_text, return_tensors="tf")

gen_tokens = model.generate(
    input_ids,
    max_length=100,
    do_sample=True,
    num_return_sequences=3,
    top_p=0.95,
    top_k=50,
    pad_token_id=tokenizer.pad_token_id
)
for gen_text in tokenizer.batch_decode(gen_tokens, skip_special_tokens=True):
    print(gen_text)