免费开源的Approval Bureau Merged模型 - 助力文档审核、文本生成与内容审批

首页

Approval Bureau Merged

由 distill 开发

该模型是将基础模型DeepSeek-R1-蒸馏-Qwen-32B与approval_bureau_model_lora适配器合并后的产物，适用于文档审核、文本生成及内容审批相关场景。

大型语言模型

Safetensors

支持多种语言开源协议:Gpl-3.0 #审批场景优化 #中英双语生成 #LoRA微调

下载量 18

发布时间 : 4/7/2025

模型简介

基于DeepSeek-R1-蒸馏-Qwen-32B架构，融合审批场景专用的LoRA微调层，在保留基础模型推理能力的同时强化了领域专项功能。

模型特点

强大的基础模型

基于DeepSeek-R1-蒸馏-Qwen-32B架构，具备强大的推理能力。

领域专用微调

融合审批场景专用的LoRA微调层，强化了领域专项功能。

中英双语支持

支持中文和英文，侧重中文处理能力。

模型能力

文本生成

文档审核

内容审批

使用案例

文档审核

文档内容审核

用于审核文档内容的合规性和准确性。

文本生成

审批相关文本生成

生成与审批相关的文本内容，如审核意见、批复等。

🚀 审批局合并模型 (Approval Bureau Merged Model)

这个模型是将基础模型 DeepSeek - R1 - Distill - Qwen - 32B 与 approval_bureau_model_lora 适配器合并后的成果，可用于文档审核、文本生成和内容审批等场景，支持中英双语且以中文为主。

🚀 快速开始

使用Transformers加载模型

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 设置模型路径
model_path = "distill/approval-bureau-merged"  # 或使用本地路径

# 加载模型和分词器
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(
    model_path,
    torch_dtype=torch.float16,  # 使用半精度可节省内存
    device_map="auto"           # 自动分配到可用设备
)

# 生成文本示例
input_text = "请审核以下文档内容："
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
outputs = model.generate(
    inputs.input_ids,
    max_length=500,
    temperature=0.7,
    top_p=0.9
)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

流式输出示例

from transformers import TextIteratorStreamer
from threading import Thread

# 初始化流式输出
streamer = TextIteratorStreamer(tokenizer, skip_special_tokens=True)

# 创建生成参数
generation_kwargs = {
    "input_ids": inputs.input_ids,
    "max_length": 500,
    "temperature": 0.7,
    "top_p": 0.9,
    "streamer": streamer
}

# 在后台线程中运行生成
thread = Thread(target=model.generate, kwargs=generation_kwargs)
thread.start()

# 流式输出结果
for text in streamer:
    print(text, end="", flush=True)

⚠️ 重要提示

该模型需要较大的GPU内存（推荐至少24GB以上）。

对于内存受限的环境，建议使用4 - bit或8 - bit量化。

模型输出仅供参考，关键决策请结合人工审核。

✨ 主要特性

基于强大的DeepSeek - R1 - Distill - Qwen - 32B架构。
融合了审批局专用的LoRA微调层。
适用于文档审核、文本生成和内容审批相关场景。
保留了基础模型的推理能力，同时增强了特定领域功能。

📦 安装指南

文档未提及安装步骤，故跳过该章节。

💻 使用示例

基础用法

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 设置模型路径
model_path = "distill/approval-bureau-merged"  # 或使用本地路径

# 加载模型和分词器
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(
    model_path,
    torch_dtype=torch.float16,  # 使用半精度可节省内存
    device_map="auto"           # 自动分配到可用设备
)

# 生成文本示例
input_text = "请审核以下文档内容："
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
outputs = model.generate(
    inputs.input_ids,
    max_length=500,
    temperature=0.7,
    top_p=0.9
)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

高级用法

from transformers import TextIteratorStreamer
from threading import Thread

# 初始化流式输出
streamer = TextIteratorStreamer(tokenizer, skip_special_tokens=True)

# 创建生成参数
generation_kwargs = {
    "input_ids": inputs.input_ids,
    "max_length": 500,
    "temperature": 0.7,
    "top_p": 0.9,
    "streamer": streamer
}

# 在后台线程中运行生成
thread = Thread(target=model.generate, kwargs=generation_kwargs)
thread.start()

# 流式输出结果
for text in streamer:
    print(text, end="", flush=True)

📚 详细文档

模型基本信息

属性	详情
基础模型	DeepSeek - R1 - Distill - Qwen - 32B
LoRA适配器	approval_bureau_model_lora
模型类型	因果语言模型 (Causal Language Model)
参数规模	32B
语言支持	中英双语，以中文为主