开源法律领域大模型“智海-录问” - 助力法律智能应用，提升司法效能

首页

Wisdominterrogatory

由 ZhihaiLLM 开发

智海-录问是由浙江大学、阿里巴巴达摩院及华院计算联合研发的法律领域大模型，专注于法律智能应用与司法效能提升。

大型语言模型

Transformers

支持多种语言开源协议:其他 #法律问答 #司法判例解析 #中文法律大模型

下载量 61

发布时间 : 9/2/2023

模型简介

基于Baichuan-7B架构的法律领域大模型，通过法律文书专项训练和指令微调，具备专业法律问答能力。

模型特点

法律领域专业化

通过40GB法律文书专项训练，注入专业法律知识

司法实践导向

设计目标直接服务于司法效能提升和普法共享

交互式问答能力

经过10万条指令数据微调，具备专业法律问答交互能力

模型能力

法律文本生成

司法判例分析

法律咨询问答

法律条文解释

使用案例

司法实践

数字化案例库构建

自动处理和分析司法判例文档

提升案例检索和分析效率

法律服务

虚拟法律咨询

提供基础法律问题解答服务

降低法律咨询服务门槛

🚀 智海 - 录问

智海 - 录问（wisdomInterrogatory）是一款法律大模型，由浙江大学、阿里巴巴达摩院以及华院计算三家单位联合设计研发。该模型旨在“普法共享和司法效能提升”，为法律智能化体系融入司法实践、数字化案例建设、虚拟法律咨询服务赋能等方面提供支持，构建数字化和智能化的司法基座。

🚀 快速开始

智海 - 录问是专为法律领域打造的大模型。下面将为你介绍其训练过程以及推理代码的使用方法。

✨ 主要特性

跨单位合作研发：由浙江大学、阿里巴巴达摩院以及华院计算三家单位共同设计研发。
目标明确：以“普法共享和司法效能提升”为目标，提供多方面支持，形成司法基座能力。
分阶段训练：基于[Baichuan - 7B](https://github.com/baichuan - inc/baichuan - 7B)进行二次预训练和指令微调训练。

📦 安装指南

推理环境安装

transformers>=4.27.1
accelerate>=0.20.1
torch>=2.0.1
modelscope>=1.8.3
sentencepiece==0.1.99

💻 使用示例

基础用法

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"
from modelscope import AutoModelForCausalLM, AutoTokenizer, snapshot_download
import torch


model_id = "wisdomOcean/wisdomInterrogatory"
revision = 'v1.0.0'
model_dir = snapshot_download(model_id, revision)

def generate_response(prompt: str) -> str:
    inputs = tokenizer(f'</s>Human:{prompt} </s>Assistant: ', return_tensors='pt')
    inputs = inputs.to('cuda')
    pred = model.generate(**inputs, max_new_tokens=800, 
                          repetition_penalty=1.2)
    response = tokenizer.decode(pred.cpu()[0], skip_special_tokens=True)
    return response.split("Assistant: ")[1]

tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_dir, device_map="auto", 
                                             torch_dtype=torch.float16,
                                             trust_remote_code=True)
prompt = "如果喝了两斤白酒后开车，会有什么后果？"
resp = generate_response(prompt)
print(resp)