Midm-2.0-Base-Instruct-gguf开源模型 - 深度融入韩国价值观的实用AI工具

首页

Midm 2.0 Base Instruct Gguf

由 mykor 开发

Mi:dm 2.0 是采用 KT 专有技术开发的'以韩国为中心的 AI'模型，深度内化了韩国社会独特的价值观、认知框架和常识推理。

大型语言模型

Transformers

支持多种语言开源协议:MIT #韩国文化理解 #韩语优化 #多任务推理

下载量 517

发布时间 : 7/4/2025

模型简介

Mi:dm 2.0 是一个专注于韩国社会文化规范和价值观的大语言模型，包含 Base 和 Mini 两个版本，分别针对高性能和轻量级应用场景。

模型特点

韩国文化深度理解

模型深度内化了韩国社会独特的价值观、认知框架和常识推理，能够理解和生成符合韩国文化背景的内容。

双版本设计

提供Base(115亿参数)和Mini(23亿参数)两个版本，分别满足高性能和轻量级部署需求。

专有评估资源

使用KT专有的韩语评估数据集(K-Refer, Ko-Sovereign等)进行模型评估，确保对韩国文化的准确理解。

模型能力

韩语文本生成

韩语文化内容理解

多轮对话

常识推理

英语文本处理

使用案例

文化相关应用

韩国文化咨询

为外国人或海外韩裔提供韩国文化、礼仪等方面的咨询服务

在K-Refer等韩国文化评估数据集上表现优异

本地化内容生成

生成符合韩国社会文化规范的市场营销内容

教育

韩语学习助手

帮助非母语者学习韩语和韩国文化

🚀 Mi:dm 2.0

Mi:dm 2.0 是采用 KT 专有技术开发的“以韩国为中心的 AI”模型。该模型深度内化了韩国社会独特的价值观、认知框架和常识推理，不仅仅是处理或生成韩语，更体现了对韩国社会社会文化规范和价值观的深刻理解。

🌟 Mi:dm 2.0 模型 | 📄 Mi:dm 2.0 技术报告 | 📝 Mi:dm 2.0 技术博客*

_{*即将发布}

🚀 快速开始

新闻动态

⏱️ （即将推出！）GGUF 格式的模型文件即将推出，以便更轻松地进行本地部署。
📅 2025/07/04：在 Hugging Face 上发布了 Mi:dm 2.0 模型集合。

Mi:dm 2.0 简介

Mi:dm 2.0 有两个版本发布：

Mi:dm 2.0 Base：一个具有 115 亿参数的密集模型，旨在平衡模型大小和性能。它通过应用深度扩展（DuS）方法扩展了 80 亿规模的模型，适用于需要高性能和多功能的实际应用场景。
Mi:dm 2.0 Mini：一个轻量级的 23 亿参数密集模型，针对设备端环境和 GPU 资源有限的系统进行了优化。它是通过对基础模型进行剪枝和蒸馏得到的，能够实现紧凑部署。

⚠️ 重要提示

预训练和后训练数据均不包含 KT 用户数据。

快速入门代码示例

以下是使用该模型进行对话推理的代码片段：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig

model_name = "K-intelligence/Midm-2.0-Base-Instruct"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.bfloat16,
    trust_remote_code=True,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)
generation_config = GenerationConfig.from_pretrained(model_name)

prompt = "KTÏóê ÎåÄÌï¥ ÏÜåÍ∞úÌï¥Ï§ò"

# message for inference
messages = [
    {"role": "system", 
     "content": "Mi:dm(ÎØø:Ïùå)ÏùÄ KTÏóêÏÑú Í∞úÎ∞úÌïú AI Í∏∞Î∞ò Ïñ¥ÏãúÏä§ÌÑ¥Ìä∏Ïù¥Îã§."},
    {"role": "user", "content": prompt}
]

input_ids = tokenizer.apply_chat_template(
    messages,
    tokenize=True,
    add_generation_prompt=True,
    return_tensors="pt"
)

output = model.generate(
    input_ids.to("cuda"),
    generation_config=generation_config,
    eos_token_id=tokenizer.eos_token_id,
    max_new_tokens=128,
    do_sample=False,
)
print(tokenizer.decode(output[0]))

⚠️ 重要提示

transformers 库的版本应在 4.45.0 或更高。

📊 评估

韩语评估

模型	社会与文化 - K-Refer*	社会与文化 - K-Refer-Hard*	社会与文化 - Ko-Sovereign*	社会与文化 - HAERAE	社会与文化 - 平均	常识知识 - KMMLU	常识知识 - Ko-Sovereign*	常识知识 - 平均	指令遵循 - Ko-IFEval	指令遵循 - Ko-MTBench	指令遵循 - 平均
Qwen3-4B	53.6	42.9	35.8	50.6	45.7	50.6	42.5	46.5	75.9	63.0	69.4
Exaone-3.5-2.4B-inst	64.0	67.1	44.4	61.3	59.2	43.5	42.4	43.0	65.4	74.0	68.9
Mi:dm 2.0-Mini-inst	66.4	61.4	36.7	70.8	58.8	45.1	42.4	43.8	73.3	74.0	73.6
Qwen3-14B	72.4	65.7	49.8	68.4	64.1	55.4	54.7	55.1	83.6	71	77.3
Llama-3.1-8B-inst	43.2	36.4	33.8	49.5	40.7	33.0	36.7	34.8	60.1	57	58.5
Exaone-3.5-7.8B-inst	71.6	69.3	46.9	72.9	65.2	52.6	45.6	49.1	69.1	79.6	74.4
Mi:dm 2.0-Base-inst	89.6	86.4	56.3	81.5	78.4	57.3	58.0	57.7	82	89.7	85.9

模型	理解 - K-Prag*	理解 - K-Refer-Hard*	理解 - Ko-Best	理解 - Ko-Sovereign*	理解 - 平均	推理 - Ko-Winogrande	推理 - Ko-Best	推理 - LogicKor	推理 - HRM8K	推理 - 平均
Qwen3-4B	73.9	56.7	91.5	43.5	66.6	67.5	69.2	5.6	56.7	43.8
Exaone-3.5-2.4B-inst	68.7	58.5	87.2	38.0	62.5	60.3	64.1	7.4	38.5	36.7
Mi:dm 2.0-Mini-inst	69.5	55.4	80.5	42.5	61.9	61.7	64.5	7.7	39.9	37.4
Qwen3-14B	86.7	74.0	93.9	52.0	76.8	77.2	75.4	6.4	64.5	48.8
Llama-3.1-8B-inst	59.9	48.6	77.4	31.5	51.5	40.1	26.0	2.4	30.9	19.8
Exaone-3.5-7.8B-inst	73.5	61.9	92.0	44.0	67.2	64.6	60.3	8.6	49.7	39.5
Mi:dm 2.0-Base-inst	86.5	70.8	95.2	53.0	76.1	75.1	73.0	8.6	52.9	44.8

* 表示 KT 专有评估资源。

英语评估

模型	指令 - IFEval	推理 - BBH	推理 - GPQA	推理 - MuSR	推理 - 平均	数学 - GSM8K	编码 - MBPP+	常识知识 - MMLU-pro	常识知识 - MMLU	常识知识 - 平均
Qwen3-4B	79.7	79.0	39.8	58.5	59.1	90.4	62.4	-	73.3	73.3
Exaone-3.5-2.4B-inst	81.1	46.4	28.1	49.7	41.4	82.5	59.8	-	59.5	59.5
Mi:dm 2.0-Mini-inst	73.6	44.5	26.6	51.7	40.9	83.1	60.9	-	56.5	56.5
Qwen3-14B	83.9	83.4	49.8	57.7	63.6	88.0	73.4	70.5	82.7	76.6
Llama-3.1-8B-inst	79.9	60.3	21.6	50.3	44.1	81.2	81.8	47.6	70.7	59.2
Exaone-3.5-7.8B-inst	83.6	50.1	33.1	51.2	44.8	81.1	79.4	40.7	69.0	54.8
Mi:dm 2.0-Base-inst	84.0	77.7	33.5	51.9	54.4	91.6	77.5	53.3	73.7	63.5

💻 使用示例

在 Friendli.AI 上运行

你可以通过 Friendli.AI 立即试用我们的模型。只需点击 Deploy 然后点击 Friendli Endpoints。

⚠️ 重要提示

请注意，在进行第五次聊天交互后，需要登录 Friendli.AI。

Left Image Right Image

在本地机器上运行

我们提供了使用 llama.cpp、LM Studio 和 Ollama 在本地机器上运行 Mi:dm 2.0 的详细说明。更多信息请查看我们的 GitHub。

部署

要使用 vLLM(>=0.8.0) 以 OpenAI 兼容的 API 服务 Mi:dm 2.0，请运行以下命令：

vllm serve K-intelligence/Midm-2.0-Base-Instruct

教程

为了帮助最终用户轻松使用 Mi:dm 2.0，我们在 GitHub 上提供了全面的教程。

📚 详细文档

局限性

两个 Mi:dm 2.0 模型的训练数据主要由英语和韩语组成，不保证对其他语言的理解和生成能力。
该模型不能保证在需要专业知识的领域（如法律、医学或金融）提供可靠的建议。
研究人员已努力从训练数据中排除不道德的内容，如脏话、诋毁性语言、偏见和歧视性语言。然而，尽管做出了这些努力，模型仍可能产生不适当的表达或事实性错误。

许可证

Mi:dm 2.0 采用 MIT 许可证。

联系我们

Mi:dm 2.0 技术咨询：midm-llm@kt.com

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文