K

KR SBERT Medium Extended Patent2024 Hn

由 snunlp 开发
这是一个从snunlp/KR-Medium-extended微调而来的sentence-transformers模型,专门用于处理韩语专利文本的句子相似度任务。
下载量 773
发布时间 : 8/27/2024
模型介绍
内容详情
替代品

模型简介

该模型将句子和段落映射到768维密集向量空间,可用于语义文本相似度、语义搜索、复述挖掘、文本分类、聚类等任务。

模型特点

专利文本优化
专门针对韩语专利文本进行优化,能够更好地处理技术性强的专利内容。
高维向量表示
将文本映射到768维密集向量空间,捕捉丰富的语义信息。
大规模训练
在包含1,795,000个训练样本的korpat-triplet数据集上进行训练。

模型能力

计算句子相似度
语义搜索
复述挖掘
文本分类
文本聚类

使用案例

专利分析
专利相似性检索
查找与给定专利描述相似的其他专利
提高专利检索效率和准确性
专利分类
根据专利内容自动分类到不同技术领域
简化专利管理流程
技术文档处理
技术文档去重
识别内容相似的技术文档
减少重复文档存储