language:
- ko
- en
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
- dot_accuracy@1
- dot_accuracy@3
- dot_accuracy@5
- dot_accuracy@10
- dot_precision@1
- dot_precision@3
- dot_precision@5
- dot_precision@10
- dot_recall@1
- dot_recall@3
- dot_recall@5
- dot_recall@10
- dot_ndcg@10
- dot_mrr@10
- dot_map@100
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
widget:
- source_sentence: 韩国地籍公社相关人士表示:"经过长期阵痛终于能推进地籍再调查工作感到高兴",还说了什么?
sentences:
-
2018平昌冬奥会开幕前,"公敌"是超过零下10度的严寒。临近开幕时寒冷稍有缓和,但因强风持续,从大会第2天起比赛接连延期或取消。
奥组委和国际滑雪联合会(FIS)11日上午11点宣布,原定在旌善高山滑雪场举行的男子速降比赛因强风延期。FIS表示:"预计强风将持续一整天,故推迟赛程。"组委会决定将延期赛事调整至15日上午11点举行,原定该时段男子超级大回转比赛顺延至16日上午11点。
当天下午1点30分的单板滑雪女子坡面障碍技巧预选赛经多次推迟后取消。组委会决定不进行预赛,27名选手直接参加次日决赛决出名次。
赛前就有强风将影响比赛的预测。旌善、龙坪高山滑雪场和凤凰雪上竞技场的赛道顶部海拔超过900米。组委会气象组长林章浩表示:"高山滑雪顶部若遇强风,运送运动员的缆车难以运行","单板滑雪和自由式滑雪在突发阵风时运动员易受伤"。
鉴于风力影响,组委会制定了包含强风在内的5种紧急气象应对方案。当天赛事取消即按预案执行。林组长表示:"12-13日风力减弱,14日将再现强风,但预计15日起再次平息","即使后续赛事因强风延期,也将力争在冬奥闭幕前完成所有比赛"。不过赛程变动后,参赛选手和教练团队如何调整状态备赛将面临严峻挑战。
-
针对地籍图纸与实际边界不符的"地籍不吻合地块"将开展重新调查。国土海洋部上月30日宣布,将对地籍图纸与实地边界不一致的地块推进至2030年完成地籍再调查。同日,金基贤议员代表提案的《地籍再调查特别法》在国会常任委员会通过。这类地块常引发边界纠纷和民怨,目前约占全国地块总数的15%(554万块)。其中大量地块因无法进行地籍测量,导致产权转移或建筑行为等财产权行使受限,亟待调整。
追溯历史,1995年制定《地籍再调查事业推进基本计划》,次年《地籍再调查特别法》立法预告因部门反对搁浅。2000年重启基本计划,2006年提交《土地调查特别法案》仍未通过。地籍不吻合问题源于百年前落后技术制作的纸质地籍持续使用,纸张伸缩、边界线粗细及人为误差等因素所致。另因登记簿分土地/林地两套系统,图纸也存在7种比例尺注册问题。例如狎鸥亭洞某地块(280㎡,单价1000万韩元/㎡)若1:1200比例尺图纸出现0.8mm误差,实际面积差达27㎡,地价差额约2.7亿韩元。朝鲜战争导致全国106.1万块地籍簿损毁,约80%测量基准点丢失也是成因之一。据土地公法学会2005年估算,因地籍不吻合引发的边界纠纷年诉讼费用约3800亿韩元,另边界确认测量年支出900亿韩元。
政府计划投入8410亿韩元,2020年前完成280万块、剩余274万块于2030年前整顿完毕。国土部官员期待:"整顿后将减少边界纠纷降低社会成本,个人财产权行使也更便利。"但舆论指出局限在于非全面再调查而是分阶段推进,后续仍会不断出现不吻合地块需反复调整。尤其边界调整涉及利益尖锐冲突,推进难度大。专家建议全面再调查一次性解决更高效。韩国地籍公社相关人士坦言:"虽欣慰能启动再调查","原希望全面推行但因预算等问题只能分阶段实施,实属遗憾"。
model-index:
- name: SentenceTransformer
results:
- task:
type: information-retrieval
name: 信息检索
dataset:
name: miracl
type: miracl
metrics:
- type: cosine_accuracy@1
value: 0.6103286384976526
name: 余弦准确率@1
- type: cosine_accuracy@3
value: 0.8169014084507042
name: 余弦准确率@3
- type: cosine_accuracy@5
value: 0.8732394366197183
name: 余弦准确率@5
- type: cosine_accuracy@10
value: 0.92018779342723
name: 余弦准确率@10
- type: cosine_precision@1
value: 0.6103286384976526
name: 余弦精确率@1
- type: cosine_precision@3
value: 0.378716744913928
name: 余弦精确率@3
- type: cosine_precision@5
value: 0.27605633802816903
name: 余弦精确率@5
- type: cosine_precision@10
value: 0.17276995305164322
name: 余弦精确率@10
- type: cosine_recall@1
value: 0.3846655691726114
name: 余弦召回率@1
- type: cosine_recall@3
value: 0.5901991071005155
name: 余弦召回率@3
- type: cosine_recall@5
value: 0.6794216477315068
name: 余弦召回率@5
- type: cosine_recall@10
value: 0.7694903427297795
name: 余弦召回率@10
- type: cosine_ndcg@10
value: 0.6833112035481234
name: 余弦标准化折损累积增益@10
- type: cosine_mrr@10
value: 0.7262426410313736
name: 余弦平均倒数排名@10
- type: cosine_map@100
value: 0.6073885234240499
name: 余弦平均精度@100
- type: dot_accuracy@1
value: 0.6103286384976526
name: 点积准确率@1
- type: dot_accuracy@3
value: 0.8169014084507042
name: 点积准确率@3
- type: dot_accuracy@5
value: 0.8732394366197183
name: 点积准确率@5
- type: dot_accuracy@10
value: 0.92018779342723
name: 点积准确率@10
- type: dot_precision@1
value: 0.6103286384976526
name: 点积精确率@1
- type: dot_precision@3
value: 0.378716744913928
name: 点积精确率@3
- type: dot_precision@5
value: 0.27605633802816903
name: 点积精确率@5
- type: dot_precision@10
value: 0.17276995305164322
name: 点积精确率@10
- type: dot_recall@1
value: 0.3846655691726114
name: 点积召回率@1
- type: dot_recall@3
value: 0.5901991071005155
name: 点积召回率@3
- type: dot_recall@5
value: 0.6794216477315068
name: 点积召回率@5
- type: dot_recall@10
value: 0.7694903427297795
name: 点积召回率@10
- type: dot_ndcg@10
value: 0.6723275985412543
name: 点积标准化折损累积增益@10
- type: dot_mrr@10
value: 0.7262426410313736
name: 点积平均倒数排名@10
- type: dot_map@100
value: 0.6073885234240499
name: 点积平均精度@100
license: apache-2.0
base_model:
- BAAI/bge-m3
SentenceTransformer模型
这是一个基于sentence-transformers框架、在train_set数据集上训练的模型。该模型能将句子和段落映射到1024维稠密向量空间,可用于语义文本相似度计算、语义搜索、复述挖掘、文本分类、聚类等任务。
模型详情
- 针对中英文之外其他语言的学习不足,需额外训练优化其他语言使用效果
- 本模型额外在韩语数据集上进行了训练
模型描述
- 模型类型: 句子转换器
基于Transformer编码器架构
- 最大序列长度: 8192个token
- 输出维度: 1024维向量
- 相似度计算方式: 余弦相似度
模型来源
完整模型架构
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
使用方式
直接使用(Sentence Transformers库)
首先安装Sentence Transformers库:
pip install -U sentence-transformers
然后加载模型并进行推理:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("dragonkue/bge-m3-ko")
sentences = [
'无劳动能力的孕妇属于哪类补助对象?',
'明年起低收入家庭未满1岁儿童的医疗负担将进一步降低!\n医疗补助制度概要\n□ (目的) 为无生活维持能力或生活困难的国民提供疾病、伤害、分娩等情况的医疗服务\n□ (对象) 国民基础生活保障受助者、其他法律规定的受助者等\n\n| 分类 | 国民基础生活保障法规定的受助者 | 其他法律规定的受助者 |\n| --- | --- | --- |\n| 1类 | ○ 由无劳动能力者组成的家庭(18岁以下/65岁以上/4级以下残疾人/孕妇等) | ○ 灾民(灾害救助法)○ 烈士及烈士遗属○ 国内收养的18岁以下儿童○ 国家有功者及其家属○ 国家非物质文化遗产保有者及家属○ 脱北者及其家属○ 5·18民主化运动相关人士及遗属○ 露宿者※ 流浪患者(医疗补助法施行令) |\n| 2类 | ○ 含劳动能力者的受助家庭 | - |\n',
'当天下午1点30分的单板滑雪女子坡面障碍技巧预选赛经多次推迟后取消。组委会决定不进行预赛,27名选手直接参加次日决赛决