模型简介
该模型在distiluse-base-multilingual-cased-v2预训练模型基础上,使用动漫相关文本对进行微调,特别擅长处理动漫领域的名称、角色、简介等文本的相似度计算。
模型特点
动漫领域优化
在8000万组动漫相关文本对上微调,能准确捕捉动漫领域的语义关系
多语言支持
支持中日英三语种文本的向量化处理
高效表示
将文本转换为512维稠密向量,便于下游任务使用
模型能力
动漫文本向量化
跨语言相似度计算
动漫角色关联分析
作品内容检索
使用案例
动漫信息检索
角色别名匹配
识别同一角色的不同名称(如'亚丝娜'和'结城明日奈')
能准确识别角色别名间的语义相似性
跨语言作品检索
匹配不同语言的同一动漫作品名称
实现中日英作品名称的准确关联
内容推荐
相似作品推荐
基于作品简介或标签的语义相似度推荐
能发现具有相似主题或风格的作品
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文