模型简介
GENRE系统用于实体检索和链接任务,能够通过生成唯一实体名称的方式进行高效的实体消歧。
模型特点
自回归实体检索
采用序列到序列的方法进行实体检索,通过生成唯一实体名称实现高效链接。
受约束的束搜索
确保生成的输出均为有效实体标识符,提高检索准确性。
大规模训练数据
基于BLINK完整训练集(900万条维基百科实体消歧数据点)训练。
模型能力
实体检索
命名实体链接
实体消歧
文本生成
使用案例
知识库链接
维基百科页面消歧
将文本中的实体链接到维基百科页面,解决同名实体歧义问题。
输出前5个预测结果,如['德国人', '德国', '德意志帝国', '魏玛共和国', '希腊人']
信息检索
文档实体链接
在文档中识别并链接实体到知识库中的对应条目。
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文