检索增强生成

# 检索增强生成

All MiniLM L2 V2

该模型是从all-MiniLM-L12-v2蒸馏而来，推理速度提升近2倍，同时在CPU和GPU上保持较高的准确度。

文本嵌入支持多种语言

TreeHop是一个轻量级的嵌入级框架，用于高效处理多跳问答中的查询嵌入生成与过滤，显著降低计算开销。

Qwen 2.5 7B Base RAG RL

Qwen-2.5-7B-base-RAG-RL 是一个基于未知数据集从头开始训练的7B参数规模的大语言模型，结合了检索增强生成(RAG)和强化学习(RL)技术。

大型语言模型

Jina Reranker V2 Base Multilingual Wiki Tr Rag Prefix

基于jina-reranker-v2-base-multilingual微调的交叉编码器模型，用于文本重排序和语义搜索

Pleias RAG 350M

Pleias-RAG-350M是一款3.5亿参数的小型推理模型，专为检索增强生成(RAG)、搜索和来源摘要任务而训练。

大型语言模型

Transformers 支持多种语言

ReasonIR-8B是首个专为通用推理任务训练的检索模型，在BRIGHT基准上实现了最先进的检索性能，并在RAG应用中显著提升了MMLU和GPQA基准的表现。

Transformers 英语

Colnomic Embed Multimodal 3b

ColNomic Embed多模态3B是一款30亿参数的多模态嵌入模型，专为视觉文档检索任务设计，支持多语言文本和图像的统一编码。

多模态融合支持多种语言

Mxbai Rerank Large V2 GGUF

本仓库包含mixedbread-ai/mxbai-rerank-large-v2的GGUF格式模型文件，由TensorBlock提供的机器进行量化，兼容llama.cpp。

文本嵌入支持多种语言

Bge Reranker V2 M3 Q4 K M GGUF

本模型是基于BAAI/bge-reranker-v2-m3转换的GGUF格式模型，用于文本排序任务，支持多语言。

文本嵌入其他

首个专为金融时间序列预测设计的检索器，基于检索增强生成（RAG）框架

大型语言模型

Transformers 英语

FinSeer StockLLM 是一个开源的10亿参数大语言模型，专为金融时间序列预测设计，采用检索增强生成（RAG）框架。

大型语言模型

Transformers 英语

Gen-8B-R2是一个专注于减少RAG系统中幻觉问题的生成模型，特别适用于处理检索噪声和信息过载的情况。

大型语言模型

Transformers 英语

C4ai Command A 03 2025

Cohere Labs Command A 是一个开放权重的1110亿参数模型研究版本，专为需要快速、安全且高质量AI的严苛企业需求优化。

大型语言模型

Transformers 支持多种语言

Trendyol LLM 7B Chat V4.1.0

Trendyol LLM v4.1.0 是一款基于 Trendyol LLM base v4.0（在130亿token上继续预训练的Qwen2.5 7B版本）的生成模型，专注于电商领域和土耳其语理解。

大型语言模型其他

Jbaron34 SmolLM2 135M Bebop Reranker Gguf

一个轻量级的文本排序模型，适用于重新排序搜索结果或文档

Kanana Nano 2.1b Embedding

Kanana是由Kakao开发的双语(韩语/英语)语言模型系列，在韩语任务上表现卓越，在英语任务上具备竞争力，相比同规模模型显著降低计算成本。

大型语言模型

Transformers 支持多种语言

Gte Qwen2 7B Instruct GGUF

阿里巴巴NLP团队开发的7B参数规模的多语言文本嵌入模型，专注于句子相似度任务，提供多种量化版本

大型语言模型英语

基于BertForTokenClassification的文本分块器，适用于结构化和非结构化文本，特别优化用于RAG场景

Safetensors 支持多种语言

Pllum 12B Nc Chat

PLLuM-12B-chat是波兰大语言模型家族中的120亿参数对话优化版本，专为波兰语及斯拉夫/波罗的海语言设计，通过指令微调和偏好学习实现安全高效的交互能力。

大型语言模型

Pllum 8x7B Chat

PLLuM 是专门针对波兰语及其他斯拉夫/波罗的海语言优化的大型语言模型家族，兼具英语泛化能力，通过高质量数据训练和先进对齐技术开发而成。

大型语言模型

Transformers 其他

Bge Reranker V2 M3 Q4 K M GGUF

本模型是BAAI/bge-reranker-v2-m3的GGUF量化版本，用于文本重排序任务，支持多语言。

文本嵌入其他

Fluxi AI Small Vision

Fluxi AI 是一款基于 Qwen2-VL-7B-Instruct 的多模态智能助手，具备文本、图像和视频处理能力，特别优化了葡萄牙语支持。

图像生成文本

Transformers 其他

Jina Embeddings GGUF

Jina Embeddings V2 Base 是一个高效的英文句子嵌入模型，专注于句子相似度和特征提取任务。

文本嵌入英语

Lb Reranker 0.5B V1.0

LB重排序器是用于判断查询与文本片段相关性的模型，支持95+种语言，适用于检索任务中的排序和重排序。

大型语言模型

Transformers 支持多种语言

Granite 3.1 3b A800m Instruct

基于Granite-3.1-3B-A800M-Base微调的30亿参数长上下文指令模型，支持多语言任务

大型语言模型

Ruri是一个针对日语优化的通用文本嵌入模型，基于Sentence Transformers架构，特别设计用于句子相似度计算和特征提取任务。

文本嵌入日语

Llama3.1 8B Legal ThaiCCL Combine

Llama-3.1-Legal-ThaiCCL-8B 是基于 Llama-3.1-8B 构建的大语言模型，专门用于回答泰语法律问题。

大型语言模型

GATE Reranker V1

专为阿拉伯语文档检索与排序优化的高性能重排序模型

Transformers 阿拉伯语

Bge Reranker V2 M3 Q4 K M GGUF

该模型是从BAAI/bge-reranker-v2-m3转换而来的GGUF格式模型，用于文本重排序任务，支持多语言。

文本嵌入其他

Vikhr Nemo 12B Instruct R 21 09 24

Vikhr-Nemo是基于Mistral-Nemo-Instruct-2407优化的双语大语言模型，专为俄语和英语优化，支持逻辑推理、文本摘要、代码生成等多种任务。

大型语言模型

Transformers 支持多种语言

Bge Reranker V2 Gemma IQ4 NL GGUF

这是BAAI/bge-reranker-v2-gemma模型的GGUF格式转换版本，适用于llama.cpp框架，支持多语言文本分类任务。

文本嵌入其他

Datagemma Rag 27b It

DataGemma是基于Gemma 2微调的系列模型，专门用于帮助大语言模型访问和整合Data Commons中的可靠公共统计数据。

大型语言模型

Gemma 2 2b It Chinese Kyara Dpo

Kyara是一个通过知识检索增强的语言模型微调项目，专注于提升模型在繁体中文等资源较少语言上的表现。

大型语言模型

Transformers 支持多种语言

Llama 3 8B Instruct Finance RAG

基于Llama 3 8B Instruct微调的金融领域RAG模型，专门针对金融问答场景优化

大型语言模型

Transformers 英语

C4AI Command - R是一款拥有350亿参数的高性能生成模型的研究版本，针对推理、总结和问答等多种用例进行了优化。

大型语言模型

Gte Qwen2 7B Instruct

基于Qwen2架构的7B参数规模的大语言模型，专注于句子相似度计算和文本嵌入任务。

大型语言模型

Phi3 Rag Relevance Judge Merge

一个用于判断参考文本与问题相关性的二元分类模型，专为RAG系统优化

大型语言模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Llm2vec Meta Llama 3 8B Instruct Mntp

LLM2Vec是将仅解码器架构的大语言模型转化为文本编码器的简易方案，通过启用双向注意力机制、掩码下一词预测和无监督对比学习实现。

Transformers 英语

Llama3 ChatQA 1.5 70B

Llama3-ChatQA-1.5是基于Llama-3基础模型开发的对话式问答和检索增强生成模型，在对话式QA和RAG任务中表现卓越。

大型语言模型

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24