8192长上下文

# 8192长上下文

Mellum 4b Sft Python

JetBrains首个开源大语言模型(LLM)的微调版本，专为Python代码相关任务优化，支持8192 token上下文窗口。

大型语言模型

Transformers 其他

JetBrains首个专为代码相关任务优化的开源大语言模型，支持8192token上下文窗口，覆盖多种编程语言

大型语言模型

Transformers 其他

Scitopicnomicembed

基于nomic-ai/nomic-embed-text-v1.5微调的句子转换器模型，专为科学文献主题相似性任务优化

文本嵌入英语

Gte Reranker Modernbert Base

基于ModernBERT预训练架构的英语文本重排序模型，由阿里巴巴通义实验室开发，支持8192 tokens长文本处理。

Transformers 英语

Modernbert Large Squad2 V0.1

基于ModernBERT-large在SQuAD 2.0数据集上微调的问答模型，支持长上下文处理

Mmed Llama 3 8B

MMed-Llama 3是一个基于Llama 3架构的多语言医学基础模型，拥有80亿参数，在MMedC语料库上进行了进一步预训练，增强了医学领域知识。

大型语言模型

Transformers 支持多种语言

Meltemi 7B Instruct V1

Meltemi-7B-Instruct-v1是基于Mistral-7B架构的希腊语指令微调大语言模型，支持8192上下文长度，专为希腊语任务优化

大型语言模型

Transformers 支持多种语言

Starcoder Gpteacher Code Instruct

基于StarCoder模型，使用GPTeacher代码生成数据集进行微调，优化了代码生成和解释能力

大型语言模型

GeorgiaTechResearchInstitute

StarCoderBase是一个155亿参数的大规模代码生成模型，基于80多种编程语言训练而成，支持代码补全和生成任务。

大型语言模型

Transformers 其他

StarCoder是一个基于80多种编程语言训练的15.5B参数代码生成模型，支持8192个token的上下文窗口

大型语言模型

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24