FP16高效推理

# FP16高效推理

Spark TTS 0.5B Bf16

Spark-TTS-0.5B-fp16 是一个基于 MLX 格式的文本转语音模型，支持英文和中文。

语音合成支持多种语言

Wan2.1 T2V 14B Gguf

基于GGUF格式转换的文本生成视频模型，支持通过ComfyUI-GGUF自定义节点使用

文本生成视频

Controlnet Illustrious Softedge Hed Sdxl Fp16

基于Stable Diffusion XL的ControlNet模型，专注于通过软边缘HED（Holistically-Nested Edge Detection）进行图像生成控制。

Controlnet Kohaku Canny Sdxl Fp16

基于Stable Diffusion XL的ControlNet模型，专注于通过Canny边缘检测实现精确的图像生成控制

PhoRanker 是一个用于越南语文本排序的跨编码器模型，能够高效分类和排序越南语文本。

Transformers 其他

SDXL Controlnet Tile Realistic V2

这是一个基于Stable Diffusion XL (SDXL)的ControlNet模型，专门用于图像特征提取和细节增强，支持fp16模式运行。

Faster Whisper Small

基于OpenAI Whisper小型模型的CTranslate2格式转换版本，用于高效语音识别

语音识别支持多种语言

Faster Whisper Base

这是OpenAI Whisper基础模型的CTranslate2转换版本，用于高效语音识别任务。

语音识别支持多种语言

Faster Whisper Medium

这是OpenAI Whisper中等模型的CTranslate2转换版本，用于高效语音识别任务。

语音识别支持多种语言

Faster Whisper Large Zh Cv11

这是jonatasgrosman/whisper-large-zh-cv11模型的CTranslate2转换版本，用于高效语音识别任务，特别优化了中文语音识别能力。

语音识别中文

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24