B

Biolingual

由 davidrrobinson 开发
基于对比语言-音频预训练的生物声学音频-文本模型,支持生物声学零样本分类和任务微调
下载量 483
发布时间 : 7/24/2023
模型介绍
内容详情
替代品

模型简介

BioLingual是一个基于人类语言监督的可迁移生物声学模型,通过对比语言-音频预训练实现生物声学音频与文本的关联

模型特点

对比语言-音频预训练
通过对比学习实现音频与文本的跨模态关联
零样本分类能力
无需微调即可对新的音频类别进行分类
生物声学专用
专门针对动物声音等生物声学数据优化

模型能力

生物声学音频分类
音频-文本嵌入提取
零样本学习
跨模态检索

使用案例

野生动物监测
动物声音识别
识别野外录音中的特定动物种类
示例中能准确识别狗的声音
生态研究
生物多样性评估
通过声音分析评估特定区域的生物多样性