BERTweet-base开源语言模型 - 免费可用，专为英文推文处理设计

首页

Bertweet Base

由 vinai 开发

BERTweet是首个针对英文推文进行大规模预训练的公开语言模型，基于RoBERTa预训练方法构建。

大型语言模型开源协议:MIT #英文推文分析 #COVID-19舆情挖掘 #社交媒体NLP

下载量 74.86k

发布时间 : 3/2/2022

模型简介

BERTweet是一个专门针对英文推文优化的预训练语言模型，适用于各种自然语言处理任务，如情感分析、命名实体识别等。

模型特点

推文专用预训练

专门针对英文推文进行预训练，能更好地理解推文特有的语言特征

大规模训练数据

使用8.5亿条英文推文（160亿词元）进行训练，包含COVID-19相关推文

多任务适用性

在词性标注、命名实体识别、情感分析和反讽检测等多个任务上表现优异

模型能力

文本理解

情感分析

命名实体识别

词性标注

反讽检测

使用案例

社交媒体分析

推文情感分析

分析推文中的情感倾向

在情感分析任务中表现优异

反讽检测

识别推文中的反讽表达

在反讽检测任务中取得良好效果

信息提取

命名实体识别

从推文中提取人名、地名等实体

在命名实体识别任务中表现优异

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Bertweet Base

模型简介

模型特点

模型能力

使用案例

🚀 BERTweet：用于英文推文的预训练语言模型

✨ 主要特性

主要实验结果

📄 许可证