语言:
- 波斯语
- 多语言
缩略图: https://upload.wikimedia.org/wikipedia/commons/a/a2/Farsi.svg
标签:
- 情感分析
- 情绪分析
- mt5
- 波斯语
- 法尔西语
许可证: cc-by-nc-sa-4.0
数据集:
- parsinlu
评估指标:
- 准确率
情感分析 (Sentiment Analysis)
这是一个用于情感分析的mT5模型。
以下是运行该模型的示例代码:
import torch
from transformers import MT5ForConditionalGeneration, MT5Tokenizer
import numpy as np
model_name_or_path = "persiannlp/mt5-large-parsinlu-sentiment-analysis"
tokenizer = MT5Tokenizer.from_pretrained(model_name)
model = MT5ForConditionalGeneration.from_pretrained(model_name)
def model_predict(text_a, text_b):
features = tokenizer( [(text_a, text_b)], padding="max_length", truncation=True, return_tensors='pt')
output = model(**features)
logits = output[0]
probs = torch.nn.functional.softmax(logits, dim=1).tolist()
idx = np.argmax(np.array(probs))
print(labels[idx], probs)
def run_model(context, query, **generator_args):
input_ids = tokenizer.encode(context + "<sep>" + query, return_tensors="pt")
res = model.generate(input_ids, **generator_args)
output = tokenizer.batch_decode(res, skip_special_tokens=True)
print(output)
return output
run_model(
"一部内容空洞、剧本薄弱的糟糕电影。低俗的笑料。",
"您对电影《蜂巢》的故事、剧本、对话和主题有何看法?"
)
run_model(
"电影前半段直到揭示阿莫勒什孩子们追踪雷藏的情节都非常精彩吸引人,但恰恰从这里开始急转直下...",
"您对电影《猪基因》的总体评价如何?"
)
run_model(
"我完全不想在银幕上观看《密西西比坐着死去》的演出 重复的台词 直升机 汽车 阿伦德隆 莱昂 蝴蝶结 到底为什么啊啊啊啊啊 我在瓦赫达特大厅半小时后产生的逃离感,今晚在影院再次体验到了,想要逃出影厅的感觉....... (ノಠ益ಠ)ノ ",
"您对电影《荒诞玩家》的配音和音效有何评价?"
)
run_model(
"别被迷惑了,这个五彩缤纷的包装不是米诺公司的产品,而是格鲁吉亚品牌,遗憾的是它的味道完全不符合您对五彩缤纷的期待",
"您对这种饼干和威化饼的香气、气味和味道有何看法?"
)
run_model(
"与市场上其他品牌相比,考虑到促销活动,这个价格更便宜",
"您对这些豆类和大豆的价格与购买价值有何看法?"
)
run_model(
"我儿子非常喜欢这个,但为了保护环境,我现在只在必要时购买袋装牛奶,并尽量减少利乐包装牛奶的使用",
"您对这种牛奶的总体评价如何?"
)
更多详情请访问: https://github.com/persiannlp/parsinlu/