banglish_to_bangla开源模型 - 免费将拉丁化孟加拉语转换为孟加拉文字

首页

Banglish To Bangla

由 fms-byte 开发

该模型基于mbart-large-50-many-to-many-mmt微调，专门用于将拉丁化孟加拉语转换为孟加拉文字

机器翻译

Transformers

#孟加拉语拉丁化转写 #多语言序列翻译 #mbart微调

下载量 19

发布时间 : 12/21/2024

模型简介

一个序列到序列翻译模型，可将用罗马字母书写的孟加拉语转换为标准孟加拉文字

模型特点

基于MBart架构

使用facebook/mbart-large-50-many-to-many-mmt作为基础模型，具有强大的多语言处理能力

专门针对孟加拉语

专注于拉丁化孟加拉语到标准孟加拉文字的转换任务

高质量数据集

使用SKNahin/bengali-transliteration-data数据集进行微调，确保转换准确性

模型能力

拉丁化孟加拉语到孟加拉语的文本转换

社交媒体文本处理

即时通讯文本转换

使用案例

社交媒体

社交媒体文本转换

将用户输入的拉丁化孟加拉语转换为标准孟加拉文字

提高孟加拉语社交媒体内容的可读性和标准化

即时通讯

聊天应用集成

在聊天应用中自动转换拉丁化孟加拉语消息

改善孟加拉语用户的通讯体验

🚀 邦文罗马字转孟加拉文音译模型

本模型旨在将邦文罗马字（用罗马字母书写的孟加拉语）音译为孟加拉文字符。它基于facebook/mbart-large-50-many-to-many-mmt模型，使用SKNahin/bengali-transliteration-data数据集进行微调。

🚀 快速开始

示例代码

from transformers import MBartForConditionalGeneration, MBart50TokenizerFast

model = MBartForConditionalGeneration.from_pretrained("your-username/banglish-to-bangla-mbart")
tokenizer = MBart50TokenizerFast.from_pretrained("your-username/banglish-to-bangla-mbart")

def translate(text):
    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=64)
    outputs = model.generate(inputs.input_ids, max_length=64, num_beams=5, early_stopping=True)
    return tokenizer.decode(outputs[0], skip_special_tokens=True)

print(translate("ami tomake valobashi"))

✨ 主要特性

能够将邦文罗马字文本音译为孟加拉文字符，适用于社交媒体、消息传递和正式交流。
可用于孟加拉语与其他语言之间翻译任务的微调。
可以集成到聊天机器人或虚拟助理中。

📦 安装指南

文档未提供安装步骤，故跳过该章节。

💻 使用示例

基础用法

from transformers import MBartForConditionalGeneration, MBart50TokenizerFast

model = MBartForConditionalGeneration.from_pretrained("your-username/banglish-to-bangla-mbart")
tokenizer = MBart50TokenizerFast.from_pretrained("your-username/banglish-to-bangla-mbart")

def translate(text):
    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=64)
    outputs = model.generate(inputs.input_ids, max_length=64, num_beams=5, early_stopping=True)
    return tokenizer.decode(outputs[0], skip_special_tokens=True)

print(translate("ami tomake valobashi"))

高级用法

文档未提供高级用法示例，故跳过该部分。

📚 详细文档

模型详情

模型描述

本模型专为将邦文罗马字（用罗马字母书写的孟加拉语）音译为孟加拉文字符而设计。它基于facebook/mbart-large-50-many-to-many-mmt模型，使用SKNahin/bengali-transliteration-data数据集进行微调。

属性	详情
开发者	Md. Farhan Masud Shohag
模型类型	序列到序列（翻译）
语言	邦文罗马字 → 孟加拉语（bn_BD）
许可证	Apache 2.0
微调基础模型	facebook/mbart-large-50-many-to-many-mmt