M

Mathbert Custom

由 tbs17 开发
基于数学领域英语文本预训练的BERT模型,专注于数学语言理解任务
下载量 214
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

通过自监督方式在大型数学语料库上预训练的Transformer模型,支持掩码语言建模和下一句预测任务,特别优化于数学相关文本处理

模型特点

数学领域优化
专门针对数学文本训练,包含从学前到研究生阶段的数学语言
自定义词汇表
使用30,522个词汇的定制词汇表,优化数学术语处理
双向上下文理解
通过MLM目标实现句子双向表征学习
不区分大小写
统一处理大小写变体,提升模型鲁棒性

模型能力

数学文本特征提取
数学问题理解
数学术语预测
数学句子关系判断

使用案例

教育技术
数学问题解答系统
作为数学问答系统的特征提取模块
在数学问题文本填充任务中表现优于通用模型
数学教材分析
分析数学教材内容结构
学术研究
数学论文处理
处理arXiv数学论文摘要