许可协议:apache-2.0
语言:
模型索引:
- 名称:Orbita-v0.1
结果:
- 任务:
类型:文本生成
名称:文本生成
数据集:
名称:AI2推理挑战赛土耳其语版
类型:ai2_arc
配置:ARC挑战赛
拆分:测试集
参数:
少量样本数:25
指标:
- 任务:
类型:文本生成
名称:文本生成
数据集:
名称:HellaSwag土耳其语版
类型:hellaswag
拆分:验证集
参数:
少量样本数:10
指标:
- 任务:
类型:文本生成
名称:文本生成
数据集:
名称:MMLU土耳其语版
类型:cais/mmlu
配置:全部
拆分:测试集
参数:
少量样本数:5
指标:
- 任务:
类型:文本生成
名称:文本生成
数据集:
名称:TruthfulQA土耳其语版
类型:truthful_qa
配置:多项选择
拆分:验证集
参数:
少量样本数:0
指标:
- 任务:
类型:文本生成
名称:文本生成
数据集:
名称:Winogrande土耳其语版
类型:winogrande
配置:winogrande_xl
拆分:验证集
参数:
少量样本数:5
指标:
- 任务:
类型:文本生成
名称:文本生成
数据集:
名称:GSM8k土耳其语版
类型:gsm8k
配置:主要
拆分:测试集
参数:
少量样本数:5
指标:
Orbita-v0.1
该模型是一个土耳其语大语言模型,在土耳其语的多个维度上具备多样化能力,涵盖编程、数学等多种任务。
此模型是基于Qwen的土耳其语大语言模型(LLM)的扩展版本。它在一个经过精心标注的土耳其语数据集上进行训练,以准确且有序地执行土耳其语指令。该模型使用8块H100 GPU进行了为期2天的全面微调,数据集经过细致标注。
模型详情
- 基础模型:基于Qwen 14B的大语言模型
- 训练数据集:标注的土耳其语数据集
- 训练方法:全面微调
使用示例
from transformers import AutoModelForCausalLM, AutoTokenizer
device = "cuda"
model = AutoModelForCausalLM.from_pretrained(
"Orbina/Orbita-v0.1",
torch_dtype="auto",
device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("Orbina/Orbita-v0.1")
prompt = "如何在Python中打印'Hello World'?"
messages = [
{"role": "system", "content": "你是一个由Orbina AI生成的助手,旨在遵循指令并提供最佳回答。"},
{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)
generated_ids = model.generate(
model_inputs.input_ids,
temperature=0.3,
top_k=50,
top_p=0.9,
max_new_tokens=512,
repetition_penalty=1,
)
generated_ids = [
output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
生成示例
提示:
土耳其的金融机构如何管理由人工智能带来的数据安全风险?请给出3个例子。
回答:
土耳其的金融机构通过多种方法应对人工智能(AI)技术带来的数据安全风险,并努力降低这些风险。以下是三个例子:
1. **数据加密**:金融机构使用加密技术保护敏感数据(如客户信息),防止数据泄露。AES(高级加密标准)、RSA(Rivest-Shamir-Adleman)或ECC(椭圆曲线加密)等强大的加密算法可以防止数据被读取。
2. **异常检测系统**:基于AI的异常检测系统能够识别意外行为并提醒安全团队。这些系统通过机器学习模型随时间变得更有效,在预防欺诈活动中发挥重要作用。
3. **持续监控与安全政策实施**:土耳其的金融机构通过持续监控和实施安全政策来维护数据安全。这一过程包括定期安全审计,并确保所有员工接受安全培训。此外,还向客户提供关于安全协议的培训。
这些例子展示了土耳其金融机构用于管理与AI相关的数据安全风险的一些策略。然而,没有任何安全系统是完美的,因此机构也在不断评估和改进其安全状况。
提示:
如何在Python中打印"Hello World"?
回答:
在Python中打印"Hello World"可以使用`print`函数。以下是一个简单的例子:
```python
print("Hello World")
运行此代码后,你将在控制台看到"Hello World"文本。print
函数接收给定的参数(这里是"Hello World")并将其作为输出显示。
# [土耳其语开放大语言模型排行榜评估结果](https://huggingface.co/spaces/malhajar/OpenLLMTurkishLeaderboard)
| 指标 | 值 |
|-----------------------------|-----:|
|平均 |49.47|
|AI2推理挑战赛土耳其语版 |41.97|
|HellaSwag土耳其语版 |48.00|
|MMLU土耳其语版 |49.51|
|TruthfulQA土耳其语版 |50.78|
|Winogrande土耳其语版 |56.16|
|GSM8k土耳其语版 |50.41|