猎户星空大模型

7个月前发布 51 0 0

百亿级模型SOTA,支持 32万 tokens 的上下文能够一次性接受并处理约 45 万汉字的输入内容准确提取关键信息。

语言:
zh,en
收录时间:
2025-01-19
猎户星空大模型猎户星空大模型
猎户星空大模型

猎户星空大模型为企业应用而生其核心优势、应用场景和相关项目如下:
– 核心优势:
– 猎户星空大模型是一个百亿参数的大模型基座能力很强INT4量化后的性能损失低于1%支持320K token长度700亿以下参数基座模型中文优秀。
– 猎户星空大模型在整体表现上达到了20B以下模型SOTA支持32万tokens的上下文能够一次性接受并处理约45万汉字的输入内容准确提取关键信息实现长文本中“大海捞针”。
– 猎户星空大模型的技术团队来自于Facebook总部、Yahoo总部、百度等全球优秀大厂的上百名算法科学家技术路线从DNN、attention、Bert到LLMASRTTSNLP全栈追踪行业技术演进。
– 猎户星空大模型经过了上千家企业应用适配和全球20亿用户级应用打磨经验拥有7年数据积累百亿级真实用户query数据数十万亿级别token数据。
– 应用场景:
– 通用对话微调:20B以下开源模型里通用能力卓越的对话模型。
– 插件微调:AgentReActPrompting能力接近千亿级模型效果。
– RAG微调:知识边界控制能力回答精准度接近千亿级模型效果。
– 长token微调:支持320K长度token开源模型中支持token出色的模型。
– 知识抽取微调:将非结构化数据转化为结构化数据。
– 问答对生成微调:在保证知识覆盖度的前提下生成问答对。
– 日韩文微调:日、韩文水平在20B以下开源模型中优秀。
– 相关项目:
– 猎户星空大模型服务器可放置于企业内网所有数据不连公网免费开源可商用社区技术支持可访问Hugging Face、ModelScope、GitHub社区下载。

数据统计

相关导航