海天瑞声:公司针对大模型预训练数据集设计与处理技术进行了初步研究和规划

据证券时报 e 公司报道,海天瑞声近日在机构调研时表示,公司正在积极推进数据生产垂直大模型的建设工作。截至目前,公司针对大模型预训练数据集设计与处理技术进行了初步研究和规划,并基于研究成果开展了 CommonCrawl、中文书籍等适用于预训练阶段的数据的获取与清洗工作,形成了各项技术的框架方向;同时,开展大模型评测技术调研,完成基础框架设计,形成可行性结论。未来,公司会基于实际市场需求,在大模型基础技术研究、大模型算法研发以及平台工具建设等方面,持续推进数据生产垂直大模型的建设。

上一篇:

下一篇:

发表评论

登录后才能评论