【发明公布】基于提示词工程的文本生成模型训练方法和文本生成方法_中国铁道科学研究院集团有限公司电子计算技术研究所;中国铁道科学研究院集团有限公司;北京经纬信息技术有限公司_202410193318.X

申请/专利权人：中国铁道科学研究院集团有限公司电子计算技术研究所;中国铁道科学研究院集团有限公司;北京经纬信息技术有限公司

申请日：2024-02-21

公开（公告）日：2024-03-22

公开（公告）号：CN117744661A

主分类号：G06F40/295

分类号：G06F40/295;G06F40/284;G06F18/214;G06F16/35

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本申请实施例公开了一种基于提示词工程的文本生成模型训练方法和文本生成方法，涉及大语言模型技术领域，包括：获取文本数据集；确定文本数据集中每个文本数据的公文种类；针对每一种类型的文本数据，按照对应的标注维度进行标注；构建第一模型，包括多种语言模型和特定任务层；使用标注好的文本数据对第一模型进行训练；评估每种语言模型的输出结果，选择每种类型的文本数据对应的语言模型，得到训练好的文本生成模型。通过选择具有明显各类公文特征的数据，并根据公文类型，对特定的内容特点、类型标志、涵盖要素等能够区分公文类型的特征进行标注，使模型能够学习电子公文领域的特定语言风格、词汇、句式和模板，以输出精确严谨的公文文本。

主权项：1.一种基于提示词工程的文本生成模型训练方法，其特征在于，所述方法包括：获取文本数据集，所述文本数据集为具有特定格式的公文数据的集合；确定所述文本数据集中每个文本数据的公文种类；针对每一种类型的文本数据，按照对应的标注维度进行标注；构建第一模型，使用标注好的文本数据对第一模型进行训练，所述第一模型包括多种语言模型和特定任务层，所述特定任务层用于将标注好的文本数据转换成多种语言模型能够识别的数据；评估每一种语言模型的输出结果，根据评估结果选择每种类型的文本数据对应的语言模型，得到训练好的文本生成模型。

全文数据：

权利要求：

百度查询：中国铁道科学研究院集团有限公司电子计算技术研究所;中国铁道科学研究院集团有限公司;北京经纬信息技术有限公司基于提示词工程的文本生成模型训练方法和文本生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：CNC加工用快速换线治具_东莞华清光学科技有限公司_202322418777.7

下一篇：一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

相关技术

CNC加工用快速换线治具_东莞华清光学科技有限公司_202322418777.7

一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种农牧业通电线卷绕装置_山东恒通智能新材料有限公司_202322431480.4

一种高效散热电源_广州市力为电子有限公司_202322175013.X

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

一种玉米种植用病虫害防治装置_黄金双_202322446508.1

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

龙图腾网&IPTOP

【发明公布】基于提示词工程的文本生成模型训练方法和文本生成方法_中国铁道科学研究院集团有限公司电子计算技术研究所;中国铁道科学研究院集团有限公司;北京经纬信息技术有限公司_202410193318.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务