买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于大语言模型的社会个体行为识别预测方法_北京大学武汉人工智能研究院;北京大学_202311831572.X 

申请/专利权人:北京大学武汉人工智能研究院;北京大学

申请日:2023-12-27

公开(公告)日:2024-03-19

公开(公告)号:CN117726004A

主分类号:G06N5/04

分类号:G06N5/04;G06N5/045;G06N5/025;G06F40/30

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.05#实质审查的生效;2024.03.19#公开

摘要:本发明公布了一种基于大语言模型的社会个体行为识别预测方法,通过构建基于大语言模型的社会价值行为图,进一步构造个体社会行为链;首先通过大语言模型抽取文本数据中的语义关系对;利用关系对按照不同的社会群体构造社会价值行为图;根据当前任务描述在社会价值行为图中采样得到解析图;再将解析图在社会价值行为图中进行推理得到个体社会行为链,从而实现高效准确的个体行为识别预测。

主权项:1.一种基于大语言模型的社会个体行为识别预测方法,其特征是,通过构建基于大语言模型的社会价值行为图,进一步构造个体社会行为链;首先通过大语言模型抽取文本数据中的语义关系对;利用关系对按照不同的社会群体构造社会价值行为图;根据当前任务描述在社会价值行为图中采样得到解析图;再将解析图在社会价值行为图中进行推理得到个体社会行为链,从而实现高效准确的个体行为识别预测;包括如下步骤:1构建标准化提示数据集,抽取出“价值观—场景—行为序列”语义关系对,作为大语言模型推理过程模板;构建的标准化提示数据集包括大语言模型的输入、输出以及推理过程;11获取结构化或非结构化的文本,用于从中推理出个体的价值观、所处场景与对应的行为,作为标准化提示数据集的输入部分;包括:a对文本数据进行预处理,将文本数据划分为小单位;b从文本数据单位中提取实体,得到实体集合;c使用实体抽取提示作为上下文输入大语言模型,使得大语言模型从文本数据中提取出所需要的实体;实体抽取提示包含:所需要提取实体的类型、对实体含义的解释、所需输出的正确格式;实体类型表示大语言模型执行的任务的类型,类型包括个体、场景、行为;对实体含义的解释表示任务的内容;所需输出的正确格式即大语言模型输出的标准格式;d利用大语言模型进行语义聚合与消歧,抽取出不同的实体;e利用大语言模型从文本数据中提取实体关系;f提取得到“价值观—场景—行为序列”语义关系对:根据c的实体集合,按照实体对应的类型划分为个体、场景、行为;对于每一个体,输入个体对应的价值观,再遍历每一个场景和每一个行为,按照d中的实体关系,形成每个个体的“价值观—场景—行为”语义关系对;同时将推理判据作为上下文输入大语言模型,使大语言模型输出构造出语义关系对的完整判据;g使用关系输出提示,使得大语言模型输出语义关系对正确的格式;关系输出提示包括文本描述、输入问题、标准回答;h判定并修改语义关系对及推理过程;从而形成标准化提示数据集;数据集中的每一条数据均包含:标准输入、标准输出以及按照步骤a—h进行的标准推理过程;2设计场景、行为序列的分解与合成方法,利用大语言模型,从文本数据中抽取出与个体的场景和行为相关的语义信息,同时消除“价值观—场景—行为序列”语义关系对中的冗余;并确实作为基座大模型的大语言模型;21收集包含关于价值观及其所处场景以及相关行为描述的文本数据;22选择用于关系抽取任务的大语言模型,将文本数据进行处理,得到模型输入的格式;23先使用关系抽取数据集,对大语言模型进行微调;再按照标准化提示数据集中的输入、输出以及推理过程,指导大语言模型的推理;24构建原子场景集和原子行为集,对场景和行为进行分解与合成,使得抽取出的实体相互对应;25构建关系抽取测试集,对比不同大语言模型在测试集上抽取文本数据中语义关系对的准确度,选用准确度最高的大语言模型;3利用步骤1抽取出的“价值观—场景—行为序列”语义关系对,构建社会价值行为图;包括:31将社会节点作为社会价值行为图的根节点S;根据抽取出的语义关系对对人群进行划分,得到多个社会群体,作为社会价值行为图的群体节点;32获取语义关系对节点,并划分在对应的群体节点下;将31中人群的不同社会群体作为上下文和25步骤得到的语义关系对,输入大语言模型,输出每个语义关系对所对应的个体所属的群体;将语义关系对按照大语言模型的结果划分在对应的群体节点下,并按照语义关系形成价值观节点—场景节点—行为节点的有向图;当行为序列中不止一个行为时,按照顺序依次添加行为节点,形成的结构为价值观节点—场景节点—第一行为节点—第二行为节点—……;其中,价值观节点、场景节点、行为节点分别对应语义关系对中的价值观、场景以及行为序列中的行为;33将抽取出的关系对合并生成按所属的不同群体划分在不同的群体节点下;将每个群体节点下面的关系对按照“价值观、场景、行为”的顺序合并形成树状结构;相同价值观但处于不同场景的关系对的价值观节点相同;34将每个群体节点形成的树状结构的根结点连接到对应的群体节点,即完成社会价值行为图的构建;社会价值行为图从上到下包括:社会节点、群体节点、价值观节点、场景节点、为序列节点,是一个有向有权的树状结构;4根据当前行为识别任务抽取出场景,利用已经测定出的价值观,采用分解与合成方法在社会价值行为图中采样,形成“价值观—场景”对,得到语义解析图;利用解析图在社会价值行为图中进行推理,即使用“价值观—场景”对在社会价值行为图中进行匹配,得出个体的行为链,从而确定个体在特定场景下的不同行为选择概率;通过上述步骤,实现基于大语言模型的社会个体行为识别预测。

全文数据:

权利要求:

百度查询: 北京大学武汉人工智能研究院;北京大学 一种基于大语言模型的社会个体行为识别预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。