申请/专利权人:上海前晨汽车科技有限公司
申请日:2023-12-20
公开(公告)日:2024-03-22
公开(公告)号:CN117734729A
主分类号:B60W60/00
分类号:B60W60/00;B60W50/00;B60W50/14;G06F16/907;G06F16/903;G06F16/9032;G06F40/151
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.09#实质审查的生效;2024.03.22#公开
摘要:本公开涉及一种自动驾驶决策方法、装置及介质,涉及自动驾驶技术领域。其中,该方法包括:获取第一预设;基于第一预设生成感知提示文本;利用感知提示文本和原始感知信号查询多模态大型基础模型,得到期望获得的场景类别、目标及环境状态;基于第二预设和期望获得的场景类别、目标及环境状态生成决策提示文本;利用决策提示文本和原始视频查询多模态大型基础模型,得到自然语言形式的决策结果文本;根据决策结果文本,第三预设并利用模板提示功能生成指令提示文本;将指令提示文本转化为结构化自然语言的决策指令。通过以上方法,能利用多模态大型基础模型进行场景理解,加强或者取代现有感知模块的功能。
主权项:1.一种自动驾驶决策方法,其特征在于,所述方法包括:获取第一预设,其中,所述第一预设包括感知目标预设和格式预设;基于所述第一预设生成感知提示文本;利用所述感知提示文本和原始感知信号查询多模态大型基础模型,得到期望获得的场景类别、目标及环境状态;基于第二预设和所述期望获得的场景类别、目标及环境状态生成决策提示文本,其中,所述第二预设包括场景预设和情景预设;利用所述决策提示文本和原始视频查询所述多模态大型基础模型,得到自然语言形式的决策结果文本;根据所述决策结果文本,第三预设并利用多模态大型基础模型的模板提示功能生成指令提示文本,其中,所述第三预设包括驾驶风格预设和格式预设;利用所述多模态大型基础模型将自然语言形式的所述指令提示文本转化为结构化自然语言的决策指令。
全文数据:
权利要求:
百度查询: 上海前晨汽车科技有限公司 自动驾驶决策方法、装置及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。