首页>成果转化>专利

一种基于课程学习的多智能体深度确定性策略梯度方法

分类:G06F30/25

发明人:黄梦醒,冯子凯,吴迪,毋媛媛,冯思玲,张宏瑞,帅文轩,施之羿,于睿华

专利权人:海南大学

申请号:CN202110798780.9申请日期:2021-07-15

联系电话:18571690695

联系邮箱:niujj@uipplus.com

价值度评分:46

本发明提供一种基于课程学习的多智能体深度确定性策略梯度方法,将课程学习与强化学习结合在一起,在通过经验回放池采样时,根据课程标准复杂度从经验回放池中按照优先权重采样数据,然后采用基于Adam优化器的深度确定性策略梯度方法对每个智能体进行训练,并更新策略网络、策略目标网络、评价网络以及评价目标网络,当多智能体在环境内动作的下一个状态不是终止状态时,对课程标准进行更新,根据更加复杂的课程重复进行迭代计算,课程标准中包含的优先标准函数反映样本的采样优先权重,重复采样惩罚考虑重复采样对样本多样性的影响,冗余信息惩罚可以降低智能体之间交互的信息冗余量,与其他算法相比,本发明提高了算法的收敛效率和最终奖励。
公告日 法律状态 法律状态信息
专利价值度评分
技术价值
经济价值
法律价值
总评:46
该专利价值较低(仅供参考)

该专利的技术、经济、法律价值经系统自动评估后的总评得分较低,可以重点关注其公开的技术内容。

本专利文献包含【1个独立权利要求】、【1个实施例】、【5个技术分类】,从一定程度上而言上述指标的数值越大可以反映出所述专利的技术保护及应用范围越广。

技术价值:32

该指标主要从专利申请的著录信息、法律事件等内容中挖掘其技术价值,专利类型、独立权利要求数量、无效请求次数等内容均可反映出专利的技术性价值。技术创新是专利申请的核心,若您需要进行技术借鉴或寻找可合作的项目,推荐您重点关注该指标。

部分指标包括:

授权周期(发明)0个月

独立权利要求数量1个

从属权利要求数量8个

说明书页数7页

实施例个数1个

发明人数量9人

被引用次数0次

引用文献数量0个

优先权个数0个

技术分类数量5个

无效请求次数0次

分案子案个数0个

同族专利数0个

专利获奖情况

保密专利的解密

经济价值:7

该指标主要指示了专利技术在商品化、产业化及市场化过程中可能带来的预期利益。专利技术只有转化成生产力才能体现其经济价值,专利技术的许可、转让、质押次数等指标均是其经济价值的表征。因此,若您希望找到行业内的运用广泛的热点专利技术及侵权诉讼中的涉案专利,推荐您重点关注该指标。

部分指标包括:

申请人数量1人

申请人类型院校;

许可备案次数0次

权利质押次数0次

权利转移次数0次

是否海关备案

法律价值:7

该指标主要从专利权的稳定性角度评议其价值。专利权是一种垄断权,但其在法律保护的期间和范围内才有效。专利权的存续时间、当前的法律状态可反映出其法律价值。故而,若您准备找寻权属稳定且专利权人非常重视的专利技术,推荐您关注该指标。

部分指标包括:

存活期/维持时间0

法律状态审中-实质审查

发表留言