2024年7月5日,北京嘉科开展了一期以“生成式模型复审答复策略分享”为主题的“一团火”IP沙龙活动,看看嘉宾讲了哪些干货吧~
本次分享主要包括三个方面,首先介绍了分享的案件的案情以及实审审查过程,接下来介绍了案件的复审策略,最后提出了一点启示,包括OA答复启示和新申请撰写启示。
1
人机交互产品大家很熟悉,例如Siri、小度、小爱同学等。这些产品尤其是在早期主要实现提供信息(查询时间、天气等)和辅助控制(拨打电话、控制家用电器等)的功能,在实现这些功能时,产品内置预设的应答模版或者应答控制模版,通过对用户发送的语音指令进行识别,然后将识别得到的指令与预设模版相匹配,来得到需要的信息或者控制结果。
随着生成模型的发展,尤其是在2022年底、2023年初,ChatGPT推出的新版本大火,区别于传统的模版式回复,实现了基于用户输入的包含少量信息的指令生成具有丰富延伸内容的答复,例如根据用户指令生成一篇文章。进一步的,今年问世的Sora还可以根据用户输入的文字指令自动生成视频,这些功能都是通过生成式模型实现的。
本次沙龙分享的案例申请号为202111620317.1 ,发明名称为“人机交互方法、装置、设备、存储介质及计算机程序产品”。案件申请日是2021年12月27 日。申请本案件的背景技术是:为保证人机交互过程中,机器侧可以保持回复内容的一致性,通常会将人机交互过程中的历史对话内容进行存储。当用户与机器进行人机交互时,机器侧能够通过检索已存储的历史对话内容的方式,确定历史对话过程中所回复的内容,进而回复能够表征长时记忆的回复内容。
相关技术中的上述解决方案,存在的技术问题是存储的历史对话内容没有侧重点,机器侧进行有用信息筛选时,存在特征信息容易遗漏的问题;以及由于机器侧需要在完整的历史对话内容中查找有用信息,侧数据处理量较大,且训练时需要通过多个长数据集进行训练,训练成本高。
针对上述技术问题,本案提供的解决技术问题的技术手段包括:
1)在人机交互过程中获取当前对话内容,对当前对话内容进行画像信息提取,并存储所提取的画像信息;
2)在人机交互过程中获取当前对话内容,在已存储的画像信息中,确定匹配当前对话内容的回复内容;
3)确定匹配当前对话内容的回复内容时,可以调用生成模型,将当前对话内容以及目标画像信息作为生成模型的输入,得到匹配当前对话内容的回复内容。
递交新申请时,独立权利要求1的技术方案为:一种人机交互方法,包括:获取当前对话内容,并在已存储的画像信息中,确定匹配所述当前对话内容的目标画 像信息;基于所述当前对话内容以及所述目标画像信息,确定匹配所述当前对话内容的回复内 容;以所述回复内容,对所述当前对话内容进行对话回复。
实审的审查过程为:2022年7月27日审查员发出《第一次审查意见通知书》指出权利要求1-19不符合A22.3;2022年9月26日申请人提交意见陈述,将部分说明书特征加入独权;2022年10月19日审查员发出《第二次审查意见通知书》,指出修改后的权利要求1-19仍然不符合A22.3;2022年12月29日申请人提交意见陈述,将部分说明书特征加入独权;2023年1月9日审查员发出《驳回决定》。
审查员在实审阶段共提供了两篇对比文件,这两篇对比文件公开的内容如下图所示:
一通答复时,申请人认可审查员认定的全部事实,但认为根据说明书的记载,本申请中的画像信息由于包括用户画像和机器画像,因此与对比文件中的用户画像信息存在区别。
案件被驳回后,申请人在综合评估之后向我方委托了复审任务。我方在接到复审任务之后,对本申请的方案与现有技术的对比情况进行了详细的梳理,发现原权利要求3中记载的“使用生成模型,基于当前对话内容和目标画像信息确定匹配的回复内容”的技术特征并未被现有技术所公开,且在人机交互产品中使用生成模型,在申请人之前尚不属于常规技术手段,因此可以考虑以该区别特征作为主要争辩方向。
关于使用生成模型确定答复内容与对比文件1中使用三元组信息在预先构建的图谱数据库中推理得到答复内容是否存在显著区别,原申请文件的文字部分未记载生成模型是如何工作的,但原说明书附图中给出了一个示例。从该示例可以看到,根据历史对话内容可以对用户和机器分别进行画像,得到用户画像信息和机器画像信息,并将得到的画像信息分别存储。此后,机器可以基于其自身的画像信息主动向用户打招呼,并在用户回复了“好久不见”后,基于用户画像信息给出符合用户特征但与当前对话的上下文不相关的答复“最近又看电视剧了吗”。
与此不同的是,对比文件1中的回复信息只能根据自当前对话内容提取的三元组信息,在图谱数据库中推理得到,也就是说对比文件1中的回复内容首先也是使用在图谱数据库中预存语料组合得到的,其次这些语料必须与提取的三元组信息相关。由此可以确定本申请中使用生成模型确定回复内容与对比文件1中使用三元组信息在图谱数据库中推理得到答复内容的实现原理不同,且针对相同的问题,可能给出不同的答复。
进一步的,对比文件2中答复匹配模型与本申请中的生成模型也不相同。如对比文件2说明书中对答复匹配模型的解释所记载的,这里的匹配是指当前对话内容与预设答复模版的匹配,或者当前对话内容经过机器学习模型分类得到对应即匹配的答复,该答复同样是预设答复而非生成的答复。因此,对比文件2同样未公开在人机交互过程中,使用生成模型确定答复内容的技术特征。
为进一步强调生成模型生成答复的过程与现有在答复模版中确定答复内容的方式不同,在提复审请求时,并未直接将原权3的附加技术特征加入原权1,而是根据说明书记载的内容增加了技术特征“在生成模型获取到当前对话内容和匹配当前对话内容的目标画像信息的情况下,确定并输出相应的语料信息”,以在原申请文件关于生成模型记载的内容有限的情况下,最大限度构成与现有技术的区别。
基于以上分析,我们确定了复审意见陈述策略,在复审请求书中,我们首先指出基于生成模型确定人机交互过程中的回复内容的方式未被现有技术公开,并结合说理与示例全面阐述了对比文件1和2确定答复内容的方式与本申请使用生成模型确定答复内容的方式不同,针对相同问题可能给出不同的答案。进一步的,在复审请求书中我们还指出生成模型这一技术虽然并非近年来新提出的,但此前该技术主要出于理论阶段,大部分创新都在于如何对模型底层的算法结构等进行改进。本申请早在2021年底就提出了将该模型应用于人机交互产品,且在应用时并非简单部署使用,而是针对人机交互应用场景提出了新的输入参数,即将当前对话内容与用户和机器画像信息一起作为输入,这样得到的人机交互产品相比传统产品不但工作效率更高,且产品的拟人化程度更高,能够大幅提升用户体验,在诸如新一代陪伴型人机交互产品中可以被广泛应用。
复审委认可了上述意见陈述的内容,对该案件做出了撤驳决定。后续前置审查员在进行了补充检索后,也对案件做出了授权决定。
最后,结合本案例的整个审查过程,我们总结了一点小启示。首先在OA答复阶段,针对核心技术方案的每个实现环节,需要明确其具体实现方式,并将该具体实现方式与对比文件的实现方式比较。同时在意见陈述中可以结合事例说理,增加意见陈述的说服力。此外,在实审环节,一通争辩的点若审查员不认可,二通应当修改争辩方向,或者增加争辩方向。
在新申请撰写阶段,核心执行步骤的具体实现方式需要清楚、完整地描述。另外,最好能够请发明人提供至少一个方案实际工作的示例,并将该示例完整记录于申请文件,用于在意见陈述时支持对权要中部分概念的解释。
(本文中ppt的版权和内容归原作者所有)
如您有意愿作为嘉宾参与“一团火”知产沙龙,分享您对于行业的宝贵意见,亦或您有意愿参加沙龙与行业大咖沟通交流,欢迎您报名参加沙龙活动。联系人:杨波,18601959839(微信同号)。