iprdaily,连接全球数百万知识产权精英,全球有影响力的知识产权行业媒体,禁止转载,来源:iprdaily中文网站(iprdaily.cn)作者:吴正明常州全航专利代理有限公司。,有限公司
原标题:语义之前的布尔值或语义之前的布尔值,这是一个问题
I日常介绍随着专利数据库的发展,数据量已经是最基本的评价指标。智能傻瓜式检索方法可以帮助企业非专业知识产权经过短期培训后,能够胜任普通检索需求;因此,为了使专利数据库的使用更加人性化,语义检索也成为各专利数据库公示的重点。本文搜索并分析了一项价值38万美元的“基石”专利。不久前,一位分析师分析了国内数据库的专利申请。同时,根据该专利被引用的次数,他在数据库中发现了一项被引用了19次的专利。该专利被视为数据库的“基石”专利。引用本美国专利申请的企业均为国内外互联网巨头,如微软、阿里巴巴、百度、莱克西斯等,体现了本专利在相关技术上的先进性。分析人士指出,在名为“搜索结果重新排序的方法和系统”的专利背后,是基于自然语义分析的新一代智能搜索技术,它可以通过超规模的计算智能自动理解不同专利文件中包含的各种主题,具有强烈的好奇心,作者发现了这项专利并对其进行了分析。这项“基石”专利价值38万美元。该专利的优先权是专利cn200810105725.1(检索结果重新排序的方法和系统)。这项专利申请在授权过程中遇到了一些曲折,经过了复审,也就是说,审查员曾经做出了驳回的决定。以下是最终授权版本的权利要求1,权利要求1非常简单。说明了保护范围,创新性强。从保护内容的角度来看,它本质上是一个布尔检索和语义检索结合使用的应用场景。计算机搜索布尔搜索类型,如用户输入的关键字,以获得搜索结果。计算机根据用户输入的语义检索公式(重新排序表达式)对第一步的结果重新排序。排序后显示所有搜索结果
该专利似乎属于新一代自然语义分析智能搜索技术的申请专利,与自然语义分析本身无关。本说明书引用了一些文件,核心算法没有直接公开,只是一些明确的操作过程和执行过程,该专利改变了授权权利要求1的两个主要特征,一是“重新排序表达式和搜索表达式同时输入”,二是删除了一些文档的排序和显示技术方案(根据重新排序表达式重新排序一些文档,并通过排序在搜索结果中显示一些文档),仅保留对所有文档进行排序并显示所有文档的技术方案。同一系列的美国许可专利还添加了“重新排序表达式是附加到搜索查询的文本字符串,从数据源生成搜索结果时不执行任作”的限制。也就是说,语义排序只对布尔搜索结果进行排序,没有重新限定,这将影响布尔搜索结果的操作
本专利实际上保护了语义排序之前布尔限制的检索方法,这项技术可以“在不减少搜索结果的情况下,与用户关注的问题相关的结果将显示在结果的前面。这使用户能够首先关注他特别希望看到的结果,同时完全看到其他结果。此外,只要修改排序表达式,用户可以根据需要以不同的方式对相同的搜索结果进行排序。使用自定义的重排序表达式可以很好地满足用户的个性化需求,提高搜索结果的浏览效率,更快、更准确地得到所需的结果。“
该专利于2008年申请。当时,国内数据库仍处于关键字搜索模式,基本上不涉及语义搜索。因此,该数据库可以提出这样的搜索模式和搜索思路,并被众多巨头引用,这也表明该专利在专利数据库中有着相当的技术贡献和应用前景搜索,引领了国内数据库从布尔检索向智能检索的转变,具有里程碑意义
随着专利数据库的发展,数据量已经是最基本的评价指标。智能傻瓜式检索方法可以帮助企业非专业知识产权经过短期培训后满足一般检索要求;因此,为了使专利数据库的使用更加人性化,语义检索也成为各专利数据库公示的重点。经过研究,作者发现有两种方法可以协调布尔和语义。一种是先定义布尔值,然后进行语义排序;第二种方法是从语义上检索固定数量的专利(例如,2000项专利),然后继续使用布尔限制过滤它们,即,语义优先和布尔优先的方法以下是基于两个国内数据库的三种检索模式的演示,一个是布尔优先,然后是语义优先,数据库1首先使用布尔搜索,搜索关键字为“多转子或四轴或多轴”的专利文本,共计111335个
添加语义排序条件“cn106494640b”对结果进行排序
最终表达式为r:(“cn106494640b”)和(tacd_all:(多转子或四轴或多轴)),其中r:(“cn106494640b”)是语义排序表达式,而(tacd_all:(多转子或四轴或多轴))是布尔限制表达式。结果仍然是111335项专利,但排序方法有所改变。专利公开版cn106494640b、cn106494640a位居第一。它与帮助中心中的数据库描述相同
单击播放GIF<!-->0.0 在顶的输入框中,您可以直接输入语义排序表达式和布尔限制表达式,r:(“cn110641729a”)和(tacd\u all:(UAV)),搜索结果的数量已成为123382项专利,仅使用布尔搜索(tacd\u all:(UAV)),专利cn110641729a本身在搜索结果中排名第一,搜索结果与布尔+语义的结果相同。它也是123382项专利,但搜索结果的顺序发生了变化,其中r=(cn106494640b)是语义排序表达式,而tiabc=(多转子或四轴或多轴)是布尔限制表达式。共有52999个搜索结果,其中每个专利都标有相关百分比。专利cn106494640b的公开版本cn106494640a排名第二,相关性为63.27%
删除语义表达式,仅使用布尔检索公式(tiabc=(多转子或四轴或多轴))。检索结果与布尔+语义的检索结果相同。它也是52999项专利,但检索结果的排序发生了变化。布尔搜索(tiabc=(UAV))的结果与布尔+语义搜索的结果相同。它们也是75229项专利,但在搜索结果中没有相关百分比,排名也发生了变化,在每个数据库的独立语义检索模块中操作时,检索模式不是语义前的布尔,而是布尔模式前的相反语义。具体来说,首先通过语义检索找到固定数量的相关专利(如2000),然后使用布尔限制在已找到的固定数量的专利中继续筛选满足布尔搜索条件的专利。因此,在这种模式下,最终的搜索数量必须小于或等于通过语义搜索过滤的专利数量,并且也小于或等于仅使用布尔搜索条件的搜索结果数,在搜索结果中可以获得1000个搜索结果,并且每个结果都有一个相关百分比,这个百分比逐渐减小,即,系统截取最相关的1000个搜索结果,语义搜索表达式是一组加密代码,在语义搜索的基础上,IPC分类号限制为b64f5/60,使用布尔搜索条件进行二次过滤,过滤后的搜索结果为75,即
免责声明:文中图片均来源于网络,如有版权问题请联系我们进行删除!
标签: