欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019104656188
申请人: 百度时代网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-04-10
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种程序代码的搜索处理方法,其特征在于,包括:依次获取一个代码库中的一个代码文件作为目标代码文件;

如果所述目标代码文件为软链接文件,则不将所述目标代码文件存储于索引库中;

如果所述目标代码文件不为软链接文件,则计算所述目标代码文件的文件信息摘要后,将所述目标代码文件以及所述文件信息摘要对应存储于所述索引库中;

返回执行依次获取一个代码库中的一个代码文件作为目标代码文件的操作,直至完成对全部代码库中的全部代码文件的处理;

分别计算所述索引库中任意两个代码文件在至少一个信息维度上的相似度,并在所述索引库中存储计算结果;

获取与用户的代码搜索条件匹配的搜索结果数据,所述搜索结果数据中包括多个代码文件;

在所述搜索结果数据中,对重复的代码文件进行筛除处理;

将筛除处理后的所述搜索结果数据,反馈给所述用户。

2.根据权利要求1所述的方法,其特征在于,获取与用户的代码搜索条件匹配的搜索结果数据,所述搜索结果数据中包括多个代码文件,包括:获取用户通过代码搜索引擎输入的代码搜索条件;

根据所述代码搜索条件,在根据至少一个代码库的代码文件所建立的索引库中进行搜索,获取与所述代码搜索条件匹配的搜索结果数据。

3.根据权利要求1所述的方法,其特征在于,在所述搜索结果数据中,对重复的代码文件进行筛除处理,包括:

比较所述搜索结果数据中任意两个代码文件的文件信息摘要,如果存在文件信息摘要相同的至少两个重复代码文件,则在所述重复代码文件中选择目标代码文件;

筛除所述重复代码文件中,除去所述目标代码文件之外的其他代码文件。

4.根据权利要求1所述的方法,其特征在于,在所述搜索结果数据中,对重复的代码文件进行筛除处理,包括:

比较所述搜索结果数据中任意两个代码文件在至少一个信息维度上的相似度;

如果存在满足相似度计算条件的至少两个重复代码文件,则在所述重复代码文件中选择目标代码文件;

筛除所述重复代码文件中,除去所述目标代码文件之外的其他代码文件。

5.根据权利要求4所述的方法,其特征在于,所述信息维度包括:代码文件存储路径、代码文件内容以及代码片段摘要中的一个或者多个。

6.根据权利要求4所述的方法,其特征在于,在所述重复代码文件中选择目标代码文件,包括:

获取用于存储各所述重复代码文件的目标代码库,并根据至少一项重要度因子对各所述目标代码库进行重要度排序;

根据对所述目标代码库的重要度排序结果,在所述重复代码文件中选择所述目标代码文件。

7.根据权利要求6所述的方法,其特征在于,所述重要度因子包括:代码库的被依赖次数、代码库的重要性标签以及代码库是否开放用户写权限。

8.根据权利要求6所述的方法,其特征在于,根据对所述目标代码库的重要度排序结果,在所述重复代码文件中选择所述目标代码文件,包括:如果所述重要度排序结果中仅包括一个重要度最高的目标代码库,则获取与所述重要度最高的目标代码库对应的代码文件作为所述目标代码文件;

如果所述重要度排序结果中包括至少两个重要度最高的目标代码库,则获取与所述至少两个重要度最高的目标代码库对应的代码文件作为备选代码文件;

获取文件存储路径最短的一个备选代码文件作为所述目标代码文件。

9.一种程序代码的搜索处理装置,其特征在于,包括:文件获取模块,用于依次获取一个代码库中的一个代码文件作为目标代码文件;

第一存储模块,用于如果目标代码文件为软链接文件,则不将目标代码文件存储于索引库中;

第二存储模块,用于如果目标代码文件不为软链接文件,则计算目标代码文件的文件信息摘要后,将目标代码文件以及文件信息摘要对应存储于索引库中;

操作返回模块,用于返回执行依次获取一个代码库中的一个代码文件作为目标代码文件的操作,直至完成对全部代码库中的全部代码文件的处理;

相似度计算模块,用于分别计算索引库中任意两个代码文件在至少一个信息维度上的相似度,并在索引库中存储计算结果;

数据获取模块,用于获取与用户的代码搜索条件匹配的搜索结果数据,所述搜索结果数据中包括多个代码文件;

文件筛除模块,用于在所述搜索结果数据中,对重复的代码文件进行筛除处理;

数据反馈模块,用于将筛除处理后的所述搜索结果数据,反馈给所述用户。

10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑8中任一所述的程序代码的搜索处理方法。

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1‑8中任一所述的程序代码的搜索处理方法。