1.一种对聊天信息进行分配的技术开发咨询系统,其特征在于:包括记录输入端、信息匹配端、数据库和应答端;所述数据库用于存储人工客服与客户咨询聊天记录信息,所述数据库包括关键词存储单元和全纪录存储单元,其中:关键词存储单元用于存储客户咨询的聊天记录的关键词,全纪录存储单元用于存储人工客服与客户咨询的全部聊天记录;
所述记录输入端用于记录人工客服与客户之间的咨询信息,并提取人工服务时客户咨询的关键词和人工服务词汇并配对,关键词提取后经过分配单独转入关键词存储单元存储,人工服务词汇与关键词配对后统一转入全纪录存储单元;
所述信息匹配端用于输入客户咨询信息,并识别客户咨询信息与之匹配的关键词,所述信息匹配端包括关键词匹配单元,所述关键词匹配单元用于将输入的客户咨询信息与关键词存储单元中关键词进行匹配;
所述关键词存储单元中关键词与所述全纪录存储单元的聊天记录中关键词匹配,选择匹配度最高的人工服务词汇通过应答端输出;
所述记录输入端包括关键词提取单元,所述关键词提取单元用于提取人工服务时客户咨询的关键词;
所述关键词提取单元采用TF‑IDF公式算法提取关键词,具体方法如下:其中,count(w)为关键词的出现次数,|Di|为聊天记录中所有词的数量;
当一个词越普遍时,其IDF值越低;反之,则IDF值越高,IDF定义如下:其中,N为所有的文档总数,I(w,Di)表示文档是否包含关键词,若包含则为1,若不包含则为0,若词w在所有文档中均未出现,则IDF公式中的分母为0;
所述记录输入端还包括客服记录单元,用于输入人工服务词汇,并匹配关键词提取单元提取的关键词,之后统一将关键词与人工服务词汇转入全纪录存储单元存储,采用一对多的匹配方式,单个关键词匹配多个人工服务词汇,单个人工服务词汇匹配多个关键词;
所述记录输入端还包括关键词分配单元,所述关键词分配单元用于将客服记录单元的人工服务词汇和关键词提取单元匹配的关键词进行分类,将匹配的关键词分类后入关键词存储单元;
所述客服记录单元采用Jaro‑Winkler算法对客服记录单元中人工服务词汇与关键词提取单元中关键词进行匹配,其算法如下:设人工服务词汇与关键词字节的Jaro距离是dj,人工服务词汇与关键词字节拥有的共同前缀的长度为L,前缀的范围因子是p,Jaro‑Winkler距离的计算公式是:;
L最大是4个字符,p≤0.25;
所述关键词匹配单元采用Jaro‑Winkler算法对关键词匹配单元中客户咨询信息与关键词存储单元中关键词进行匹配;
所述全纪录存储单元采用Jaro‑Winkler算法对全纪录存储单元中人工服务词汇与关键词存储单元中关键词进行匹配;
所述应答端输出的关键词数据通过聊天窗口输出;
所述聊天窗口的人工聊天记录数据输入至记录输入端;
所述聊天窗口中客户咨询信息数据输入至信息匹配端;
技术开发咨询系统的具体运行流程如下:
S1、首先,在人工服务时,客户通过所述聊天窗口输入咨询信息,通过人工客服回复咨询信息,后生成聊天记录;
S2、聊天记录通过所述记录输入端输入,并通过所述关键词提取单元提取关键词;
S3、关键词提取后,通过所述客服记录单元输入人工服务词汇,并将人工服务词汇与所述关键词提取单元提取的关键词进行配对,之后统一转入所述全纪录存储单元;
S4、通过所述关键词分配单元将人工服务词汇和配对的关键词进行分类,将匹配的关键词单独存入所述关键词存储单元;
S5、非人工服务时,客户通过所述聊天窗口输入咨询信息,信息数据通过所述信息匹配端输入;
S6、经过所述关键词匹配单元将所述关键词存储单元中的关键词进行匹配,筛选出相应的关键词;
S7、筛选的关键词在与所述全纪录存储单元内部的关键词匹配对应,配对出相应的人工服务词汇;
S8、人工服务词汇通过所述应答端输出,之后由所述聊天窗口展示。