User information data processing method and device and server

25-08-2023 дата публикации
Номер:
CN116644721A
Автор: YANG MENGRU, PAN XU
Контакты:
Номер заявки: 62-10-20238125.8
Дата заявки: 30-05-2023

用户信息的数据处理方法、装置和服务器

附图说明

[0058]

为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

[0059]

图1是本说明书的一个实施例提供的用户信息的数据处理方法的流程示意图;

[0060]

图2是在一个场景示例中,应用本说明书实施例提供的用户信息的数据处理方法的一种实施例的示意图;

[0061]

图3是在一个场景示例中,应用本说明书实施例提供的用户信息的数据处理方法的一种实施例的示意图;

[0062]

图4是在一个场景示例中,应用本说明书实施例提供的用户信息的数据处理方法的一种实施例的示意图;

[0063]

图5是在一个场景示例中,应用本说明书实施例提供的用户信息的数据处理方法的一种实施例的示意图;

[0064]

图6是在一个场景示例中,应用本说明书实施例提供的用户信息的数据处理方法的一种实施例的示意图;

[0065]

图7是在一个场景示例中,应用本说明书实施例提供的用户信息的数据处理方法的一种实施例的示意图;

[0066]

图8是在一个场景示例中,应用本说明书实施例提供的用户信息的数据处理方法的一种实施例的示意图;

[0067]

图9是在一个场景示例中,应用本说明书实施例提供的用户信息的数据处理方法的一种实施例的示意图;

[0068]

图10是在一个场景示例中,应用本说明书实施例提供的用户信息的数据处理方法的一种实施例的示意图;

[0069]

图11是本说明书的一个实施例提供的服务器的结构组成示意图;

[0070]

图12是本说明书的一个实施例提供的用户信息的数据处理装置的结构组成示意图。

技术领域

[0001]

本说明书属于互联网技术领域,尤其涉及用户信息的数据处理方法、装置和服务器。

具体实施方式

[0071]

为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。

[0072]

需要说明的是,本说明书中所涉及到的与用户相关的信息数据,均为在用户知晓且同意的前提下获取和使用的;且对于上述信息数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。

[0073]

参阅图1所示,本说明书实施例提供了一种用户信息的数据处理方法。其中,该方法具体应用于服务器一侧。具体实施时,该方法可以包括以下内容:

[0074]

S101:获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;

[0075]

S102:确定文字字符串中的文字字符的位置信息和拼音数据;

[0076]

S103:根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;

[0077]

S104:根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;

[0078]

S105:根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

[0079]

基于上述实施例,通过利用文字字符拼音数据的特性进行相应的混淆处理,能够有效地隐藏文本数据中的用户信息,避免用户信息遭到泄露,从而能够较好地保护用户的信息安全。

[0080]

在一些实施例中,上述用户信息的数据处理方法具体可以应用于服务器一侧。

[0081]

其中,参阅图2所示,上述服务器(例如,业务服务器)具体可以包括一种应用于金融交易平台(例如,XX银行等)一侧,能够实现数据传输、数据处理等功能的后台服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。

[0082]

具体的,用户在使用金融交易平台的业务终端办理相关业务时,常常需要输入诸如用户的姓名、证件号、年龄等用户信息。

[0083]

其中,上述业务终端具体可以包括一种应用于用户一侧,能够实现数据采集、数据传输等功能的前端。具体的,所述业务终端例如可以为自助服务机、台式电脑、平板电脑、笔记本电脑等电子设备。或者,所述业务终端也可以为能够运行于上述电子设备中的软件应用。

[0084]

服务器与业务终端相连。具体实施时,服务器可以通过业务终端获取包含有用户信息的目标文本数据。接着,服务器可以根据预设的处理规则,先确定出该目标文本数据所包含的文字字符串中各个文字字符的位置信息和拼音数据;并根据预设的转换规则,利用文字字符的拼音数据,将文字字符转换为对应的中间数据,得到中间数据组;再根据文字字符的位置信息,选择并根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到隐藏了真实的用户信息的混淆处理后的目标文本数据。

[0085]

进一步,服务器可以将上述混淆处理后的目标文本数据通过有线或无线的方式发送至金融交易平台的中心服务器进行核验和存证。

[0086]

相应的,中心服务器可以根据预设的处理规则,对所接收到的混淆处理后的目标文本数据进行还原处理,以得到包含有真实的用户信息的目标文本数据;再基于该目标文本数据中的用户信息,对该用户进行信息核验;在确定核验通过的情况下,确定为该用户提供相应的金融交易服务;同时,中心服务器销毁上述目标文本数据,只将混淆处理后的目标文本数据存入数据库中进行存证。

[0087]

基于上述实施例,服务器可以根据预设的处理规则,先对包含有用户信息的目标文本数据进行混淆处理,得到混淆后的目标文本数据,以隐藏真实的用户信息;再将混淆后的目标文本数据,传输给中心服务器,避免在传输过程中由于文本数据被窃取,导致用户信息遭到泄露。中心服务器在接收到混淆后的目标文本数据后,可以根据预设的处理规则,对混淆后的目标文本数据进行还原处理,得到包含有真实的用户信息的目标文本数据,进而可以正常利用该目标文本数据完成诸如信息核验等数据处理;同时,中心服务器还可以只将混淆后的目标文本数据存入数据库中,避免由于存储中的文本数据被窃取,导致用户信息遭到泄露。从而可以较好地保护用户的信息安全。

[0088]

在一些实施例中,上述目标文本数据具体可以理解为用户在办理金融交易业务时所提供的包含有用户信息的文本数据。

[0089]

其中,上述用户信息具体可以是通过文字字符串表示,上述文字字符串具体可以包括多个按序排列的文字字符。上述文字字符具体可以包括汉语文字。

[0090]

具体的,例如,文字字符串:“一种基于汉语拼音声母的文字加解密算法”,包括按序依次排列的“一”、“种”、“基”、“于”、“汉”、“语”、“拼”、“音”、“声”、“母”、“的”、“文”、“字”、“加”、“解”、“密”、“算”、“法”一共18个文字字符。

[0091]

在一些实施例中,上述文字字符的位置信息具体可以包括文字字符在文字字符串中的排序信息。

[0092]

具体的,当文字字符只包括一行文字字符时,上述文字字符的位置信息具体可以是该文字字符在该行文字字符中的排列序号。例如,参阅图3所示,“一种基于汉语拼音声母的文字加解密算法”中的文字字符“文”的位置信息可以记为:12。

[0093]

当文字字符包括多行文字字符时,上述文字字符的位置信息具体可以是该文字字符所在行的行序号,以及在该行文字字符中的排列序号的组合。例如,参阅图4所示,“一种基于汉语拼音声母的文字加解密算法”中的文字字符“文”的位置信息可以记为:[2][1]。

[0094]

具体实施时,服务器可以通过查询拼音字典库,确定出各个文字字符的拼音数据。

[0095]

在一些实施例中,参阅图5所示,上述根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,具体可以包括:按照以下方式将文字字符串中的当前文字字符转换为相对应的当前中间数据:

[0096]

S1:根据当前文字字符的拼音数据,确定当前文字字符的字母字符组,以及声调信息;

[0097]

S2:根据预设的转换规则,确定出与当前文字字符的声调信息对应的声调标识符;

[0098]

S3:组合当前文字字符的字母字符组和声调标识符,得到相对应的当前中间数据。

[0099]

基于上述实施例,可以根据预设的转换规则,利用文字字符的拼音数据将目标文本数据中的文字字符串转换为以字母字符组和声调标识符为基本单位(即中间数据)的中间数据组,以便后续能够有效地利用文字字符的拼音数据的特性进行混淆处理。

[0100]

在一些实施例中,一个中间数据对应一个文字字符,且中间数据在中间数据组中的排序与所对应的文字字符在文字字符串中的排序对应。

[0101]

具体的,每个中间数据包括所对应的文字字符基于汉语拼音的字母字符组,以及声调标识符。

[0102]

其中,上述字母字符组具体可以是声母字符与韵母字符的组合,也可以只包含有韵母字符。例如,文字字符“种”的字母字符组可以表示为“zhong”,文字字符“额”的字母字符组可以表示表示为“e”。

[0103]

上述声调标识符具体可以为基于预设的转换规则,与声调信息对应的标识符。例如,基于预设的转换规则,可以将第一声对应的声调标识符记为“1”,将第二声对应的声调标识符记为“2”,将第三声对应的声调标识符记为“3”,将第四声对应的声调标识符记为“4”,将轻声对应的声调标识符记为“0”。

[0104]

具体实施时,可以按照先字母字符组,后声调标识符的顺序,组合文字字符的字母字符组和声调标识符,得到对应的中间数据。例如,与文字字符“声”对应的中间数据组可以记为:“sheng1”,与文字字符“汉”对应的中间数据组可以记为:“han4”。

[0105]

按照上述方式,可以将文字字符串中按序排列的文字字符分别转换为对应的中间数据,可以得到与该文字字符串对应的中间数据组。例如,文字字符串“一种基于汉语拼音声母的文字加解密算法”对应的中间数据组具体可以表示为以下形式:{yi1,zhong3,ji1,yu2,han4,yu3,pin1,yin1,sheng1,mu3,de0,wen3,zi4,jia1,jie3,mi4,suan4,fa3}。

[0106]

在一些实施例中,上述确定文字字符串中的文字字符的位置信息,具体可以包括:根据文字字符在文字字符串中的排序信息,确定该文字字符的位置信息。

[0107]

具体实施时,可以先检测文字字符串是否存在多行文字字符;在确定文字字符串存在多行文字字符时,可以获取并利用文字字符串中的各个文字字符所在的行的行序号,以及在所在行的文字字符中的排列序号进行组合,作为该文字字符的位置信息.在确定文字字符串只存在一行文字字符时,则可以直接利用该文字字符在文字字符串中的排列序号作为该文字字符的位置信息。

[0108]

基于上述实施例,可以准确地确定出不同情况下文字字符串中各个文字字符的位置信息。

[0109]

在一些实施例中,所述混淆规则具体可以理解为一种通过混淆中间数据中的声母字符和/或韵母字符,以隐藏真实信息的数据处理规则。

[0110]

具体的,所述混淆规则至少可以包括:在参考声母表中沿向前的方向搜索用于混淆处理的声母字符的第一混淆规则,在参考声母表中沿向后的方向搜索用于混淆处理的声母字符的第二混淆规则。

[0111]

其中,参考声母表具体可以包括按照指定顺序排列的多个声母字符。具体可以参阅图6所示。需要说明的是,上述参考声母表中声母字符的排列规则可以根据具体情况和处理需求,灵活设置。

[0112]

基于上述实施例,可以引入并使用相关的混淆规则,以便利用中间数据中的字母字符组,以及与参考声母表中的排列规则,来对中间数据进行混淆处理,以隐藏真实信息。

[0113]

在一些实施例中,上述根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则,具体实施时,可以包括以下内容:

[0114]

S1:检测文字字符的位置信息是否为偶数;

[0115]

S2:在确定文字字符的位置信息为偶数的情况下,将第一混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;

[0116]

S3:在确定文字字符的位置信息为奇数的情况下,将第二混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0117]

具体实施时,在文字字符串包括多行文字字符,文字字符的位置信息包括文字字符所在行的行序号,以及该文字字符在所在行中的排列序号的组合的情况下,可以通过检测行序号与排列序号的和是否为偶数来判断该文字字符的位置信息是否为偶数。

[0118]

基于上述实施例,可以利用文字字符的位置信息,准确地确定出相匹配的混淆规则,以便后续能够区分不同情况的文字字符,采用相匹配的混淆规则进行区分处理。

[0119]

在一些实施例中,为了进一步提高安全性,上述目标文本数据还可以携带有时间戳。其中,上述时间戳用于指示目标文本数据的获取时间,例如,13:21,即,13点21分服务器获取该目标文本数据。

[0120]

具体实施时,服务器还可以结合目标文本数据的时间戳,以及文字字符的位置信息,来共同确定与该文字字符相匹配的混淆规则。例如,可以将目标文本数据的时间戳中小时数字与文字字符的位置信息相加,再检测相加得到和是否为偶数;如果为偶数,则将第一混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;否则,则将第二混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0121]

进一步,服务器还可以将目标文本数据的时间戳中小时数字与文字字符的位置信息相加,并对相加得到的和进行哈希运算,得到对应的哈希值,再检测所得到的哈希值是否为偶数;如果为偶数,则将第一混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;否则,则将第二混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0122]

在一些实施例中,在与当前中间数据相匹配的混淆规则为第一混淆规则的情况下,参阅图7所示,具体实施时,可以按照以下方式,根据相匹配的混淆规则,对中间数据组中与当前文字字符相对应的当前中间数据中的声母字符进行混淆处理:

[0123]

S1:根据相匹配的混淆规则,在参考声母表中确定出当前中间数据中的声母字符所在位置作为起始位置;

[0124]

S2:从起始位置出发,在参考声母表中沿向前的方向逐个搜索参考声母表中的声母字符,直到搜索到满足要求的目标声母字符为止;其中,所述目标声母字符与当前中间数据中的韵母字符满足预设的拼音组合关系;

[0125]

S3:将目标声母字符确定为当前中间数据的混淆字符;

[0126]

S4:利用混淆字符替换当前中间数据中的声母字符,并保持当前中间数据中的声调标识符不变,得到混淆后的中间数据。

[0127]

基于上述实施例,可以利用第一混淆规则,通过对位置信息为偶数的中间数据中的声母字符进行替换,实现混淆处理。

[0128]

在一些实施例中,上述满足预设的拼音组合关系具体可以理解为基于拼音组合规则,声母字符能够与韵母字符进行组合,以得到一个合理的拼音字母组合。例如,对于中间数据“chong1”中原本的字母字符组为“chong”,声母字符为“ch”,韵母字符为“ong”。

[0129]

基于拼音组合规则,在参考声母表中沿向前的方向搜索到的声母字符“zh”能够与韵母字符“ong”组合,得到合理的拼音字母组合“zhong”。因此,两者满足预设的拼音组合关系。这时,可以将声母字符“zh”混淆字符,并利用混淆字符替换中间数据中原有的声母字符“ch”,得到对应的混淆后的中间数据“zhong”。

[0130]

但是,基于拼音组合规则,声母字符“j”是无法与韵母字符“ong”组合的,两者组合得到的“jong”是不合理,也是不存在的,因此两者不满足预设的拼音组合关系。

[0131]

具体的,还可以参照上述处理位置信息为偶数的中间数据的方式,根据第二混淆规则,对位置信息为奇数的中间数据中的声母字符进行混淆处理。对此,本说明书不再赘述。

[0132]

在一些实施例中,所述混淆规则具体还可以包括:在参考韵母表中沿向前的方向搜索用于混淆处理的韵母字符的第三混淆规则,在参考韵母表中沿向后的方向搜索用于混淆处理的韵母字符的第四混淆规则等。

[0133]

其中,参考韵母表具体可以包括按照指定顺序排列的多个韵母字符。具体可以参阅图8所示。需要说明的是,上述参考韵母表中韵母字符的排列规则可以根据具体情况和处理需求,灵活设置。

[0134]

基于上述实施例,可以引入并结合使用相关的基于参考韵母表的混淆规则,能够更加有效、全面地对中间数据组进行混淆处理,以更好地隐藏真实信息。

[0135]

在一些实施例中,上述根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则,具体实施时,还可以包括以下内容:

[0136]

S1:检测文字字符中是否存在声母字符;

[0137]

S2:在确定文字字符中不存在声母字符的情况下,检测该文字字符的位置信息是否为偶数;

[0138]

S3:在确定文字字符的位置信息为偶数的情况下,将第三混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;

[0139]

S4:在确定文字字符的位置信息为奇数的情况下,将第四混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0140]

基于上述实施例,通过同时考虑声母字符和韵母字符,能够更加准确地找出与中间数据相匹配的混淆规则。

[0141]

在一些实施例中,在与当前中间数据相匹配的混淆规则为第三混淆规则的情况下,参阅图9所示,具体实施时,可以按照以下方式,根据相匹配的混淆规则,对中间数据组中与当前文字字符相对应的当前中间数据中的韵母字符进行混淆处理:

[0142]

S1:根据相匹配的混淆规则,在参考韵母表中确定出当前中间数据中的韵母字符所在位置作为起始位置;

[0143]

S2:从起始位置出发,在参考韵母表中沿向前的方向搜索韵母字符,获取目标韵母字符;其中,所述目标韵母字符为参考韵母表中与当前中间数据中的韵母字符邻近且位于当前中间数据中的韵母字符前方位置的韵母字符;

[0144]

S3:将目标韵母字符确定为混淆字符;

[0145]

S4:利用混淆字符替换当前中间数据中的韵母字符,得到混淆后的中间数据。

[0146]

基于上述实施例,可以利用第三混淆规则,通过对位置信息为偶数的中间数据中的韵母字符进行替换,实现混淆处理。

[0147]

具体的,还可以参照上述处理位置信息为偶数的中间数据的方式,根据第四混淆规则,对位置信息为奇数的中间数据中的韵母字符进行混淆处理。对此,本说明书不再赘述。

[0148]

具体实施时,基于上述方式,通过对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,可以得到混淆后的中间数据组;其中,混淆后的中间数据组可以包括多个按序排列的混淆后的中间数据。具体的,例如,原来的中间数据组{yi1,zhong3,ji1,yu2,han4,yu3,pin1,yin1,sheng1,mu3,de0,wen3,zi4,jia1,jie3,mi4,suan4,fa3}经过上述混淆处理后,得到对应的混淆后的中间数据组,具体可以表示为形式:{si1,chong3,li1,wu2,kan4,wu3,bin1,bin1,cheng1,fu3,me0,ben3,ri4,qia1,lie3,di4,cuan4,da3}。

[0149]

在一些实施例中,在利用混淆字符替换当前中间数据中的声母字符,并保持当前中间数据中的声调标识符不变,得到混淆后的中间数据之后,所述方法具体实施时,还可以包括:

[0150]

S1:根据预设的转换规则,将混淆后的中间数据逆转换为对应的混淆后的文字字符;

[0151]

S2:组合所述混淆后的文字字符,得到所述混淆处理后的目标文本数据。

[0152]

具体实施时,可以根据预设的转换规则,根据混淆后的中间数据的字母字符组和声调标识符,还原出该混淆后的中间数据的拼音数据;再根据该混淆后的中间数据的拼音数据,确定出对应的文字字符作为上述混淆后的文字字符,实现逆转换。

[0153]

具体实施时,可以按照中间数据所对应的原文字字符的位置信息,排列组合对应的混淆后的文字字符,以得到混淆处理后的目标文本数据。

[0154]

基于上述实施例,可以通过对目标文本数据中的文字字符进行混淆处理,得到能够有效隐藏真实的用户信息的混淆处理后的目标文本数据。

[0155]

在一些实施例中,具体根据混淆后的中间数据的拼音数据,确定出对应的文字字符作为上述混淆后的文字字符时,可以先根据混淆后的中间数据的拼音数据,搜索满足与该拼音数据相匹配的文字字符。在只搜索到一个与该拼音数据相匹配的文字字符的情况下,可以直接将该文字字符确定为混淆后的文字字符。在搜索多个与该拼音数据相匹配的文字字符(例如,多个同音字)的情况下,可以将多个与该拼音数据相匹配的文字字符记为待定字符;从待定字符中筛选出能够与前后相邻的一个混淆后的文字字符组合的待定字符,作为对应的混淆后的文字字符。

[0156]

具体实施时,可以按照上述方式将混淆后的中间数据组混淆后的中间数据组{si1,chong3,li1,wu2,kan4,wu3,bin1,bin1,cheng1,fu3,me0,ben3,ri4,qia1,lie3,di4,cuan4,da3}中的各个混淆后的中间数据依次逆转换为对应的混淆后的文字字符,得到对应的混淆后的文字字符串:“思宠哩屋看彬彬撑符么本日掐挘地窜打”,作为最终混淆处理后的目标文本数据。对比原本的文本数据中的文字字符串“一种基于汉语拼音声母的文字加解密算法”。显然,混淆处理后的目标文本数据有效地隐藏了真实信息。第三方即使在传输或存储过程中截取了上述混淆处理后的目标文本数据,基于上述混淆处理后的目标文本数据,显然无法获得真正的用户信息,从而能够实现对用户的信息安全的有效保护,避免用户信息遭到泄露。

[0157]

在一些实施例中,参阅图10所示,所述方法具体实施时,还可以包括以下内容:

[0158]

S1:获取混淆处理后的目标文本数据;

[0159]

S2:确定混淆处理后的目标文件数据中文字字符的位置信息和拼音数据;

[0160]

S3:根据文字字符的拼音数据和预设的转换规则,将混淆处理后的目标文件数据中文字字符分别转换为相对应的中间数据,得到中间数据组;

[0161]

S4:根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;

[0162]

S5:根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的逆混淆处理,以还原得到目标文本数据。

[0163]

基于上述实施例,当需要使用目标文本数据时,服务器还可以根据预设的处理规则,通过对混淆处理后的目标文本数据进行对应的还原处理,以得到正常包含有真实的用户信息的目标文本数据。

[0164]

在一些实施例中,具体实施时,可以根据文字字符的位置信息,检测文字字符的位置信息是否为偶数;在确定文字字符的位置信息为偶数的情况下,将第二混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;在确定文字字符的位置信息为奇数的情况下,将第一混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0165]

类似的,在确定中间数据不包含声母字符的情况下,在确定文字字符的位置信息为偶数的情况下,将第四混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;在确定文字字符的位置信息为奇数的情况下,将第三混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0166]

进而可以根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的逆混淆处理,得到还原后的中间数据组。其中,还原后的中间数据组包括多个按序排列的还原后的中间数据。

[0167]

再根据还原后的中间数据所对应的拼音数据,将还原后的中间数据组中按序排列的还原后的中间数据分别转换成对应的文字字符,得到还原后的文字字符串,从而还原得到包含有真实的用户信息的目标文本数据。

[0168]

在具体将还原后的中间数据转换问对应的文字字符时,有时一个还原后的中间数据所对应的拼音数据可能同时对应多个文字字符(例如,多个同音字),这时可以将多个文字字符作为待定字符,进行其他还原后的中间数据的转换处理。在完成所有还原后的中间数据的转换处理之后,可以依次计算各个待定文字字符与前后相邻的文字字符之间的语义关联度;再根据语义关联度,从多个待定字符筛选语义关联度最高的待定字符,作为该还原后的中间数据所对应的文字字符,从而可以较为准确地将各个还原后的中间数据转换为对应的文字字符。

[0169]

进一步,在得到还原后的文字字符串之后,还可以对还原后的文字字符串进行语义识别,得到对应的语义识别结果;再根据语义识别结果,有针对性地对还原后的文字字符串中的各个文字字符进行校正处理,从而可以更加准确地还原得到目标文本数据。

[0170]

具体实施时,可以根据目标文本数据,对用户进行核验,以确定用户是否满足服务条件;在确定用户满足服务条件的情况下,为该用户提供相应的交易服务。

[0171]

由上可见,基于本说明书实施例提供的用户信息的数据处理方法,在获取包括表征用户信息的文字字符串的目标文本数据之后,可以先确定出各个文字字符的位置信息和拼音数据,并根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;再根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。从而通过利用文字字符的拼音数据进行相应的混淆处理,能够有效地隐藏文本数据中的用户信息,较好地保护用户的信息安全。

[0172]

本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;确定文字字符串中的文字字符的位置信息和拼音数据;根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

[0173]

为了能够更加准确地完成上述指令,参阅图11所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口1101、处理器1102以及存储器1103,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。

[0174]

其中,所述网络通信端口1101,具体可以用于获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串。

[0175]

所述处理器1102,具体可以用于确定文字字符串中的文字字符的位置信息和拼音数据;根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

[0176]

所述存储器1103,具体可以用于存储相应的指令程序。

[0177]

在本实施例中,所述网络通信端口1101可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。

[0178]

在本实施例中,所述处理器1102可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。

[0179]

在本实施例中,所述存储器1103可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。

[0180]

本说明书实施例还提供了一种基于上述用户信息的数据处理方法的计算机可读存储介质,所述计算机可读存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;确定文字字符串中的文字字符的位置信息和拼音数据;根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

[0181]

在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。

[0182]

在本实施例中,该计算机可读存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。

[0183]

本说明书还提供了一种计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;确定文字字符串中的文字字符的位置信息和拼音数据;根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

[0184]

参阅图12所示,在软件层面上,本说明书实施例还提供了一种用户信息的数据处理装置,该装置具体可以包括以下的结构模块:

[0185]

获取模块1201,具体可以用于获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;

[0186]

第一确定模块1202,具体可以用于确定文字字符串中的文字字符的位置信息和拼音数据;

[0187]

转换模块1203,具体可以用于根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;

[0188]

第二确定模块1204,具体可以用于根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;

[0189]

混淆模块1205,具体可以用于根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

[0190]

在一些实施例中,上述转换模块1203具体实施时,可以按照以下方式将文字字符串中的当前文字字符转换为相对应的当前中间数据:根据当前文字字符的拼音数据,确定当前文字字符的字母字符组,以及声调信息;根据预设的转换规则,确定出与当前文字字符的声调信息对应的声调标识符;组合当前文字字符的字母字符组和声调标识符,得到相对应的当前中间数据。

[0191]

在一些实施例中,上述第一确定模块1202具体实施时,可以按照以下方式确定文字字符串中的文字字符的位置信息:根据文字字符在文字字符串中的排序信息,确定该文字字符的位置信息。

[0192]

在一些实施例中,所述混淆规则至少可以包括:在参考声母表中沿向前的方向搜索用于混淆处理的声母字符的第一混淆规则,在参考声母表中沿向后的方向搜索用于混淆处理的声母字符的第二混淆规则等。

[0193]

在一些实施例中,上述第二确定模块1204具体实施时,可以按照以下方式根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则:检测文字字符的位置信息是否为偶数;在确定文字字符的位置信息为偶数的情况下,将第一混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;在确定文字字符的位置信息为奇数的情况下,将第二混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0194]

在一些实施例中,上述混淆模块1205具体实施时,在与当前中间数据相匹配的混淆规则为第一混淆规则的情况下,可以按照以下方式,根据相匹配的混淆规则,对中间数据组中与当前文字字符相对应的当前中间数据中的声母字符进行混淆处理:根据相匹配的混淆规则,在参考声母表中确定出当前中间数据中的声母字符所在位置作为起始位置;从起始位置出发,在参考声母表中沿向前的方向逐个搜索参考声母表中的声母字符,直到搜索到满足要求的目标声母字符为止;其中,所述目标声母字符与当前中间数据中的韵母字符满足预设的拼音组合关系;将目标声母字符确定为当前中间数据的混淆字符;利用混淆字符替换当前中间数据中的声母字符,并保持当前中间数据中的声调标识符不变,得到混淆后的中间数据。

[0195]

在一些实施例中,上述混淆模块1205在利用混淆字符替换当前中间数据中的声母字符,并保持当前中间数据中的声调标识符不变,得到混淆后的中间数据之后,还可以用于根据预设的转换规则,将混淆后的中间数据逆转换为对应的混淆后的文字字符;组合所述混淆后的文字字符,得到所述混淆处理后的目标文本数据。

[0196]

在一些实施例中,所述混淆规则具体还可以包括:在参考韵母表中沿向前的方向搜索用于混淆处理的韵母字符的第三混淆规则,在参考韵母表中沿向后的方向搜索用于混淆处理的韵母字符的第四混淆规则等。

[0197]

在一些实施例中,上述第二确定模块1204具体实施时,还可以按照以下方式根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则:检测文字字符中是否存在声母字符;在确定文字字符中不存在声母字符的情况下,检测该文字字符的位置信息是否为偶数;在确定文字字符的位置信息为偶数的情况下,将第三混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;在确定文字字符的位置信息为奇数的情况下,将第四混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0198]

在一些实施例中,上述混淆模块1205具体实施时,在与当前中间数据相匹配的混淆规则为第三混淆规则的情况下,可以按照以下方式,根据相匹配的混淆规则,对中间数据组中与当前文字字符相对应的当前中间数据中的韵母字符进行混淆处理:根据相匹配的混淆规则,在参考韵母表中确定出当前中间数据中的韵母字符所在位置作为起始位置;从起始位置出发,在参考韵母表中沿向前的方向搜索韵母字符,获取目标韵母字符;其中,所述目标韵母字符为参考韵母表中与当前中间数据中的韵母字符邻近且位于当前中间数据中的韵母字符前方位置的韵母字符;将目标韵母字符确定为混淆字符;利用混淆字符替换当前中间数据中的韵母字符,得到混淆后的中间数据。

[0199]

在一些实施例中,所述装置具体实施时,还可以用于:获取混淆处理后的目标文本数据;确定混淆处理后的目标文件数据中文字字符的位置信息和拼音数据;根据文字字符的拼音数据和预设的转换规则,将混淆处理后的目标文件数据中文字字符分别转换为相对应的中间数据,得到中间数据组;根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的逆混淆处理,以准确地还原得到目标文本数据。

[0200]

需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

[0201]

由上可见,本说明书实施例提供的用户信息的数据处理装置,通过利用文字字符的拼音数据进行相应的混淆处理,能够有效地隐藏文本数据中的用户信息,较好地保护用户的信息安全。

[0202]

虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

[0203]

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机可读存储介质中。

[0204]

本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

[0205]

虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

背景技术

[0002]

在金融业务场景中,金融机构的服务端常常需要采集、传输和存储相关的用户信息。

[0003]

但是,基于现有方法上述用户信息在具体的传输、存储等过程中很容易遭到泄露,进而会对用户的信息安全造成威胁。

[0004]

目前,亟需一种能够有效隐藏用户信息,保护用户的信息安全的数据处理方法。

发明内容

[0005]

本说明书提供了一种用户信息的数据处理方法、装置和服务器,通过利用文字字符的拼音数据进行相应的混淆处理,能够有效地隐藏文本数据中的用户信息,较好地保护用户的信息安全。

[0006]

本说明书提供了一种用户信息的数据处理方法,包括:

[0007]

获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;

[0008]

确定文字字符串中的文字字符的位置信息和拼音数据;

[0009]

根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;

[0010]

根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;

[0011]

根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

[0012]

在一个实施例中,根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,包括:按照以下方式将文字字符串中的当前文字字符转换为相对应的当前中间数据:

[0013]

根据当前文字字符的拼音数据,确定当前文字字符的字母字符组,以及声调信息;

[0014]

根据预设的转换规则,确定出与当前文字字符的声调信息对应的声调标识符;

[0015]

组合当前文字字符的字母字符组和声调标识符,得到相对应的当前中间数据。

[0016]

在一个实施例中,确定文字字符串中的文字字符的位置信息,包括:

[0017]

根据文字字符在文字字符串中的排序信息,确定该文字字符的位置信息。

[0018]

在一个实施例中,所述混淆规则至少包括:在参考声母表中沿向前的方向搜索用于混淆处理的声母字符的第一混淆规则,在参考声母表中沿向后的方向搜索用于混淆处理的声母字符的第二混淆规则。

[0019]

在一个实施例中,根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则,包括:

[0020]

检测文字字符的位置信息是否为偶数;

[0021]

在确定文字字符的位置信息为偶数的情况下,将第一混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;

[0022]

在确定文字字符的位置信息为奇数的情况下,将第二混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0023]

在一个实施例中,在与当前中间数据相匹配的混淆规则为第一混淆规则的情况下,按照以下方式,根据相匹配的混淆规则,对中间数据组中与当前文字字符相对应的当前中间数据中的声母字符进行混淆处理:

[0024]

根据相匹配的混淆规则,在参考声母表中确定出当前中间数据中的声母字符所在位置作为起始位置;

[0025]

从起始位置出发,在参考声母表中沿向前的方向逐个搜索参考声母表中的声母字符,直到搜索到满足要求的目标声母字符为止;其中,所述目标声母字符与当前中间数据中的韵母字符满足预设的拼音组合关系;

[0026]

将目标声母字符确定为当前中间数据的混淆字符;

[0027]

利用混淆字符替换当前中间数据中的声母字符,并保持当前中间数据中的声调标识符不变,得到混淆后的中间数据。

[0028]

在一个实施例中,在利用混淆字符替换当前中间数据中的声母字符,并保持当前中间数据中的声调标识符不变,得到混淆后的中间数据之后,所述方法还包括:

[0029]

根据预设的转换规则,将混淆后的中间数据逆转换为对应的混淆后的文字字符;

[0030]

组合所述混淆后的文字字符,得到所述混淆处理后的目标文本数据。

[0031]

在一个实施例中,所述混淆规则还包括:在参考韵母表中沿向前的方向搜索用于混淆处理的韵母字符的第三混淆规则,在参考韵母表中沿向后的方向搜索用于混淆处理的韵母字符的第四混淆规则。

[0032]

在一个实施例中,根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则,包括:

[0033]

检测文字字符中是否存在声母字符;

[0034]

在确定文字字符中不存在声母字符的情况下,检测该文字字符的位置信息是否为偶数;

[0035]

在确定文字字符的位置信息为偶数的情况下,将第三混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;

[0036]

在确定文字字符的位置信息为奇数的情况下,将第四混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

[0037]

在一个实施例中,在与当前中间数据相匹配的混淆规则为第三混淆规则的情况下,按照以下方式,根据相匹配的混淆规则,对中间数据组中与当前文字字符相对应的当前中间数据中的韵母字符进行混淆处理:

[0038]

根据相匹配的混淆规则,在参考韵母表中确定出当前中间数据中的韵母字符所在位置作为起始位置;

[0039]

从起始位置出发,在参考韵母表中沿向前的方向搜索韵母字符,获取目标韵母字符;其中,所述目标韵母字符为参考韵母表中与当前中间数据中的韵母字符邻近且位于当前中间数据中的韵母字符前方位置的韵母字符;

[0040]

将目标韵母字符确定为混淆字符;

[0041]

利用混淆字符替换当前中间数据中的韵母字符,得到混淆后的中间数据。

[0042]

在一个实施例中,所述方法还包括:

[0043]

获取混淆处理后的目标文本数据;

[0044]

确定混淆处理后的目标文件数据中文字字符的位置信息和拼音数据;

[0045]

根据文字字符的拼音数据和预设的转换规则,将混淆处理后的目标文件数据中文字字符分别转换为相对应的中间数据,得到中间数据组;

[0046]

根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;

[0047]

根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的逆混淆处理,以还原得到目标文本数据。

[0048]

本说明书还提供了一种用户信息的数据处理装置,包括:

[0049]

获取模块,用于获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;

[0050]

第一确定模块,用于确定文字字符串中的文字字符的位置信息和拼音数据;

[0051]

转换模块,用于根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;

[0052]

第二确定模块,用于根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;

[0053]

混淆模块,用于根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

[0054]

本说明书还提供了一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述用户信息的数据处理方法的相关步骤。

[0055]

本说明书还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时实现以下步骤:获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;确定文字字符串中的文字字符的位置信息和拼音数据;根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

[0056]

本说明书还提供了一种计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现所述用户信息的数据处理方法的相关步骤。

[0057]

基于本说明书提供的用户信息的数据处理方法、装置和服务器,在获取包括表征用户信息的文字字符串的目标文本数据之后,可以先确定出各个文字字符的位置信息和拼音数据,并根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;再根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;并根据相匹配的混淆规则,对中间数据组中的各个中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。从而通过充分利用文字字符的拼音数据的特性,进行相应的混淆处理,能够有效地隐藏文本数据中的用户信息,较好地保护用户的信息安全。



The invention provides a user information data processing method, a user information data processing device and a server, which can be used in the field of finance. Based on the method, after a server obtains target text data including character strings representing user information, position information and pinyin data of all character characters can be determined firstly, and the pinyin data of all the character characters can be converted according to the pinyin data of the character characters and a preset conversion rule. Character characters in the character string are converted into corresponding intermediate data, and an intermediate data set is obtained; according to the position information of the alphabetic characters, confusion rules matched with the intermediate data are determined; and according to a matched confusion rule, performing corresponding confusion processing on initial characters and/or final characters in the intermediate data in the intermediate data set to obtain target text data after confusion processing. The corresponding confusion processing is performed by using the pinyin data of the alphabetic characters, so that the user information in the text data can be effectively hidden, and the information security of the user is well protected.



0001.

1.一种用户信息的数据处理方法,其特征在于,包括:

获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;

确定文字字符串中的文字字符的位置信息和拼音数据;

根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;

根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;

根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

0002.

2.根据权利要求1所述的方法,其特征在于,根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,包括:按照以下方式将文字字符串中的当前文字字符转换为相对应的当前中间数据:

根据当前文字字符的拼音数据,确定当前文字字符的字母字符组,以及声调信息;

根据预设的转换规则,确定出与当前文字字符的声调信息对应的声调标识符;

组合当前文字字符的字母字符组和声调标识符,得到相对应的当前中间数据。

0003.

3.根据权利要求2所述的方法,其特征在于,确定文字字符串中的文字字符的位置信息,包括:

根据文字字符在文字字符串中的排序信息,确定该文字字符的位置信息。

0004.

4.根据权利要求3所述的方法,其特征在于,所述混淆规则至少包括:在参考声母表中沿向前的方向搜索用于混淆处理的声母字符的第一混淆规则,在参考声母表中沿向后的方向搜索用于混淆处理的声母字符的第二混淆规则。

0005.

5.根据权利要求4所述的方法,其特征在于,根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则,包括:

检测文字字符的位置信息是否为偶数;

在确定文字字符的位置信息为偶数的情况下,将第一混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;

在确定文字字符的位置信息为奇数的情况下,将第二混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

0006.

6.根据权利要求5所述的方法,其特征在于,在与当前中间数据相匹配的混淆规则为第一混淆规则的情况下,按照以下方式,根据相匹配的混淆规则,对中间数据组中与当前文字字符相对应的当前中间数据中的声母字符进行混淆处理:

根据相匹配的混淆规则,在参考声母表中确定出当前中间数据中的声母字符所在位置作为起始位置;

从起始位置出发,在参考声母表中沿向前的方向逐个搜索参考声母表中的声母字符,直到搜索到满足要求的目标声母字符为止;其中,所述目标声母字符与当前中间数据中的韵母字符满足预设的拼音组合关系;

将目标声母字符确定为当前中间数据的混淆字符;

利用混淆字符替换当前中间数据中的声母字符,并保持当前中间数据中的声调标识符不变,得到混淆后的中间数据。

0007.

7.根据权利要求6所述的方法,其特征在于,在利用混淆字符替换当前中间数据中的声母字符,并保持当前中间数据中的声调标识符不变,得到混淆后的中间数据之后,所述方法还包括:

根据预设的转换规则,将混淆后的中间数据逆转换为对应的混淆后的文字字符;

组合所述混淆后的文字字符,得到所述混淆处理后的目标文本数据。

0008.

8.根据权利要求5所述的方法,其特征在于,所述混淆规则还包括:在参考韵母表中沿向前的方向搜索用于混淆处理的韵母字符的第三混淆规则,在参考韵母表中沿向后的方向搜索用于混淆处理的韵母字符的第四混淆规则。

0009.

9.根据权利要求8所述的方法,其特征在于,根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则,还包括:

检测文字字符中是否存在声母字符;

在确定文字字符中不存在声母字符的情况下,检测该文字字符的位置信息是否为偶数;

在确定文字字符的位置信息为偶数的情况下,将第三混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则;

在确定文字字符的位置信息为奇数的情况下,将第四混淆规则确定为与该文字字符对应的中间数据相匹配的混淆规则。

0010.

10.根据权利要求8所述的方法,其特征在于,在与当前中间数据相匹配的混淆规则为第三混淆规则的情况下,按照以下方式,根据相匹配的混淆规则,对中间数据组中与当前文字字符相对应的当前中间数据中的韵母字符进行混淆处理:

根据相匹配的混淆规则,在参考韵母表中确定出当前中间数据中的韵母字符所在位置作为起始位置;

从起始位置出发,在参考韵母表中沿向前的方向搜索韵母字符,获取目标韵母字符;其中,所述目标韵母字符为参考韵母表中与当前中间数据中的韵母字符邻近且位于当前中间数据中的韵母字符前方位置的韵母字符;

将目标韵母字符确定为混淆字符;

利用混淆字符替换当前中间数据中的韵母字符,得到混淆后的中间数据。

0011.

11.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取混淆处理后的目标文本数据;

确定混淆处理后的目标文件数据中文字字符的位置信息和拼音数据;

根据文字字符的拼音数据和预设的转换规则,将混淆处理后的目标文件数据中文字字符分别转换为相对应的中间数据,得到中间数据组;

根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;

根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的逆混淆处理,以还原得到目标文本数据。

0012.

12.一种用户信息的数据处理装置,其特征在于,包括:

获取模块,用于获取目标文本数据;其中,所述目标文本数据至少包括用于表征用户信息的文字字符串;

第一确定模块,用于确定文字字符串中的文字字符的位置信息和拼音数据;

转换模块,用于根据文字字符的拼音数据和预设的转换规则,将文字字符串中的文字字符分别转换为相对应的中间数据,得到中间数据组;

第二确定模块,用于根据文字字符的位置信息,确定出与中间数据相匹配的混淆规则;

混淆模块,用于根据相匹配的混淆规则,对中间数据组中的中间数据中的声母字符和/或韵母字符进行相应的混淆处理,以得到混淆处理后的目标文本数据。

0013.

13.一种服务器,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至11中任一项所述方法的步骤。

0014.

14.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述指令被处理器执行时实现权利要求1至11中任一项所述方法的步骤。

0015.

15.一种计算机程序产品,其特征在于,包含有计算机程序,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述方法的步骤。