1.一种基于区块链的数字档案系统,包括:
数据采集模块,采集档案数据并转换为数字化档案数据,将数字化档案数据上传到IPFS分布式存储网络获得IPFS哈希值;构建原始档案数据库,记录档案数据包含档案名称、档案类型和创建时间的元数据;
区块构建模块,对每个档案数据进行SHA-256哈希计算得到档案哈希值;采用基于图神经网络的机器学习算法对档案哈希值进行相关性分析,获取档案间的关联模式,关联模式包含档案主题;根据关联模式将相同主题的档案哈希值合并到一个哈希区块中并设置区块容量上限;对哈希区块进行Merkle树结构化,生成区块头哈希;
区块链共识模块,获取哈希区块间的逻辑关系,并按照哈希区块的生成时间顺序将哈希区块链接成链表结构;采用基于权益证明POS的共识机制,根据区块链节点持有的代币数量和持币时长计算节点的权重,按照权重大小选择区块生成节点;被选中的区块生成节点将新生成的区块添加到区块链上,并广播至其他节点进行验证;
更新验证模块,在区块链上部署智能合约,在部署的智能合约中设置档案更新规则;计算更新操作的异常分值,当异常分值超过阈值时触发哈希警报,通过智能合约阻断异常操作;
数据管理模块,在对原始档案数据进行修改时,采用版本控制系统git记录每次修改的差异内容,执行数据调整后,更新原始档案数据库中对应档案的元数据,生成新的区块添加到区块链中。
2.根据权利要求1所述的基于区块链的数字档案系统,其特征在于:数据采集模块,包括:
档案数字化单元,采集档案数据,并对采集的档案数据进行预处理,得到标准化的数字化档案数据;
档案上链单元,将标准化的数字化档案数据上传到IPFS分布式存储网络,通过IPFS协议得到档案数据在IPFS网络中的IPFS哈希值;
元数据提取单元,从标准化的数字化档案数据中提取档案数据的元数据;
原始档案数据库,根据提取的元数据建立结构化的档案目录和索引,记录每个档案数据的IPFS哈希值、创建时间和创建者。
3.根据权利要求2所述的基于区块链的数字档案系统,其特征在于:档案上链单元,将标准化的数字化档案数据上传到IPFS分布式存储网络,包括:将标准化的数字化档案数据切分为数据块;
对每个数据块进行SHA-256哈希计算,得到数据块的哈希值;
将数据块与对应的哈希值进行组合,生成IPFS节点对象,并通过IPFS协议将IPFS节点对象上传到IPFS网络;其中,IPFS节点对象表示IPFS网络中的一个数据节点;
采用基于Merkle dag的数据结构对IPFS节点对象进行关联,生成IPFS对象,IPFS对象由所有IPFS节点对象组成,并输出IPFS对象的根节点哈希值;
将IPFS对象的根节点哈希值作为档案数据在IPFS网络中的IPFS哈希值。
4.根据权利要求3所述的基于区块链的数字档案系统,其特征在于:区块构建模块,包括:
档案哈希计算单元,获取每个档案数据对应的IPFS哈希值;对IPFS哈希值进行SHA-256哈希计算,得到档案哈希值,作为档案数据的唯一指纹特征;
关联模式挖掘单元,采用基于图神经网络的机器学习算法对档案哈希值进行特征提取和相似性度量,通过聚类分析获取档案间的关联模式,将具有相同档案主题的关联模式的档案哈希值归为同一个集合,生成多个档案哈希值集合;
哈希区块生成单元,根据每个档案哈希值集合包含的档案间的关联模式,构建对应的哈希区块,将档案哈希值集合中的所有档案哈希值添加到对应的哈希区块中;
Merkle树构建单元,根据哈希区块中包含的所有档案哈希值构建Merkle树,计算Merkle树的根哈希值。
5.根据权利要求4所述的基于区块链的数字档案系统,其特征在于:关联模式挖掘单元,包括:
图构建子单元,将档案哈希值作为图的节点;根据原始档案数据库中记录的档案数据的元数据计算节点间的共现频率,将共现频率作为节点间边的权重,构建一个无向加权图;
图嵌入子单元,采用图卷积神经网络对无向加权图中节点的特征向量进行更新和传播,通过聚合节点的邻域信息获取档案哈希值的低维表示向量;并采用注意力机制获取不同邻域的节点分配权重;
社区发现子单元,在低维表示向量空间中通过k-means聚类算法对档案哈希值进行聚类,得到档案哈希值的社区结构;根据社区结构获取档案数据间的关联模式;
输出子单元,输出包含关联模式的档案哈希值集合,每个集合对应一个主题社区。
6.根据权利要求5所述的基于区块链的数字档案系统,其特征在于:采用注意力机制获取不同邻域的节点分配权重,包括:
对于无向加权图中的每个中心节点,计算中心节点与邻域节点的特征向量之间的余弦相似度;
通过softmax函数对计算得到的余弦相似度进行归一化,得到每个邻域节点对应的注意力权重;
将各邻域节点的特征向量与对应的注意力权重相乘,得到加权后的邻域特征向量;将加权后的邻域特征向量相加,得到聚合后的邻域特征向量;
将中心节点特征向量和聚合后的邻域特征向量进行拼接,形成拼接特征向量;
将拼接特征向量通过全连接神经网络进行非线性变化,得到节点特征向量,作为对应档案哈希值的低维表示向量。
7.根据权利要求6所述的基于区块链的数字档案系统,其特征在于:哈希区块生成单元,包括:
主题子单元,将档案哈希值集合中的主题社区,将同一主题社区的档案哈希值合并到一个哈希区块中;
容量策略子单元,以当前区块链网络状态指标作为环境状态,以调整后的区块容量大小作为动作,通过策略梯度方法获取最优的区块容量调整策略;其中,状态指标包含区块链的交易吞吐量;
区块生成子单元,根据最优的区块容量调整策略调整哈希区块的大小;当一个哈希区块中的档案哈希值数量达到容量上限时,通过区块链共识机制生成新区块,并将当前哈希区块添加到新区块中。
8.根据权利要求7所述的基于区块链的数字档案系统,其特征在于:Merkle树构建单元,包括:
Merkle树生成子单元,将哈希区块中的所有档案哈希值按照二叉树的结构进行组织;对位于Merkle树最底层的档案哈希值进行两两配对,计算每一对哈希值的SHA-256哈希值,作为对应的父节点哈希值;递归地对父节点哈希值进行配对和哈希计算,直到生成一个根哈希值,形成一个自底向上构建的Merkle树;
均衡子单元,采用基于红黑树的旋转算法调整Merkle树结构;
区块头哈希子单元,将调整后的Merkle树的根哈希值与哈希区块的元数据进行组合,作为对应哈希区块的区块头哈希。
9.根据权利要求1至8任一所述的基于区块链的数字档案系统,其特征在于:更新验证模块,包括:
异常分值计算单元,用于计算更新操作的异常分值,包含:
权限异常计算子单元,获取更新操作请求中的发起账户信息;获取发起账户的权限等级,计算获取的权限等级与预设的最低权限等级之间的差值,将计算得到的差值与预设的权限等级阈值进行比较,得到权限异常分值;
内容异常计算子单元,获取更新操作请求中的修改内容以及对应的原始内容;采用自然语言处理算法计算修改内容与原始内容之间的编辑距离,得到内容异常分值;
时间异常计算子单元,获取更新操作请求的时间戳,判断时间戳是否位于预设的正常工作时间区间内,如果是则时间异常分值为0;否则计算时间戳与预设的正常工作时间区间边界的偏离程度,得到时间异常分值;
异常分值计算子单元,采用加权平均法对权限异常分值、内容异常分值和时间异常分值进行加权求和,得到异常分值。
10.根据权利要求9所述的基于区块链的数字档案系统,其特征在于:更新验证模块,还包括:
警报触发单元,将更新操作的异常分值与智能合约中预设的异常阈值进行比对,当异常分值超过异常阈值时,将对应的更新操作标记为可疑,生成哈希警报;
警报广播单元,将标记后的更新操作以事件的形式广播至区块链网络中的其他节点,同时将哈希警报和对应的更新操作的相关信息写入区块链,相关信息包含操作发起账户地址、操作时间戳和操作内容哈希值;
阻断单元,调用智能合约中的函数对标记后的更新操作进行阻断;其中,阻断包含:对标记后的更新操作的更新请求返回拒绝执行的错误代码,终止更新操作的执行;将标记后的更新操作的发起账户地址添加到智能合约的临时黑名单中,在预设的封禁时间内拒绝对应账户地址发起的所有更新请求;
共识验证单元,接收其他节点对标记后的更新操作的异常检测结果,统计节点投票,当认定为异常操作的节点数量达到预设的共识阈值时,将标记后的更新操作确认为异常操作;
黑名单记录单元,将确认的异常操作写入智能合约的黑名单进行监控。