1.一种直拉硅单晶提拉速度‑晶体直径辨识模型建模方法,其特征在于,具体按照以下步骤实施:步骤1、多次采样,记录直拉硅单晶在不同采样时刻k下的提拉速度和晶体直径,将直拉硅单晶在同一采样时刻下的提拉速度和晶体直径作为一组数据对,形成不同采样时刻k下的多组数据对:[x(1),y(1),...,x(k),y(k)],k=(1,2,3,...,n);
步骤2、建立关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统,利用经步骤1采样得到的多组数据对构建利普希茨商,再通过利普希茨商确定该离散时间非线性系统的输入和输出阶次,确定得到具体的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式;
步骤3、利用经步骤2得到的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式对DBN网络进行训练;
步骤4、将训练好的DBN网络作为直拉硅单晶提拉速度‑晶体直径辨识模型,即训练好的DBN网络的权值和阈值作为关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型的模型参数。
2.根据权利要求1所述的一种直拉硅单晶提拉速度‑晶体直径辨识模型建模方法,其特征在于,所述步骤2具体按照以下步骤实施:步骤2.1、利用NARMA模型建立关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型如式(1)所示:y(k)=f[X(k)] (1)式中,X(k)=[y(k‑1),...,y(k‑ny),x(k),...,x(k‑nu)];x(k),...,x(k‑nu)为直拉硅单晶在不同采样时刻下的提拉速度;y(k‑1),...,y(k‑ny)为直拉硅单晶在不同时刻下的晶体直径;k表示采样时刻;nu、ny分别表示该离散时间非线性系统的输入和输出阶次;
步骤2.2、描述直拉硅单晶提拉速度和晶体直径之间的非线性关系如式(2)所示:y=f(x)=f(x1,x2,…,xn) (2)式中,x1,x2,…,xn为经步骤1得到的直拉硅单晶在不同采样时刻k下的提拉速度,y为直拉硅单晶晶体直径,f(x)是其定义域内的连续函数并满足:式中,M是一个正数;
步骤2.3、构建关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统的利普希茨商表达式如式(4)所示,将经步骤1得到的多组数据对:[x(1),y(1),...,x(k),y(k)]代入式(4)中得到利普希茨商qij:式中,yi和yj表示不相同采样时刻下的晶体直径,|yi‑yj|代表点yi和yj在空间中的距离,xi和xj表示不相同采样时刻下的提拉速度,|xi‑xj|代表点xi和xj在空间中的距离;
步骤2.4、基于式(2)对直拉硅单晶的提拉速度和晶体直径进行敏感性分析得:δy=f1δx1+f2δx2+…+fnδxn (5)式中,δy=yn‑yn‑1,f1,f2,f3,...,fn是函数f(x)关于x的偏导数,结合式(4)和式(5)可得:
将式(5)代入式(6)得:
结合式(3)和式(7)可得:
式中, 表示输入变量x(k),k=n时,也即是输入变量x(k)个数为n时该非线性系统的利普希茨商;
步骤2.5、通过式(9)得到关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统不同输入和输出阶次下的利普希茨商(n)
式中,qij (k)由式(8)求得,k=1,2,3,...,p,p为正整数,取值范围为:0.01~0.02n,nu=ny=(1,2,...,8);
步骤2.6、根据式(9)得到的利普希茨商 观察nu分别取值1~8时,ny增大,利普希茨商 基本不变,则确定此时利普希茨商 对应的ny为最优ny,将该最优ny作为关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统的输出阶次;
步骤2.7、根据式(9)得到的利普希茨商 在步骤2.6确定最优的ny的基础上,固定ny,观察nu分别取值1~8时,取 计算 的值,并判断是否接近
1,当比值接近1时,此时nu为最优nu,将此最优nu作为关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统的输入阶次,其中 为和 输出阶次相同,输入阶次比大一阶次的利普希茨商;
步骤2.8、将经步骤2.6、步骤2.7确定得到的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统的输入阶次nu、输出阶次ny和经步骤1得到的[x(1),y(1),...,x(k),y(k)]代入式(1)中,确定得到具体的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式。
3.根据权利要求2所述的一种直拉硅单晶提拉速度‑晶体直径辨识模型建模方法,其特征在于,所述步骤3具体按照以下步骤实施:步骤3.1、确定DBN网络的训练周期,学习率η以及样本数量n,样本数量n为经步骤1获得的多组数据对的个数;
步骤3.2、初始化DBN网络层数N、权重wij、偏置量a,b,隐含层节点数,确定DBN网络层数的第N层为输出层,N=4;
步骤3.3、使用连续受限玻尔兹曼机模型作为DBN网络的第一层,将经步骤2得到的关于直拉硅单晶的提拉速度和晶体直径的离散时间非线性系统模型表达式中的X(k)作为连续受限玻尔兹曼机模型的可视层状态向量,并记作v;
步骤3.4、将经步骤3.2初始化得到的权重wij作为连续受限玻尔兹曼机模型可视层和隐1
层之间的连接权重,利用式(10)计算得到连续受限玻尔兹曼机模型的隐层特征向量h ,所述式(10)为:1
式中,h=(h1,h2,...,hj),v表示连续受限玻尔兹曼机模型的可视层状态向量,v=(v1,v2,...,vi),i表示连续受限玻尔兹曼机模型可视层中包含的神经元个数,bj为隐层的偏置,sigmoid为隐层的激活函数,j表示连续受限玻尔兹曼机模型隐层中包含的神经元个数;
步骤3.5、将经步骤3.2初始化得到的权重wij作为连续受限玻尔兹曼机模型可视层和隐1
层之间的连接权重,利用经步骤3.4得到的隐层特征h 结合式(11)重构DBN网络第一层得到连续受限玻尔兹曼机模型可视层的状态向量v',所述式(11)为:式中,i表示连续受限玻尔兹曼机模型可视层中包含的神经元个数,j表示连续受限玻尔兹曼机模型隐层中包含的神经元个数,ai为可视层的偏置,sigmoid为第一层的激活函数;
步骤3.6、利用式(12)‑(14)更新连续受限玻尔兹曼机模型权重wij以及偏置量a,b,所述式(12)‑(14)为:a=ai+(vi‑v′i) (13)b=bj+[p(hj|v)‑p(hj|v')] (14)1
步骤3.7、将经步骤3.4的隐层特征h看作为DBN网络的第二层连续受限玻尔兹曼机模型的可视层向量,重复步骤3.4至3.6,得到DBN网络的第二层连续受限玻尔兹曼机模型的隐层2
特征h并且完成网络权值和偏置的更新;
2
步骤3.8、将经步骤3.7得到的隐层特征h看作DBN网络的第三层连续受限玻尔兹曼机模型的可视层向量,重复步骤3.4至3.6,得到DBN网络的第三层连续受限玻尔兹曼机模型的隐
3 3
层特征h并且完成网络权值和偏置的更新,将h看作为DBN网络的第四层连续受限玻尔兹曼机模型的可视层向量;
步骤3.9、对DBN网络的第N‑2层到第N层采用ELM算法,已知DBN网络的第N‑2层到第N层的网络模型为式(15),所述式(15)如下:其中,βi是DBN网络第N‑1层和第N层之间的连接权重,wij是连续受限玻尔兹曼机模型可1
视层和隐层之间的连接权重也是第N‑2层和第N‑1层之间的连接权重,h 是上述步骤3.4中得到的连续受限玻尔兹曼机模型的隐层特征向量,ci为第N‑1层的偏置,tj为目标输出,g是激活函数;
将式(15)矩阵化表示为:
Hβ=T (16)
其中,H是DBN网络的第N‑1层隐层节点输出矩阵,T为期望输出,β是DBN网络的第N‑1层和第N层之间的连接权重,利用式(16)的极小二范数的最小二乘解位移确定权重矩阵+
式中,H是H的Moore‑Penrose广义逆矩阵;
步骤3.10、利用步骤3.9计算得到的 与H矩阵相乘,得到DBN网络的最终输出oj;
步骤3.11、利用式(18)判断DBN网络的最终输出误差e(k)是否达到设定阈值δ,所述式(18)为:若达到设定阈值δ则停止训练,若没有则继续增加DBN网络的网络层数,重复步骤3.3至步骤3.11直至DBN网络的最终输出误差达到设定阈值δ。