本站应用实例三:
统计技术在塑料包装行业中的应用
内容提要:本文以实例简要介绍了属于塑料包装行业的我厂应用部分数理统计技术的方法和效果。
关键词:统计技术 应用 实例
1 前言:
我厂是中石化总公司所属大化肥的塑料编织袋分厂,年产塑料编织袋1600万条以上,主要生产设备如拉丝机,圆织机等系从日本进口,具有较强的生产能力和成熟的生产技术。
当前许多企业正努力试图通过ISO9000系列标准的质量认证,以提高内部管理水平,拓展国内外销售市场。但“4.20 统计技术”往往成为一大难点。数理统计方法理解起来较为抽象,计算极为繁琐,若非经常使用其方法还很容易遗忘,似乎只能掌握在少数专业人员手中。我分厂采用编制计算机程序简化计算,根据实际情况采用不同数理统计方法,从而取得了一定效果。以实例简介如下:
2 数理统计方法实例:
2. 1 多元回归分析:
众所周知,拉丝机螺杆挤出量取决于螺杆转速,与主电机电流和机头压力关系不大,但实际是否确实如此则有待证明,且具体的关系式对指导生产有极为重用的作用。利用多元回归分析法则可刚好解决此问题。
1998年我厂1#拉丝机进行了螺杆国产化改造和模具更换,为查明螺杆挤出量的变化,作实验并整理数据如下表:
表一:1#拉丝机实测数据表
|
序
号 |
螺杆转速 (r/min) (X1) |
主电机 电流(A) (X2) |
机头压力 (0.1Mpa) (X3) |
挤出量 (kg/min) (Y) |
试验条件 |
|
1 |
30 |
93 |
85 |
1.50 |
模头温度: D1-D5:265℃ 机身温度: C1:200;C2:235C3:245;C4:255C5:265℃ 机头温度: H:265℃ |
|
2 |
35 |
95 |
90 |
1.75 |
|
|
3 |
40 |
102 |
95 |
2.03 |
|
|
4 |
45 |
110 |
100 |
2.28 |
|
|
5 |
50 |
113 |
105 |
2.49 |
|
|
6 |
55 |
118 |
110 |
2.76 |
|
|
7 |
60 |
121 |
112 |
2.96 |
试验时间:1998年9月8日
根据表中数据可计算出单相关系数和偏相关系数如下表:
表二:各变量之间的单相关系数表
|
变 量 |
X1 X2 |
X1 X3 |
X2 X3 |
X1 Y |
X2 Y |
X3 Y |
|
R 值 |
0.9927 |
0.9953 |
0.9955 |
0.9991 |
0.9949 |
0.9974 |
表二:各变量之间的偏相关系数表
|
变 量 |
X1 X2 |
X1 X3 |
X2 X3 |
X1 Y |
X2 Y |
X3 Y |
|
R 值 |
-0.1327 |
-0.2758 |
0.3844 |
0.9051 |
0.2408 |
0.5483 |
查表得显著性水平为0.05时,相关系数临界值R0=0.7067,由表可知单相关系数均大于临界值,说明三个自变量两两之间均有显著的相互作用,而偏相关系数只有X1与Y之间大于临界值,也就是说剔除自变量之间的相互影响,只有X1与Y之间有显著相关关系。
通过计算可得到三元回归方程(式一):
Y=-0.9739+0.0324X1+0.0040X2+0.0135X3
并可进行进一步的分析和计算,得出以下结果:
剩余平方和Q=0.0012;
回归系数R=0.9996 ;回归系数临界值R0=0.9750;
X1是对Y影响最大的因素 且不可忽略;而X2和X3则可忽略;
进行方差分析可知应首先忽略X2,并得到忽略X2后的二元回归方程(式二):
Y=-0.9049+0.0331X1+0.0168X3
同样可进行以上计算和分析,可知X3可也可以忽略,得到一元回归方程(式三):
Y=0.0620+0.0487X1
继续进行同样的计算和分析,相关系数检验结果为在显著性水平为0.01下显著相关,方差分析也有同样的结果。也就是说三元回归最终变成了一元线性回归,因相关程度极大,可采用此方程进行生产上的挤出量预报和螺杆转速控制。
由以上回归过程可知影响Y(挤出量)的因素中只有X1(螺杆转速)有显著影响,而X 2(主电机电流)影响最小,X3(机头压力)则介于二者之间,这与挤出理论是相符合的。
另外:一元回归分析的实例请参照本人发表于《塑料包装》1997年第四期《运用回归分析法探讨扁丝拉断力与纤度的关系》一文。
2.2 假设检验:
2.2.1 异常数据判断:
依据GB8946-88《塑料编织袋》,扁丝线密度偏差可达15%,如此大的偏差范围导致判断是否有异常数据时难以下结论,若采用数理统计方法则较为容易,例如本分厂3月31日1#拉丝机扁丝纤度(单位为旦尼尔)数据如下:
1042 859 836 895 843 933 875 846 831 878
根据GB4883-85《数据的统计处理和解释 正态样本异常
值的判断和处理》中所列举的方法(如格拉布斯检验法,狄克逊检验法等)均可得出相同结论:最大值1042为异常数据,并可作剔除处理。以格拉布斯检验法为例,先计算出这10个数据的平均值为883.8 ;样本标准偏差为63.6;从而可得该检验法用统计量Gn=2.485;对于给定的显著性水平α=0.05查表得临界值G1-α=2.176,因Gn>G1-α,可知最大值1042为高度异常数据,可进行剔除处理,剔除后平均值为866.2d;样本标准差为32.9d,进一步的检验可知再也没有异常数据。同样可判断最小值831不是异常数据。
2.2.2 随机性检验(游程检验):
把大于平均值866.2数据计为A,小于866.2的数据计为B,可得BBABAABBA,A个数n1=4;B个数n2=5;游程(连续相同的字母计为1个游程)r0=6,查表得显著性水平α=0.05的游程临界值rl,α=2,ru,α=9,因rl,α<r0<ru,α且rl,α和ru,α≠0,故这9个数据是随即抽样所得。
2.2.3 正态性检验:
数据是否符合正态分布对于许多数理统计方法来说是一个先决条件,一般正态性检验采用χ2检验法,但这种方法计算复杂,需要的样本数量一般要求>50,显然这9个纤度样本是无法进行χ2检验的。
依据GB4882-85《数据的统计处理和解释 正态性检验》,9个样本可采用W检验,柯-斯Dn检验,偏度检验,偏度和峰度联合检验等方法,以W检验为例,先计算出平均值和方差,然后可计算出统计量W=0.9120,对于n=9,α=0.05,查W检验的p分位数表得Zα(W)=0.8290,因W> Zα(W),可认为数据服从正态分布。同样采用其它检验方法也得到相同结论。
2.2.4 平均值和样本方差的置信区间估计:
计算出的平均值和样本标准差究竟能不能代表实际的平均值和样本标准差也只有采用数理统计方法来确定。
同样先计算出平均值和样本标准差(S),对于显著性水平α=0.05查自由度为8的t分布分位数表,得tα/2(8)=2.3060,计算出tα(8)×S/√10= 25.29,从而可得置信度=95%的平均值置信区间为840.94~891.51 。
查自由度为8的χ2分位数表得χ2(α/2,8)=17.535, χ2(1-α/2,8)=2.180,可得置信度=95%的方差置信区间为493.7-3971.4。
2.3 有关统计量的计算和应用:
常用的统计量有平均值,标准偏差,极差等。但实际上只计算这些统计量是远远不够的,根据这9个数据可计算出以下统计量:
有量纲统计量:
极大值=933; 极小值=831; 极差R=102d;
平均值=866.2 ; 总和=7796;平方和=6761762;
中位数=859; 偏差平方和=8657.6
样本方差=1082.2; 样本标准差=32.9;
无量纲统计量:
变异系数=0.038(样本标准差与平均值之比,度量离散程度);
偏度系数=0.7224(偏度系数>0说明正态峰向左偏);
峰度系数=2.2229(峰度系数<3说明正态峰为扁平峰);
这些统计量对掌握生产情况和分析质量数据是非常有用的。