前段时间,有用户咨询过配合力试验数据缺区怎么处理的问题,在此简单梳理一下思路,备忘。
上图中是一个NCⅡ配合力试验,父本5个,母本4个,区组3个,每区组1个观测值。A1B1组合在区组3的观测值缺失1个。
缺区估计法、平均值填入法,都是“补齐”数据的策略,由于对后续数据分析有影响,因此不建议采用。
线性混合模型用于配合力缺区分析,本质上跟本文给出的方法是一样的,但是,由于矩阵求逆等计算的中间误差或者迭代误差,计算结果准确性会略差,甚至方程组无解。往白里说就是,一些平均数可以直接计算得出,而不是非要去解线性方程组,结果可能反而算不出来了。
下面是针对方差分析缺区情况博思公司给出的应对参考建议,对配合力试验缺区情况同样适用(配合力试验也需要进行方差分析)。
博思公司提出的方差分析缺区情况应对参考建议
1、缺区,并没有影响试验材料的客观试验表现,需要进行相应的平方和和自由度计算调整。
2、缺几个自由度就减几个,平方和采用累加的思路,缺了就不加,跟未缺区的时候一样分析,试验分析参数进行对应调整。
3、如果缺区导致试验中某效应的平均数无法计算,那就不能进行方差分析,这可以作为缺区情况下是否能够进行方差分析的一个判断依据。
4、F分布要求遵循正态分布,个别数据缺失,可以理解为对分布没有影响。如果数据缺失严重,就不要进行方差分析,F测验了,直接进行品种平均数大小排序即可。
5、如果考虑采用缺区估计方式填值处理,应在试验数据缺区未影响到效应的平均数计算的情况下进行,否则不宜采用估计方式。
6、后续进行的多重比较,采用试验中真实获得的品种平均数。
数据具体分析:
缺失的数据,对如下平均数的计算有影响。
- 总平均
- A1B1的平均数
- A1的平均数
- B1的平均数
- 区组3的平均数
所以在计算这5个平均数的时候进行调整即可。就是分母多减去1.
线性混合模型构建计算矩阵,采用0和1来标注是否有观测值。所以其对缺区的处理道理是一样的。
图中给出的计算结果,
A1B1的平均数是30=(31+29)÷2
A1B2的平均数是26=(27+25+26)÷3
专业的育种信息化研发团队,提供给客户的不仅是产品,更有强大而专业的技术服务保障。如你在育种数据分析、育种标签打印方面有困惑,或有育种数据管理、育种标签需求,欢迎联系我们。
免责声明
- 凡本网注明“来源:化工仪器网”的所有作品,均为浙江兴旺宝明通网络有限公司-化工仪器网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:化工仪器网”。违反上述声明者,本网将追究其相关法律责任。
- 本网转载并注明自其他来源(非化工仪器网)的作品,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。
- 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。