3.1 玉米籽粒水分检测的研究现状
对于玉米果穗籽粒水分的原位测量研究可以追溯到 Kang 等人提出一种将手持模拟欧姆表与两个电极相结合的电探针装置。通过将两个探针电极插入玉米棒,直接穿过玉米苞叶和玉米粒,测量玉米果穗水分。Freppon 等人随后开发了一种数字式针式谷物水分分析仪,用于检测田间玉米的水分含量。自此,已经有关于利用针式谷物水分分析仪根据玉米果穗的电学和介电特性快速测量玉米穗水分的报道。Reid 等人对型号为 MT808 的
Electro physics 水分仪进行了改进,用两个钢针穿过果穗苞叶和籽粒来测量水分含量,证明改良后的
MT808 可用于玉米穗和籽粒水分的测定,仪表读数和籽粒水分高度相关,并且校准曲线可用于预测烘干的谷粒水分。而
Andrei 采用了和向葵等人类似的方法,采用可靠、大规模、快速、无损的 Volt craft FM-200 木材水分探针式湿度计,对不同阶段的玉米大量连续测量,完成大田玉米单株的谷物水分玉米育种计划。S. Li 以鲜玉米为研究对象,研究了一种基于驻波比原理的玉米含水量快速测量方法,证明了利用驻波比法快速检测玉米含水量的方法是可行的。P. Zhao采用四电极法和 Agilent E4980A 精密 LCR 仪,获得了不同水分含量的甜玉米穗和糯玉米穗的电阻抗谱,证明生物电阻抗光谱法可用于检测玉米穗的水分含量。Zhang 等使用环形电极测量了两个品种的玉米水分,该方法具有从 12.59% 到36.5% 的宽湿度测量范围,快速传感时间小于 1 s。Li Y等在Zhang等研究基础上,使用(电阻抗断层扫描)EIT 技术,通过构建的弹性电极阵列,实现检测玉米穗成熟时原位水分的 3D 分布和变化情况。目前更多研究人员将目光放在近红外光线检测玉米籽粒水分研究领域,该方法检测更加简便,只需扒开苞叶将仪器置于玉米籽粒表面,通过不同水分玉米籽粒所表现的不同光谱即可得出玉米籽粒水分。
3.2 通用模型国内外研究现状
构建一个稳定可靠的校正模型是一项复杂的工作, 需要耗费大量时间和人力物力, 若能建立通用性模型, 则能节约大量的资源。彭丹等创建了大豆油、菜籽油、一级油、三级油四种样本的通用模型。Li等建立三种甜瓜赤道、花萼两个部位的通用模型。王燕妮等建立了8种饲料原料的独立定量模型和针对所有样品的通用近红外光谱定量分析模型。Szulc J等运用近红外光谱仪采集了五种蔬菜种子的近红外光谱, 使用PLS法建立了五种蔬菜种子的水分含量的通用预测模型。
国外利用模型传递方法实现模型的通用已经有大量研究。Osboren等运用斜率/偏差算法(Slope/bias algorithm,
S/B)建立了主机与从机仪器数学函数关系,实现了模型通用的效果。同时,将此算法应用于白面粉的蛋白质含量无损检测中,展现出了良好的校正效果。Shenk等提出了一种名为Shenk’s的模型传递算法,通过这种算法,一台主机仪器上建立的主机模型能够对六台从机仪器所采集的数据进行有效预测,实现了在不同傅里叶变换近红外光谱仪之间的模型通用。Wang等提出直接校正算法(Direct Standardization,
DS),该方法通过两个数据集之间的矩阵运算来减小光谱之间的差异,从而实现模型的通用。Sulud等提出一种新的模型传递方法,分段直接标准化算法(Piecewise Direct
Standardization, PDS),该方法通过在目标仪器的光谱中设定窗口限制,并选取窗口内的特定光谱波长点,将其近似于主仪器的光谱。这种局部校正的方式取代了DS中的全光谱校正方法,这种新方法取得了更为出色的效果。Payal等[34]利用一台光谱仪器和数条光纤,成功地从不同的生物反应器中采集到了葡萄糖和乳酸的光谱信号。他们进一步构建了一个复合模型,该模型能够实现不同模型间的通用性,从而提高了应用的灵活性和效率。Wei等]提出在对标样集光谱进行分解时,运用经典相关分析法(Canonical Correlation
Analysis, CCA),计算不同光谱的转换矩阵,以更有效地实现模型传递。Tao等用TCA方法研究不同地区土壤重金属污染预测模型的可迁移性,基于TCA转移后R2提高了63%,在一定程度上实现北方的平原和保定地区土壤模型的通用。Robert等将分段正交信号校正算法应用于两台仪器上光谱数据校正,相较于频率校准算法对比分析,经过此算法处理后的数据在建模分析中表现出更优越的模型预测效果,并且成功实现了模型间的传递。Qiu等采用TCA结合支持向量机(Support Vector Machine,
SVM)对土壤污染等级进行分类,在三种不同地方的土壤样本中,每组交叉选择两种分别作为源域和目标域,根据污染程度与污染物的不同,构建18组不同的模型转移任务,通用模型的预测精度平均提升了76%。Chen等提出了一种极端学习机自动编码器传输方法(Transfer via Extreme
learning machine Auto-encoder Method, TEAM),并在玉米、烟草和药片三个光谱数据集的近红外模型传递过程中,实验结果显示,相较于PDS、CCA和GLS,TEAM方法能够显著降低预测模型的均方根误差。
在国内,诸多学者也对近红外光谱的模型共享展开了相关研究。袭辰辰等采用PDS算法对阿莫西林胶囊及其内容物的光谱进行了校正研究。实验结果显示,经过校正后的光谱能够准确地预测阿莫西林的含量,且预测误差控制在5%以内。郑文瑞等基于TCA算法将皖南土壤速效磷预测模型迁移至皖北模型的R2由-019提升至079,RMSEP从104降低至044,在一定程度上实现皖南土壤模型和皖北的模型通用。温晓燕等基于PDS算法对两台不同仪器获取的甲醇汽油中甲醇光谱数据进行校正,实现了为甲醇汽油品质快速分析的模型转移方法。李倩倩等将S/B与PLSR结合预测模型,对三种猕猴桃的可溶性固体含量(Soluble Solid Content,
SSC)进行检测。研究表明,能够更有效地预测其他品种猕猴桃的SSC。
3.3 波长筛选国内外研究现状
Wang等在其研究中采纳了(Screening Wavelengths
with Consistent and Stable Signals, SWCSS)和无信息变量消除(Uninformative Variable
3limination, UVE)组合算法,通过这种算法,他们达成了在三种不同的光谱仪器间共享对综纤维素和木质素含量的近红外分析模型。这一创新方法不仅提升了分析的准确性,同时也优化了跨仪器分析的流程。采用UVE算法进行波长筛选,减小SWCSS方法无法去除的无关变量,提高模型传递精度,联用方法的模型传递结果优于单一使用SWCSS算法的转移结果。Li等采用傅立叶变换近红外光谱技术结合VPCA与IRIV,建立鲑鱼片新鲜度预测模型。结果表明该方法在各温度下的预测效果最好,决定系数最高为09998。Dai等利用VCPA-IRIV算法组合提取花色苷高光谱图像特征,建立的支持向量机模型测试集准确率超过092。LZhang等通过融合SWCSS算法与UVE、投影变量重要性分析以及选择比算法,对光谱数据的波长进行二次筛选,提取其关键特征,以实现模型的有效转移。Zheng等基于开发了双竞争性自适应加权采样(Double Competitive
Adaptive Reweighted Sampling, DCARS)算法用于近红外光谱仪的模型传递,与CARS算法相比,double CARS可选出偏差较小的波段,且适用于不同波长点数的光谱变量选择。Li等运用MC-UVE和MC-UVE-SPA联用对甜瓜光谱的变量进行筛选后,建立具的通用定量模型,经历了变量筛选后的建立的模型仍可满足需求。
褚小立等使用普鲁克分析(Procrustes Analysis, PA)统计学方法在5台国产CCD近红外光谱仪上进行了实验,解决了多元校正中的模型传递问题。张晓羽等提出了稳定性竞争性自适应加权采样算法,用于波长点选择,成功实现了玉米模型的转移。徐琢频等基于CCA的波长选择方法,保留具有良好模型转移结果的波长,实现模型转移。洪士军等利用一维尺度不变特征变换方法筛选近红外光谱的关键点,筛选出的波长点保留了光谱的主要特征,模型直接转移到3台从机,实现了模型传递。黄雯等在对比差异光谱的标准偏差和高精度测试光谱的标准偏差,发现利用筛选出来的波长进行建立的模型具有更好的稳健性和适应性。王其滨等融合了随机森林(Random Forest, RF)算法与直接正交信号校正算法。采用RF算法对玉米的近红外光谱数据进行波长筛选,之后使用直接正交信号校正技术对筛选后的光谱进行校正,从而推导出模型传递矩阵。该方法不仅能够高效地去除光谱噪声,而且可以显著缩小主仪器与从仪器光谱间的差异,进而大幅度提高模型的稳定性和预测精度。束茹欣等提出的基于尺度不变特征变换算法的多步波长筛选方法可实现烟叶还原糖的近红外光谱模型在6台从机上的模型传递。赵政等以测定不同种类的猪肉挥发性盐基氮含量为出发点,提出了基于回归系数的波长筛选方法,并通过实验证明该方法展现出了相对稳定的传递效果。孙海霞等利用回归系数对壶瓶枣光谱数据进行特征提取,结合差值补正、融合变量优选结合差值补正、共性变量优选结合波长补正算法进行模型传递,说明了波长选择对模型传递具有重要意义。路皓翔等针对近红外光谱分析技术中模型通用性较差的问题,提出了最小角回归与一元线性直接校正法相结合,有效消除了主-从仪器光谱之间存在的差异,而且能够提高PLSR定量模型的准确性和稳定性,具有广泛的应用潜力。
综上所述,当前研究表明,国内外学者对于玉米水分检测和通用模型的建立进行了大量的实验研究,他们通过优化建模方法、改进数据处理算法、提高仪器性能等方式,提高了模型的预测能力,在多个领域中均取得了显著的应用成果,但仍存在以下几点不足:
(1)国内外学者针对玉米果穗水分检测和籽粒水分的测定进行了深入研究,缺少对玉米果穗籽粒水分的在线、原位实时检测方法研究。玉米在生长过程中,灌浆期需要持续近
40 天,该时期玉米籽粒水分变化的在线、原位实时获取,对于研究优化玉米品种脱水性状至关重要。
(2)现有的模型传递算法在进行光谱校正的过程中,仍存在一些问题。如:DS在面对复杂数据时,由于光谱数据本身包含大量的信息,DS难以准确地捕捉到这些复杂的光谱特征,其校正后的模型通用性和适应性会受到限制;DS、PDS、S/B校正算法对于跨仪器设备的特征波长点选择困难,通常这些算法是基于线性或简单的数学变换来进行校正。然而,实际的光谱数据往往呈现出非线性和复杂的变化规律,这使得简单的校正算法难以准确地描述和提取出关键的特征波长点,无法找到数据之间的共享成分,从而导致校正效果不佳。
(3)在进行波长筛选时,波长筛选算法虽然可以在一定程度上减少变量之间的多重线性关系,但筛选出的光谱间关键波长点间仍存在一定差异,导致模型的不稳定性和预测准确性的下降。因此,仅仅依靠特征波长的提取,而不进行相应的光谱校正或数据预处理,是不足以实现模型在不同场景或设备间的共享和通用的。这是因为未经校正的模型在新的环境或设备中可能会因为光谱数据的微小变化而产生显著的预测偏差,从而限制了模型的广泛应用和可靠性。为了解决这一问题,不仅需要选择合适的波长筛选方法,还需要结合其他数据处理技术,如光谱校正、归一化等,以提高模型的稳定性和预测准确性,进而实现模型的共享和通用。
因此,本项目利用近红外光谱技术,实现在不影响玉米生长状态情况下,在线、原位检测玉米灌浆期期的水分变化,对生理研究等相关科研人员培育脱水快的品种有重要意义。