正交试验设计优化近红外检测牛乳中蛋白质的建模条件
正交试验设计优化近红外检测牛乳中蛋白质的建模条件正交试验设计优化近红外检测牛乳中蛋白质的建模条件彭 丹,刘亚丽,李林青,毕艳兰(河南工业大学粮油食品学院,河南 郑州 450001)摘 要:利用二维相关光谱技术对不同蛋白质含量的光谱数据进行分析,明确蛋白质吸收的灵敏光谱区域;分别考察检测波段、预处理方法和建模方法3 个因素对模型预测结果的影响,在此基础上通过正交试验设计优化乳蛋白近红外检测的建模条件,以避免各因素间的交互作用。结果表明,检测波段、预处理方法和建模方法均对蛋白质模型的预测结果有较大影响,经过分析可知因素主次顺序为建模方法>检测波段>预处理方法,其中标准正态变量变换和多元散射校正(multiplicative scatter correction,MSC)能够消除牛乳自身散射作用的干扰,线性的建模方法如主成分回归(principal component regression,PCR)、偏最小二乘法等明显优于非线性的支持向量机建模方法,优化后的建模条件为检测波段1 800~2 300 nm、预处理方法MSC、建模方法PCR,此时蛋白质模型的决定系数(R2)和预测均方根误差分别为0.993、0.106,为后期乳蛋白质含量快速检测设备的开发提供技术支持。关键词:牛乳;近红外光谱;正交试验设计;蛋白质蛋白质作为生命的物质基础,在生理功能调节中起着重要作用。牛乳是提供人体蛋白质的重要途径之一,已成为人们生活中的必需品。国家标准中明确规定了牛乳中蛋白质含量的最低要求,如《巴氏杀菌乳》《灭菌乳》中蛋白质含量不得低于2.9%。近年来,有关乳品中蛋白质含量不达标的事件时有发生,一些不法商贩向乳品中添加高氮物质如三聚氰胺等提高蛋白质含量牟取利益,严重影响乳品行业的发展和消费者的身体健康,引起了社会关注,也对质监部门和检验工作者提出了更高的要求,即寻找快速、准确检测乳品中蛋白质含量的方法。目前,常用的蛋白质检测方法有凯氏定氮法、紫外吸收法、电泳法、低场核磁共振法和近红外光谱法等。凯氏定氮法是通过测量总氮量计算得到蛋白质的含量,该方法测量准确,但操作复杂、费时长;紫外吸收法具有简便、灵敏等优点,但分析精度不高,干扰物质较多;近年来出现的电泳法、低场核磁共振法等检测准确、快速,然而这些方法还不够成熟。相比其他方法,近红外光谱法具有快速、无损、可在线检测等特点,已广泛应用于食品、农业、化工和制药领域中。近红外光谱技术属于间接分析方法,需要通过多元校正方法建立光谱信息与待测成分间的关联,由于仪器性能、外界环境、自身特性等因素影响,使得光谱数据中往往含有共线性、噪声及外界干扰信息等,导致建模结果误差较大甚至无法使用,故此需要优化条件。目前,在乳蛋白质检测中主要开展了3 个方面的研究:1)通过不同测量方式检测乳品中蛋白质含量,对于含有悬浮颗粒的液体,多采用漫透射或漫反射方式进行测量;2)选择不同特征波段开展蛋白质含量检测,如短波段(780~1 100 nm)、中波段(1 100~1 700 nm)和长波段(1 700~2 500 nm)等,以此剔除冗余信息,增强检测的针对性;3)确定蛋白质检测的最佳化学计量学方法,包括预处理方法和建模方法。由于牛乳介质中存在颗粒不均匀性,使其对近红外光谱有很强的散射作用,多采用正交信号校正、多元散射校正、求导等对光谱进行处理。在已有的建模条件研究中往往只考虑某一方面的优化,而实际问题中各因素完全独立的情况极为少见。因此,本实验针对各因素间存在相互作用影响的情况,在单一建模条件研究的基础上,运用正交试验设计对建模条件进行优化,建立一个准确度高、重复性好、适用于牛乳蛋白质含量分析的优化检测体系。1 材料与方法1.1 材料与试剂实验所用的牛乳均来自厂家直营店。为使蛋白质含量在较大范围内变化,采取添加蛋白粉的方式,并对样品进行均质操作以保证样品的均匀性和稳定性,共得到180 个样本。通过K-S方法选取135 个样本的光谱数据作为校正集,其余45 个样本的光谱数据作为验证集。1.2 仪器与设备XDS型近红外光谱仪 丹麦FOSS公司;ZS90粒度电位分析仪 英国Malvern公司;AH-Pilot高压均质机德国APV公司。1.3 方法1.3.1 蛋白质含量的测定式(7)中:为了保证所有的加权值总和为1,在计算Pj,k-1>δ时的权重时,将Pj,k-1=δ的概率值剔除,c为Pj,k-1=δ时,与模型对应的编号。 参考GB 5009.5ü2016《食品中蛋白质的测定》测定。1.3.2 近红外光谱检测采用XDS型近红外光谱仪对样品的吸收光谱进行测试,光谱采集范围780~2 500 nm,扫描次数32 次,分辨率2 nm,检测器为硅(780~1 100 nm)和硫化铅(1 100~2 500 nm)。“叶下洞庭初,思君万里余。露浓香被冷,月落锦屏虚。欲奏江南曲,贪封蓟北书。书中无别意,惟怅久离居。”男人在燕北的冰原抛洒热血,女人在温柔乡里孤单终老,这是她名闻天下的祖姑婆写的诗,在教坊里谱成曲子,在长安的时候,谁没听过呢? 1.3.3 光谱数据处理以蛋白质含量为外部微扰,进行二维相关同步谱和自相关谱解析,寻找与蛋白质含量相关的敏感波段。具体过程:1)依据蛋白质含量的真实值,从小到大顺序均匀选取10 个代表性样品用于一维近红外牛乳光谱的测量;2)采用正交信号校正对测得的光谱进行预处理,消除与被测成分无关的光谱信息;3)根据二维相关光谱理论,对处理后的一维光谱进行分析、计算,获得其二维相关同步谱及自相关谱;4)通过解析二维相关同步谱和自相关谱,确定与蛋白质含量相关的最佳光谱波段。上述二维相关光谱计算过程利用Matlab R2018a软件完成。利用CAMO公司的Unscrambler 10.5软件对光谱进行预处理,分别建立多元线性回归(multiple linear regression,MLR)、主成分回归(principal component regression,PCR)、偏最小二乘(partial least squares,PLS)法和支持向量机(support vector regression,SVR)校正模型,模型性能通过决定系数(R2)、校正均方根误差(root mean square error of calibration,RMSEC)和预测均方根误差(root mean square error of prediction,RMSEP)评价。1.3.4 正交试验设计在单因素试验的基础上,选取检测波段、预处理方法和建模方法为考察因素,以目标函数F为评价指标,http://rtt.5read.com/pdgpath/format?f=ba5bc3a84dc004baa2c1abd2ff3e7c4f/40f009294c531d9f2bb7e3c6d8d6adf4.jpg采用L16(45)正交表进行试验设计,确定蛋白质含量最佳的建模条件。骨折创伤患者发现血红蛋白持续降低,排除其他部位损伤,且不能用其他原因解释者,尚未出现明显脂肪栓塞综合征的主要诊断指标,要警惕脂肪栓塞综合征,可能其为亚临床阶段(该时段可能非常短暂),需密切观察,及时处置。朱悦等认为血红蛋白减少可作为早期诊断指标[6]。本例患者也因不明原因的血红蛋白持续降低,早期怀疑脂肪栓塞综合征发生的可能。 由国际商务专业毕业班组建的武汉自贸城班,其培养计划和教学内容、师资队伍大多是学校在原有的基础上制定的,企业并没有根据自身需求进行研究和调整。合作的关系主要依靠人脉和信誉,合作的内容局限在双方共建基地、顶岗实习等,很难做到将生产环节引入学校,或者在企业中实施教学。从合作教育整体来看,校企合作不够深入,关系不够稳定,一旦领导层有变动,就会造成合作关系的中断,学校和企业之间没有形成真正的依赖关系。合作的形式停留在表面,在实质上缺乏突破。 表1 正交试验因素与水平Table 1 Code and level of independent variables used for orthogonal array designhttp://rtt.5read.com/pdgpath/format?f=ba5bc3a84dc004baa2c1abd2ff3e7c4f/a466f59506520f4dbdf774fdb8621f18.jpg&q=30 水平 因素A检测波段/nm B预处理方法 C建模方法1 1 400~1 800 无 PCR 2 1 800~2 300 矢量归一化 MLR 3 780~1 400,2 300~2 500 MSC SVR 4 780~2 500 SNV PLS
1.4 数据统计采用Matlab R2018a、Origin 9.0软件和Excel 2016软件进行数据统计和图表绘制,利用SPSS 22.0软件对数据进行方差分析。2 结果与分析2.1 牛乳近红外光谱及二维相关分析http://rtt.5read.com/pdgpath/format?f=ba5bc3a84dc004baa2c1abd2ff3e7c4f/bdb205b48f96b467ba3a19de09c49ceb.jpg&p=682x320&q=30 图1 牛乳的近红外光谱图
Fig. 1 NIR spectra of milk samples
如图1所示,脂肪、蛋白质和乳糖等成分近红外吸收分布于整个光谱区域,且相互重叠。在1 460、1 974 nm波长附近有2 个主要吸收峰,分别为牛乳中水、蛋白质、脂肪和乳糖等成分的结构和组成信息。其中,1 460 nm波长处与—OH、—NH2等基团的倍频吸收有关,1 974 nm波长处为水的吸收信息。为确定蛋白质的主要吸收位置,以蛋白质含量为外扰,对牛乳近红外光谱进行同步二维相关分析,结果如图2所示。http://rtt.5read.com/pdgpath/format?f=ba5bc3a84dc004baa2c1abd2ff3e7c4f/5b280fb27e741e50ee013e99d0f97cdc.jpg&p=646x330&q=30
http://rtt.5read.com/pdgpath/format?f=ba5bc3a84dc004baa2c1abd2ff3e7c4f/4d5c0ae74bcb073bd1da6be1f6b6919f.jpg&p=548x308&q=30 图2 牛乳二维近红外光谱相关同步谱(a)和自相关谱(b)
Fig. 2 Two-dimensional correlation spectra of samples (a) and autocorrelation spectrum (b)
图2 a中的峰有自相关峰和交叉峰两类,位于对角线上的峰为自相关峰,位于对角线外为交叉峰。自相关峰的强度反映了不同波长下光谱信号随外部扰动变化的程度,即对蛋白质含量变化的敏感程度,其值均为正;交叉峰则表示不同波长下光谱强度变化的相似性,其值有正有负。自相关谱是由对角线上自相关峰构成的谱图(图2b)。由图2可以看出,在波长978、1 164、1 420、1 524、1 659、1 860 nm和2 238 nm处存在较强的自相关峰,其中2 238 nm处的自相关峰与蛋白质有关;在主对角线以外,在(1 420 nm,1 860 nm)、(1 860 nm,2 238 nm)、(1 420 nm,2 238 nm)、(1 524 nm,2 238 nm)位置处存在明显正交叉峰,表明波长1 420、1 524、1 860 nm和2 238 nm处的吸收峰来源相同,均是由蛋白肽键和氨基中NüH键对光谱吸收形成。可见,1 400~2 300 nm波段的光谱随蛋白质含量变化极显著。该波段与Kalinin等牛乳蛋白质测量所用的光谱区域(800~1 065 nm)有所不同,这可能与测量方式、仪器硬件等有关,本实验采用了漫反射方式测量牛乳蛋白质含量,而文献中利用了透射方式。虽然短波区域(780~1 100 nm)的光透射性强,但吸收系数较小,与长波相比蛋白质含量信息量相对较少(图2b),增加了数据分析和建模的难度,结合二维相关分析,本研究选择波段1 400~2 300 nm作为蛋白质检测的研究区域。2.2 单因素试验结果2.2.1 预处理方法的对比为降低干扰信息的影响和提升模型预测精度,分别采用矢量归一化、多元散射校正(multiplicative scatter correction,MSC)、一阶导数(1st)、二阶导数(2nd)、标准正态变量变换(standard normal variate,SNV)方法对原始光谱进行预处理后建立PLS模型,结果如表2所示。除2nd方法外,矢量归一化、MSC、1st、SNV方法处理后模型的相关系数和预测准确性均有明显提高,表明这4 种方法能够扣除光谱中与待测成分无关的干扰信号,保留有用信息。其中,经SNV法处理后的蛋白质模型的预测效果最佳,其次为MSC法。与预处理前相比,经SNV法和MSC法处理后模型的RMSEP分别降低了31.1%和27.8%。通过粒径分析可知,均质后牛乳中脂肪球的粒径分布于0.2~1.0 µm之间,存在明显脂肪球分布的不均匀性,这使其对近红外光有较强的散射作用,由于MSC法和SNV法能够消除颗粒大小及均匀性变化对光谱的影响,所以经MSC法和SNV法处理后可有效消除散射作用引起的干扰。相反,2nd法在去除背景干扰、提高灵敏度的同时放大了噪声,降低了信噪比,使得模型的预测能力下降,导致RMSEP升高了91.9%。可见,预处理方法的选择对蛋白质检测结果有较大影响,其中MSC和SNV是较为理想的预处理方法。《白皮书》通过采集并梳理全国范围内的12240户育儿家庭用户行为大数据与在线调查问卷,向社会勾勒出新生代年轻家庭在育儿方面的“众生相”,并囊括当下最热门的育儿话题,为更好地了解中国育儿家庭提供了有意义的参考。 海外投资主体往往涉及不同的国别,情况复杂多变,要求各项目公司定期报送风险报告是投资主体动态跟踪各项目的重要举措。 表2 预处理方法的比较
Table 2 Comparison of results obtained with different preprocessing methodshttp://rtt.5read.com/pdgpath/format?f=ba5bc3a84dc004baa2c1abd2ff3e7c4f/f9f96127855bff587abbe073de6762db.jpg&q=30 RMSEC Rp RMSEP无6 0.971 0.178 0.969 0.209矢量归一化 6 0.974 0.159 0.972 0.173 MSC 6 0.980 0.147 0.979 0.151 1st 5 0.976 0.153 0.973 0.168 2nd 5 0.892 0.357 0.866 0.401 SNV 5 0.983 0.135 0.982 0.144预处理方法主成分数校正集 验证集Rc
2.2.2 波段选择的影响http://rtt.5read.com/pdgpath/format?f=ba5bc3a84dc004baa2c1abd2ff3e7c4f/9adeb1ad60d36acfdf93ab26793924cb.jpg&p=570x314&q=30 图3 不同波段牛乳中蛋白质含量的预测
Fig. 3 Effect of different wavelength regions on prediction of protein concentration in milk
选择与待测组分相关的特征波段,既能降低计算量、提高模型的预测能力和稳健性,又能避免光谱数据间相关性导致的过拟合现象。本实验在1 400~2 300 nm波长范围内研究不同波段对蛋白质含量检测的影响。如图3所示,3 个波段1 400~2 300、1 400~1 800 nm和1 800~2 300 nm的RMSEP分别为0.146、0.142和0.125,其中1 800~2 300 nm波段的预测结果明显好于其他波段,这与Tsenkova等的研究结果基本一致,可见1 800~2 300 nm波段内含有较强的蛋白质含量信息。虽然1 400~1 800 nm波段也含有蛋白质相关的光谱信息,但是由于存在脂肪较强的散射作用和水的强吸收作用,加之牛乳中水的含量(>87%)远大于蛋白质,使得此波段存在复杂的背景干扰。因此,1 800~2 300 nm是蛋白质理想的检测波段。2013年,周启明和钱海燕买房结婚,2014年生下儿子当当。只是谁也没想到,刚刚开启的幸福,就在中途来了个急转弯。 2.2.3 建模方法比较http://rtt.5read.com/pdgpath/format?f=ba5bc3a84dc004baa2c1abd2ff3e7c4f/740faf43e53df20e5a12116cda409efb.jpg&p=646x304&q=30 图4 不同建模方法牛乳中蛋白质含量的预测结果
Fig. 4 Effect of different modeling methods on prediction of protein concentration in milk
采用MLR、PCR、PLS和SVR对同一牛乳样本进行定量分析,结果如图4所示。4 种建模方法中线性校正方法明显好于非线性,且线性建模方法中PLS法和PCR法对蛋白质的预测性能均优于MLR法。这可能是因为1 800~2 300 nm范围内自变量(光谱数据)与被测目标(蛋白质含量)间不仅有较强的线性关系,同时光谱数据内部存在多重共线性的现象,使得MLR建模方法失效。而PLS和PCR法能够对光谱数据进行分解和筛选,剔除多重相关信息和无解释意义信息的干扰;SVR法作为非线性定量校正方法,其原理是通过升维方式使原样本空间中的非线性问题转化为特征空间中的线性关系进行建模,但是对于样本空间中线性问题使用SVR法会增加计算的复杂性,甚至引起“维数灾难”,导致模型的预测精度降低。由图4可知,PLS法和PCR法建立的蛋白质校正模型的预测结果相差不大,RMSEP分别为0.125和0.132。因此,PLS法和PCR法均适合作为蛋白质检测的建模方法。2.3 正交试验结果在实际应用中,由于近红外吸收光弱且易受外界干扰,光谱中夹杂许多无用信息(包括噪声、背景等),为提高信噪比、建立稳定的校正模型,需要对光谱数据进行波段、预处理和建模方法的优选组合。本实验选取预处理方法、检测波段和建模方法3 个因素进行正交试验,以F值作为评价指标,F值越大表明模型的性能越好。经方差分析,以上3 个因素对模型的预测精度存在一定交互作用的影响。由表3可知,影响蛋白质模型预测精度的主次因素为建模方法>检测波段>预处理方法;根据极值分析结果,得到各因素的较好水平组合为A2B3C1,即建模方法为PCR法、检测波段为1 800~2 300 nm、预处理方法为MSC法,这与单因素试验结果并不完全一致,且A2B3C1没有出现于正交试验设计方案中,这可能与预处理方法、建模方法2 个因素间的交互作用影响有关。为了确定最佳建模条件,分别在A2B3C1、单因素试验以及正交设计试验中最优建模条件下对未知样品进行检测,结果表明A2B3C1条件下的预测效果最好,其R2、RMSEP分别为0.993、0.106。可见,经正交试验设计确定的建模条件能够进一步提高蛋白质模型的准确度,也表明正交设计能够有效优化复杂背景下的近红外建模条件。表3 正交试验设计与结果
Table 3 Orthogonal array design with resultshttp://rtt.5read.com/pdgpath/format?f=ba5bc3a84dc004baa2c1abd2ff3e7c4f/cd15961e160719c5a284cbb7f657dbb2.jpg&q=30 试验号 A检测波段/nm B预处理方法 C建模方法 F值1 1 400~1 800(1) 无(1) PCR(1) 91.15 2 1 400~1 800 矢量归一化(2) MLR(2) 49.50 3 1 400~1 800 MSC(3) SVR(3) 64.34 4 1 400~1 800 SNV(4) PLS(4) 91.52 5 1 800~2 300(2) 无 PLS 92.88 6 1 800~2 300 矢量归一化 SVR 53.04 7 1 800~2 300 MSC MLR 61.22 8 1 800~2 300 SNV PCR 93.90 9 780~1 400,2 300~2 500(3) 无 SVR 30.10 10 780~1 400,2 300~2 500 矢量归一化 PLS 87.46 11 780~1 400,2 300~2 500 MSC PCR 88.89 12 780~1 400,2 300~2 500 SNV MLR 39.04 13 780~2 500(4) 无 MLR 43.27 14 780~2 500 矢量归一化 PCR 90.14 15 780~2 500 MSC PLS 90.30 16 780~2 500 SNV SVR 52.80 k1 74.13 64.35 91.02 k2 75.26 70.03 48.26 k3 61.37 76.19 50.07 k4 69.13 69.32 90.54 R 13.89 11.84 42.76
3 结 论建模条件的选择直接影响近红外光谱分析结果。本实验以复杂背景条件下的蛋白质为研究对象,采用近红外光谱技术对牛乳中蛋白质含量进行检测,通过正交试验设计优化近红外建模条件,即预处理方法、检测波段和建模方法。结果表明,与传统方法对比,该方法不仅避免了各建模条件存在交互作用的影响,覆盖了主要因素的各种组合,而且以较少实验次数得到了预测准确度较高的分析模型,为近红外蛋白质含量建模条件优选提供了一条有效的途径。参考文献: 周跃男, 王湛, 赵小川, 等. 浅谈蛋白质含量的定量检测方法.食品研究与开发, 2014, 35(7): 127-130. DOI:10.3969/j.issn.1005-6521.2014.07.034. GASILOVA N, GASSNER A L, GIRAULT H H. Analysis of major milk whey proteins by immunoaffinity capillary electrophoresis coupled with MALDI-MS. Electrophoresis, 2012, 33(15): 2390-2398. DOI:10.1002/elps.201200079. 姜潮, 韩剑众, 范佳利, 等. 低场核磁共振结合主成分分析法快速检测掺假牛乳. 农业工程学报, 2010, 26(9): 340-344. DOI:10.3969/j.issn.1002-6819.2010.09.056. BOGOMOLOV A, MELENTEVA A. Scatter-based quantitative spectroscopic analysis of milk fat and total protein in the region 400-1 100 nm in the presence of fat globule size variability.Chemometrics & Intelligent Laboratory Systems, 2013, 126: 129-139.DOI:10.1016/j.chemolab.2013.02.006. 王明, 于峰, 刘新, 等. 采用近红外漫反射技术对牛奶中蛋白质、脂肪检测. 激光杂志, 2015, 36(1): 70-73. DOI:10.14016/j.cnki.jgzz.2015.01.070. 田翔, 刘思辰, 王海岗, 等. 近红外漫反射光谱法快速检测谷子蛋白质和淀粉含量. 食品科学, 2017, 38(16): 140-144. DOI:10.7506/spkx1002-6630-201716022. 李路, 黄汉英, 赵思明, 等. 大米蛋白质、脂肪、总糖、水分近红外检测模型研究. 中国粮油学报, 2017, 32(7): 121-126.DOI:10.3969/j.issn.1003-0174.2017.07.020. OLIVERI P, EGIDIO V D, WOODCOCK T, et al. Application of class-modelling techniques to near infrared data for food authentication purposes. Food Chemistry, 2011, 125(4): 1450-1456. DOI:10.1016/j.foodchem.2010.10.047. CHEN J, ZHU S P, ZHAO G H. Rapid determination of total protein and wet gluten in commercial wheat flour using siSVR-NIR. Food Chemistry, 2017, 221: 1939-1946. DOI:10.1016/j.foodchem.2016.11.155. PATRIZIA F, SILVIA D L, REMO B, et al. Near infrared (NIR)spectroscopy-based classification for the authentication of Darjeeling black tea. Food Control, 2019, 100: 292-299. DOI:10.1016/j.foodcont.2019.02.006. ALESSANDRA B, PATRIZIA F, REMO B, et al. Determination of insect infestation on stored rice by near infrared (NIR) spectroscopy.Microchemical Journal, 2019, 145: 252-258. DOI:10.1016/j.microc.2018.10.049. TORRES I, SÁNCHEZ M T, BENLLOCH-GONZÁLEZ M, et al.Irrigation decision support based on leaf relative water content determination in olive grove using near infrared spectroscopy.Biosystems Engineering, 2019, 180: 50-58. DOI:10.1016/j.biosystemseng.2019.01.016. MELENTEVA A, GALVANIN V, SAVENKOVA E, et al. Building global models for fat and total protein content in raw milk based on historical spectroscopic data in the visible and short-wave near infrared range. Food Chemistry, 2016, 203: 190-198. DOI:10.1016/j.foodchem.2016.01.127. AERNOUTS B, POLSHIN E, LAMMERTYN J, et al. Visible and near-infrared spectroscopic analysis of raw milk for cow health monitoring: ref l ectance or transmittance?. Journal of Dairy Science,2011, 94(11): 5315-5329. DOI:10.3168/jds.2011-4354. MELFSEN A, HARTUNG E, HAEUSSERMANN A. Accuracy of inline milk composition analysis with diffuse ref l ectance near-infrared spectroscopy. Journal of Dairy Science, 2012, 95(11): 6465-6476.DOI:10.3168/jds.2012-5388. FENG X D, SU R, XU N, et al. Portable analyzer for rapid analysis of total protein, fat and lactose contents in raw milk measured by non-dispersive short-wave near-infrared spectrometry. Chemical Research in Chinese Universities, 2013, 29(1): 15-19. DOI:10.1007/s40242-013-2191-y. 郭中华, 王磊, 金灵, 等. 基于近红外透射光谱的乳制品蛋白质、脂肪含量检测. 光电子·激光, 2013, 24(6): 1163-1168. DOI:10.16136/j.joel.2013.06.014. 彭丹, 岳金霞, 毕艳兰. 小波包熵的复杂体系近红外光谱信息提取.光谱学与光谱分析, 2017, 37(11): 3409-3413. DOI:10.3964/j.is sn.1000-0593(2017)11-3409-05. 范睿, 孙晓凯, 周欣, 等. 基于近红外光谱定量分析花生牛奶可行性.食品科学, 2017, 38(24): 189-195. DOI:10.7506/spkx1002-6630-201724030. 杨福臣, 侯会绒, 孙芝杨. 乳粉中蛋白质和脂肪的近红外定量模型优化研究. 食品科技, 2016, 41(11): 253-258. DOI:10.13684/j.cnki.spkj.2016.11.054. 高向阳. 食品分析与检验. 北京: 中国计量出版社, 2008. LUKACS M, BAZAR G, POLLNER B, et al. Near infrared spectroscopy as an alternative quick method for simultaneous detection of multiple adulterants in whey protein-based sports supplement. Food Control, 2018, 94: 331-340. DOI:10.1016/j.foodcont.2018.07.004. 王文秀, 彭彦昆, 房晓倩, 等. 二维相关光谱的猪肉TVB-N特征变量优选研究. 光谱学与光谱分析, 2018, 38(7): 2094-2100.DOI:10.3964/j.issn.1000-0593(2018)07-2094-07. NODA I. Recent developments in two-dimensional (2D) correlation spectroscopy. Chinese Chemical Letters, 2015, 26(2): 167-172.DOI:10.1016/S1001-8417(15)00041-8. 杨仁杰, 杨延荣, 刘海学, 等. 二维相关谱在食品品质检测中的研究进展. 光谱学与光谱分析, 2015, 35(8): 2124-2129. DOI:10.3964/j.issn.1000-0593(2015)08-2124-06. 杨晋辉, 卜登攀, 王加启, 等. 近红外透反射光谱法测定牛奶成分. 食品科学, 2013, 34(20): 153-156. DOI:10.7506/spkx1002-6630-201320031. KALININ A, KRASHENINNIKOV V, SADOVSKIY S, et al.Determining the composition of proteins in milk using a portable near infrared spectrometer. Journal of Near Infrared Spectroscopy,2013, 21(5): 409-415. DOI:10.1255/jnirs.1054. 褚小立. 近红外光谱分析技术实用手册. 北京: 机械工业出版社, 2016. BOGOMOLOV A, BOLDRINI B, DIETRICH S, et al. Quantitative determination of fat and total protein in milk based on visible light scatter. Food Chemistry, 2012, 134(1): 412-418. DOI:10.1016/j.foodchem.2012.02.077. TSENKOVA R, ATANASSOVA S, TOYODA K, et al. Near-infrared spectroscopy for dairy management: measurement of unhomogenized milk composition. Journal of Dairy Science, 1999, 82(11):2344-2451. DOI:10.3168/jds.S0022-0302(99)75484-6.
Optimization of Modeling Conditions for Near Infrared Measurement of Protein Content in Milk by Orthogonal Array DesignPENG Dan, LIU Yali, LI Linqing, BI Yanlan
(College of Food Science and Engineering, Henan University of Technology, Zhengzhou 450001, China)Abstract: In order to improve the accuracy and stability of protein content measurement using near-infrared (NIR)spectroscopy, the spectral data of milk samples with different protein contents were analyzed using the two-dimensional correlation spectroscopy to identify the characteristic wavelengths region of protein. Then, the effects of wavelength bands,preprocessing algorithms and modeling methods on the prediction accuracy of the model were studied by single factor experiments. On this basis, the modeling conditions were optimized by orthogonal array design to avoid interactions.The results showed that all three factors had a great impact on the performance of the prediction model in the descending order of modeling methods, wavelength bands and preprocessing methods. Among the preprocessing algorithms tested,standard normal variable (SNV) algorithm and multiplicative scatter correction (MSC) algorithm could effectively eliminate the interference of scattering. The linear models such as principal component regression (PCR) and partial least squares(PLS) were significantly better than non-linear support vector machine regression (SVR). Finally, the optimized modeling conditions were determined as follows: detection wavelength range from 1 800 to 2 300 nm, MSC preprocessing, and PCR modeling. Under these conditions, the correlation coefficient (R2) and root mean square error of prediction (RMSEP) of the prediction model were 0.993 and 0.106, respectively. This research provides a feasible technical way to develop a new device for the rapid detection of protein content in milk in the future.Keywords: milk; near-infrared spectroscopy; orthogonal array design; protein
收稿日期:2019-03-13基金项目:国家自然科学基金青年科学基金项目(31601537)第一作者简介:彭丹(1979ü)(ORCID: 0000-0001-8727-0983),女,副教授,博士,研究方向为食品品质分析及安全检测、化学计量学方法在食品检测中的应用。E-mail: pengdantju@163.comDOI:10.7506/spkx1002-6630-20190313-160中图分类号:O657.3文献标志码:A文章编号:1002-6630(2020)04-0256-06引文格式:彭丹, 刘亚丽, 李林青, 等. 正交试验设计优化近红外检测牛乳中蛋白质的建模条件. 食品科学, 2020, 41(4): 256-261.DOI:10.7506/spkx1002-6630-20190313-160. http://www.spkx.net.cnPENG Dan, LIU Yali, LI Linqing, et al. Optimization of modeling conditions for near infrared measurement of protein content in milk by orthogonal array design. Food Science, 2020, 41(4): 256-261. (in Chinese with English abstract)DOI:10.7506/spkx1002-6630-20190313-160. http://www.spkx.net.cn
页:
[1]