奥鹏易百

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 337|回复: 0

出芽短梗霉发酵液中聚苹果酸定量近红外模型的建立与应用

[复制链接]

2万

主题

27

回帖

6万

积分

管理员

积分
60146
发表于 2021-2-3 21:59:43 | 显示全部楼层 |阅读模式
扫码加微信
出芽短梗霉发酵液中聚苹果酸定量近红外模型的建立与应用出芽短梗霉发酵液中聚苹果酸定量近红外模型的建立与应用
张英昊1,薛照阳1,赵廷彬2,殷海松3,乔长晟1,2,4,*
(1.天津科技大学生物工程学院,天津 300457;2.天津慧智百川生物工程有限公司,天津 300457;3.天津现代职业技术学院生物工程学院,天津 300350;4.天津市食品绿色制造及安全校企协同创新实验室,天津 300457)
摘 要:利用高效液相色谱法测量发酵液聚苹果酸浓度。联合使用间隔偏最小二乘法与移动窗口偏最小二乘法定位建模波段为5 638~6 024 cm-1。依次使用多元散射校正+标准正规化+Savitzky-Golay 55点平滑+一阶导数光谱的预处理方法结合前5维因子偏最小二乘回归建模,可以达到最佳的拟合精度,模型内部验证集预测均方误差(root mean square error of prediction,RMSEP)为1.553 g/L,Rp为0.970 0,外部验证集RMSEP为1.378 g/L,Rp为0.992 4,配对t检验在95%置信度下的最大偏差分别为1.48 g/L和0.83 g/L,模型对同一样品的3 次预测平行无显著差异。将模型应用于单因素培养基优化和诱变菌株样品的预测,结合配对t检验发现模型的预测误差较大,但是可以在样品间模型计算值偏差分别大于3.19 g/L和1.44 g/L的前提下可靠地比较聚苹果酸浓度的大小,从而验证近红外模型在培养基组分优化和诱变菌株筛选领域中的应用价值。
关键词:近红外建模;偏最小二乘法;聚苹果酸;单因素培养基优化;诱变菌种筛选;配对t-检验
聚苹果酸是一种水溶性脂肪族聚酯,由苹果酸单体以酯基聚合而成[1],在食品、药品、化妆品、生物医学材料、农业等领域具有广泛应用前景。微生物发酵法现已成为生产聚苹果酸的主要方式,其中出芽短梗霉(Aureobasidium pullulans)由于产量相对其他微生物高且具有胞外分泌的优势逐步成为了主要生产菌种[2-6]。
发酵液中聚苹果酸的传统测量方法是利用高温酸水解的方式先将聚苹果酸水解成L-苹果酸单体,然后对单体进行测量。常用的测量方法有Goodban比色法[7]、酶试剂盒法[8]和液相色谱法,其中液相色谱法是目前最成熟的测量方式[9-10]。酸水解过程具有高能耗、高污染的缺陷;Goodban法副反应严重,影响测量精度;酶方法所需的酶试剂盒价格较贵,不易保存,对操作环境要求也较高;液相色谱法虽然是最成熟的方式,但是具有测量耗时、对样品具有破坏性、仪器设备昂贵笨重等缺陷。因此有必要开发新的检测技术。
近红外检测分析技术主要利用有机物中含氢化学键,如C—H、N—H、O—H、S—H等的倍频与合频吸收,对特定组分以快速无损、不需要化学试剂的方式进行定量分析或定性判别[11]。近红外光谱具有峰形严重重叠,峰强度较弱,信息冗余、杂峰多等特征,因此原始光谱难以用肉眼直接分析,需要以计算机软件为工具对光谱进行预处理,使用化学计量学方法建立数学模型计算待测物质浓度,而偏最小二乘回归(partial least square regression,PLSR)算法由于其良好的拟合精度,优秀的泛化能力和相对而言较小的运算量逐渐成为最常用的近红外检测数学建模算法,并在发酵制品的测量中得到广泛应用。例如董芹[12]利用近红外检测发酵液中透明质酸的浓度和分子质量;张树明等[13]利用近红外检测葡萄酒发酵过程中的常用参数;郭宇飞等[14]建立利用近红外测量发酵液中L-色氨酸浓度的模型;Li Mengyao等[15]建立近红外检测生物反应器培养CHO细胞过程中抗体浓度,细胞密度以及营养物质浓度的模型。
鉴于聚苹果酸的价值以及近红外检测技术的优势,本实验选择利用PLSR方法建立出芽短梗霉发酵液中聚苹果酸浓度的近红外定量模型,并进一步验证此模型在单因素培养基优化和诱变菌种筛选2 类实际应用情景中对发酵液样品的预测精度,以期为近红外检测模型在发酵工业中的应用提供理论依据。
1 材料与方法1.1 材料与试剂
1.1.1 菌种
综上所述,医护人员需要密切关注气管插管患者的病情,给与科学合理精心的护理,注意基础护理、气管插管之后的湿化,感染的预防,以及各种并发症的护理等等。同时需要关注患者的饮食,根据患者情况给与鼻饲、喂养和自理等,一切依照不同患者的情况选择不同的方案。应该遵循从流食到普食的原则。患者的心理状态作为新时代的医护人员液应关注,加强同患者的沟通,对于患者和亲属可给与一定适度的相关知识教育,对于其疑问应耐心科学的解答以及建立随访制度。如此多方面综合的给与患者关怀,减轻患者痛苦,减轻家庭社会负担,提高其生存率以及生存质量。
出芽短梗霉CGMCC No.3337,保藏于天津北洋百川生物技术有限公司。
1.1.2 培养基
斜面保藏使用标准PDA固体培养基。种子培养基:蔗糖140 g/L、酵母粉3 g/L、丁二酸2 g/L、硫酸铵1 g/L、碳酸钾0.4 g/L、磷酸二氢钾0.1 g/L、硫酸镁0.1 g/L、硫酸锌0.05 g/L、碳酸钙20 g/L(单独灭菌)、玉米浆1 mL/L。基础发酵培养基:蔗糖180 g/L、蛋白胨35 g/L、硝酸钠2 g/L、硫酸镁0.3 g/L、氯化钾0.5 g/L、磷酸二氢钾0.1 g/L、硫酸锰0.05 g/L、碳酸钙20 g/L(单独灭菌)。
1.2 仪器与设备
Antaris II傅里叶变换中近红外光谱分析仪 美国赛默飞世尔科技有限公司;1100高效液相色谱分析仪 美国安捷伦科技有限公司;Sky2102摇床 上海苏坤实业有限公司;YJ-875S医用超净台 苏州净化设备厂;SPK-250B-Z生化培养箱 上海博讯实业有限公司医疗设备厂;LD5-10高速离心机 北京医用离心机厂。
1.3 方法
1.3.1 培养条件
摇瓶发酵:从PDA斜面挑取菌体接种于种子培养基中,在25 ℃、200 r/min条件下振荡培养40 h,然后将种子液按体积分数10%的比例接种于基础发酵培养基中,在25 ℃、200 r/min条件下振荡培养144 h,期间每隔12 h取一次样以产生不同的聚苹果酸浓度。
1.3.2 诱变筛选步骤
按照文献[16]的方法进行紫外诱变菌种筛选,经摇瓶培养120 h后取样做相关测量。
1.3.3 聚苹果酸浓度的测定
取10 mL发酵液,15 000 r/min离心10 min,收集上清液,吸取1 mL上清液于水解反应釜中,加入4 mL水与5 mL浓度2 mol/L的硫酸溶液,于110 ℃水解7 h,将聚苹果酸完全水解为L-苹果酸。高效液相色谱法测定水解前后的L-苹果酸含量并依据稀释倍数换算为发酵液原液中的浓度,两者之差即为发酵液聚苹果酸含量。
高效液相色谱检测条件:J&K C18色谱柱(4.6 mm×250 mm,5 μm);流动相:25 mmol/L磷酸二氢钾溶液(用磷酸调节pH值至2.5);柱温25 ℃;恒定流速1 mL/min;进样量3 μL;紫外检测器波长210 nm。
旅游客源市场即旅游需求市场,是指在一定时期内对某一旅游产品现实和潜在的总体需求[2].客源市场在旅游目的地有着举足轻重的作用,在一定程度上关系到旅游目的地的长远发展.总体上来看,一般可将目的地的旅游客源市场划分为国内旅游客源市场和海外旅游客源市场两大部分.海外客源市场还可进一步细分,有关旅游统计资料显示,我国在1999年以前通常把海外游客划分为外国人(包括外籍华人在内)、海外华侨和港澳台同胞[3],2000年后则划分为外国人和港澳台同胞.
1.3.4 发酵液近红外光谱扫描
应用透射光谱模块,以空气作为扫描背景,室温下每个样品做3 次光谱采集,求平均光谱,每次采集扫描32次,扫描波长范围4 000~10 000 cm-1,采样间隔设置为2 cm-1。测试样品为不同批次不同培养时间点取样的发酵离心上清液。
1.3.5 数据分析与建模
1.3.5.1 样本划分
由此可知,低压给水管径越小,全甩负荷暂态时低压给水管道存水量越小,暂态过程中给水泵入口富裕压头最大降落值的时间减少,给水置换过程加快,前置泵入口的有效汽蚀余量增加,对除氧器瞬态反而是有利的。当管径由Φ630×15降为Φ610×15时,汽蚀余量富余值增加 1m。另外,降低管径可减少低压给水管材重量,减少投资,且管系对设备的推力和力矩都减小,对设备安全运行有利。从对比表格中可以看出,管道流速均在推荐流速范围之内。因此本算例推荐下降管管径为Φ610×15。
建模共涉及109 个样本,利用Kennard-Stone方法[17]划分校正集和内部验证集,其中校正集82 个,内部验证集27 个,另用完全未参与建模的发酵液样品50 个作外部验证集,验证模型对完全未知样品的预测精度。
目前,国内高校绝大多数对于学术不端行为、学术道德缺失现象没有严格意义上的惩罚机制和明文规定 (除对各种考试作弊有较严厉的惩罚措施外),基本停留在惩戒的层面上。“由于缺乏健全的学术道德管理制度和科学的评估机制,对一些违反学术道德的行为很难制裁。如各高校对于作业抄袭或编造实验数据的学生一般都无法处理”〔2〕。这样的学术机制很难保证研究生学术道德缺失上惩戒到位,“当学术造假者的预期收益远大于成本,在追求利益最大化的驱使下必然会出现大量的学术不诚信行为”〔3〕。
5.突出了教材的实践性。增设了实践性和操作性强的“化学教学技能训练——微格教学,信息技术在化学教学中的应用,化学教学设计,化学教学测量与评价,中学化学实验教学研究”的内容,使教材实践性、操作性大大增强了。
分别取单因素优化培养基样品14 个以及紫外诱变菌株样品集27 个作为外部验证集,验证模型在培养基优化和诱变筛菌两类应用中的预测精度。其中单因素优化样品使用初始菌株,在基础发酵培养基中额外添加了2~10 g/L的硝酸钠后经摇瓶获得样品;诱变菌株样品集使用诱变菌株接种培养,在基础发酵培养基中经摇瓶获得样品。
1.3.5.2 特征波段的选择
1.2.4 测量工具 家庭环境量表中文版(Family Environment Scale-Chinese Version,FES-CV)[4]:包含90个条目,分10个评价因子,包括亲密度、情感表达、矛盾性、独立性、成功性、知识性、娱乐性、道德宗教观、组织性、控制性,分别评价10个不同的家庭环境特征。每个条目用“是”或“不是”回答,回答“是”为“1”分,回答“不是”为“2”分。高分儿童家庭气氛更融洽,家庭成员自由表达情感的程度更高,追求成功的动机较强。同时高分儿童家庭冲突较少,彼此攻击和敌视的现象较少,这样家庭的特征有利于培养儿童的学习积极性,提高学习效率。
分别以间隔偏最小二乘回归(interval-partial least square regression,i-PLSR)法和移动窗口偏最小二乘回归(moving window-PLSR,mw-PLSR)法选择特征波段[18-19],以交叉验证均方根误差(root mean square error of cross validation,RMSECV)作为波段选择依据,对应于最小的RMSECV的波段为最佳拟合波段。交叉验证的计算方法参考文献[20]。本研究所有交叉验证均使用留一法。
PLM系统提供快速方便的分类技术,将全公司的所有数据和过程根据编码自动分类。使用者可以按分类查找,也可以利用PLM系统提供的检索功能,根据项目、名称、规格、材料、文件名、设计者等属性进行组合检索,高效地查询数据、零件、标准件、文档等对象和文件,减少重复设计,提高工作效率,缩短产品研发周期。
1.3.5.3 光谱预处理与聚苹果酸定量建模
光谱的一阶导数、二阶导数、多元散射校正(multiplicative scatter correlation,MSC)、标准正规变换(standard normal variation,SNV)等原理和计算公式参考文献[21]。具体的实现方式,MSC依照其数学原理用R软件自行编程,其他的处理利用R软件prospectr包进行[17];PLSR由R软件PLS包实现[22],以RMSECV值作为PLSR算法中因子数选择的标准,对应于最小RMSECV值的因子数具有最佳拟合精度。以内部和外部验证集的均方根误差(root mean square error of prediction set,RMSEP),以及液相色谱测量值与模型计算值间的相关系数R作为模型质量的评价指标,RMSEP值越小且R越接近于1说明模型的定量拟合效果越好。RMSEP和R的计算公式如下,n为验证集中的样本数。
   
1.3.5.4 统计学分析
1.3.3 hucMSCs细胞增殖能力检测 将接种于96孔板的hucMSCs(5×103/孔)常规培养24 h后,按实验分组干预,继续培养24、48、72 h,弃上清,每孔加入90 μL的10%FBS DMEM/F-12培养基和10 μL的CCK-8溶液,继续培养4 h,于450 nm波长下使用酶标仪测定各孔吸光度,记录并分析结果。
使用SPSS软件对校正集、内部验证集和全部的外部验证集作配对t检验以验证液相色谱测量值与模型计算值之间差异的显著性,并计算测量值、模型预测值间的误差置信区间;从外部验证集中挑选10 个样本,分别以每个样品扫描的3 次光谱平行代入模型算出浓度后进行单样本t检验,以验证模型对同一样品测量的稳定性。
1.3.5.5 校正集样品光谱代表性评价
二是从试点到推广突出一个“全”字,汇聚了江岸食药监监管智慧。完成了两个试点的改造升级工作后,推广的问题随之而来,好啃的骨头已经啃了,剩下的都是硬骨头,资金和场地成为横在推广路上的两座大山。为此,我们以大数据收集为突破口,为辖区36个农贸市场约10名检测人员下载APP,目前,与APP对接传输数据的新机器约为11台,存在25台新机器缺口,针对这一情况,我们在APP数据传输环节中灵活设置了机器上传与手动输入两种模式,解决数据全覆盖的问题。今年江岸食药监局将做好财政预算工作,争取多方支持,力求在明年完成辖区全部农贸市场蔬菜农残检测室升级改造工作。
全部样品集,对其特征波段范围内的近红外光谱进行主成分分析,并选择方差贡献率最大的前2 位主成分,作出主成分得分图。主成分分析由R软件内置基本函数计算。
2 结果与分析2.1 液相色谱测定结果
如图1所示,保留时间4.4 min左右的峰为L-苹果酸单体,样品中的L-苹果酸单体峰分离良好,可以基本实现精确的测量。对于近红外定量建模,校正集测量结果的准确性是实现模型精度的基本前提。
   
     
图 1 L-苹果酸标准品(a)和酸水解发酵液上清液(b)液相色谱图
Fig. 1 HPLC chromatograms of L-malic acid (a) and the acid hydrolysate of the fermentation supernatant (b)

2.2 校正集原始近红外光谱     
图 2 校正集的原始近红外光谱
Fig. 2 Raw near-infrared spectra of calibration set

如图2所示,芽短梗霉发酵液的近红外光谱部分波段噪声非常大,会严重影响定量精度,需要避开。而且出芽短梗霉发酵液成分高度复杂,除聚苹果酸外,多糖和蛋白质也会作为副产物被分泌至胞外[23-24]。因此根据聚苹果酸的结构特征查近红外吸收表确定建模波段的方法不可靠,需要用计算的方式确定建模波段。
2.3 建模波段选择
表 1 i-PLSR法选择波段结果
Table 1 Results of waveband selection using i-PLSR method
     
(g/L) 波段/cm-1 RMSECV/波段/cm-1 RMSECV/(g/L) 波段/cm-1 RMSECV/(g/L)4 000~4 384 8.78 5 542~5 927 2.27 7 085~7 470 7.78 8 628~9 012 6.72 4 385~4 770 9.81 5 928~6 312 5.48 7 471~7 855 7.16 9 013~9 398 8.99 4 771~5 156 9.2 6 313~6 698 9.35 7 856~8 241 7.92 9 399~9 784 9.58 5 156~5 541 7.3 6 699~7 084 9.63 8 241~8 627 5.41 9 785~10 000 8.92(g/L) 波段/cm-1 RMSECV/

表 2 mw-PLSR法选择波段结果
Table 2 Results of waveband selection using mw-PLSR method
     
波段/cm-1 RMSECV/(g/L)波段/cm-1RMSECV/(g/L)波段/cm-1RMSECV/(g/L)5 204~5 590 7.35 5 445~5 831 4.58 5 686~6 072 2.06 5 252~5 638 7.61 5 493~5 879 3.47 5 734~6 120 2.13 5 300~5 686 7.55 5 542~5 927 2.27 5 782~6 168 3.26 5 349~5 734 6.57 5 590~5 975 2.26 5 831~6 216 3.64 5 397~5 783 5.16 5 638~6 024 2.01 5 879~6 265 4.51

依次采用i-PLSR与mw-PLSR方法寻找特征波段,如表1、2所示。利用i-PLSR法先在全波段上粗略定位特征波段所在的大致范围,再用mw-PLSR法进一步精确定位,RMSECV越小则说明波段的预测精度越高。综合表1、2结果可知,5 638~6 024 cm-1波段范围对应于最佳的拟合精度,为特征波段。依据常见化合物近红外区段倍频吸收表[25],该波段主要对应于亚甲基和次甲基中的碳氢键的二倍频吸收,是聚苹果酸分子中存在的结构。因此该波段可以对聚苹果酸进行定量。
2.4 光谱预处理方式选择
表 3 不同预处理后的RMSECV值
Table 3 RMSECV values with different pre-processing methods
     
预处理方法 校正集RMSECV/(g/L) 预处理方法 校正集RMSECV/(g/L)不处理 2.211 MSC校正 2.747 Savitzky-Golay 15点平滑 2.128 MSC+SNV 2.262 Savitzky-Golay 55点平滑一级求导 2.142 MSC+SNV+Savitzky-Golay 55点平滑一级求导 2.055 Savitzky-Golay 65点平滑二级求导 3.016 MSC+SNV+Savitzky-Golay 65点平滑二级求导 3.022 SNV校正 2.343 MSC+SNV+Savitzky-Golay 15点平滑 2.134

预处理通常能够消除输入光谱中的随机误差或基线漂移等不利因素,对建模往往有积极影响。如表3所示,每种组合条件下交叉验证过程中的PLSR运算的因子数为对应于最小的RMSECV值的因子数。RMSECV值越小,说明对应的预处理条件能使模型预测精度最高。由表3可以看出,MSC+SNV+Savitzky-Golay 55点平滑+一级导数光谱的预处理组合能使模型预测精度最佳。
双师协同教学模式一方面体现了开放的思想,不管是“学科双师”协同模式,还是“虚实双师”协同模式,都充分利用网络资源,使我们的课堂内容不再仅仅局限于教材;另一方面也体现了整合的思想,既是学科间的整合,又是人文、艺术、科学等跨领域的整合,不仅贯彻在课程上,更是贯彻在课堂上,做到了课程与课堂同步。
推荐理由:根据2018年全国海关加工贸易及保税监管工作的总体要求,本书从创新监管模式、拓展保税功能、优化作业流程、深化协同配合四大方面,15项主要任务,23个具体改革事项,以图解方式全面系统地解读加贸保税监管业务改革新政,并且对精选案例进行了准确分析。
     
图 3 经过波段选择和光谱预处理后的校正集输入光谱波形
Fig. 3 Input spectra of calibration set with selected waveband and pre-processing method

图3 为5 638~6 024 cm-1特征波段在经过MSC、SNV和Savitzky-Golay 55点平滑一级求导后的波形。该波形数据直接输入PLSR模型用于聚苹果酸的定量。
2.5 模型的建立与质量评价
欠拟合与过拟合是数学建模中2 种常见的缺陷。其中欠拟合指的是模型输入数据中与待测组分关联的信息利用不充分,过拟合则是输入数据中与待测组分无关的信息也被引入模型中。2 种情况均会使模型的精度下降。PLSR算法中不同的建模因子数目代表对原始数据不同程度的信息提取,故进行建模前要确认合适的建模因子数以平衡欠拟合与过拟合。从图4可以看出,前5维因子对应的RMSECV值均最低,说明此时模型预测状态最佳。
     
图 4 PLS因子数目选择结果
Fig. 4 Selection of the number of partial least square factors

     
图 5 模型算法对校正集、内部验证集和外部验证集样品的预测结果
Fig. 5 Model prediction results of samples in calibration set, internal test set and external test set

以前5维因子进行PLSR建模并分别验证模型对校正集和内部验证集的预测精度,结果如图5所示。其中RMSEC为1.619,Rc为0.983 3,内部验证集预测均方根误差(root mean square error of prediction,RMSEP)为1.553,Rp为0.970 0;外部验证集RMSEP为1.378,Rp为0.992 4。从RMSEP值,相关系数R值以及散点的直观分布来看,模型预测效果基本满意。
2.6 模型在单因素培养基优化和诱变筛菌中的应用效果
分别以单因素培养基优化组和紫外诱变菌种筛选组的样品经摇瓶培养后的样品,作为完全未知的外部验证集,用模型进行聚苹果酸浓度预测,结果如图6所示。单因素培养基优化样品集的RMSEP为1.670,Rp为0.984 2;紫外诱变菌株样品集的RMSEP为1.416,Rp为0.920 3。直观上看这2 种情况下模型均具有尚可的预测效果。
数据转换完成之后,就可以进行数据挖掘的操作。首先要设置最小可信度和支持度,如果设置了过高的支持度,那么就会有较少的挖掘规则参与其中,能较快的得出挖掘结果。本文采用的是FP-Growth算法和INFP-Growth算法,并且设置0.5的可信度和2的最小支持度,相应的挖掘关联规则如下:
     
图 6 模型对培养基单因素优化组和诱变菌株组的预测结果
Fig. 6 Model prediction results for medium composition optimization and mutant screening

2.7 统计检验结果
以配对t检验的方法分别检验校正集、内部验证集、外部验证集、单因素培养基优化组和诱变菌株组的聚苹果酸液相色谱测量值与模型预测值间的差异显著性,并计算在95%置信度下误差的置信区间,结果如表4所示。其中校正集、内部验证集和外部验证集的液相色谱值和计算值间无显著差异,而培养基单因素优化组和诱变菌株筛选组则存在显著差异,表明模型不适合在这2 类应用中对质量浓度进行测量,尤其单因素培养基优化组,其95%置信度下的最大误差能达到3.8 g/L,相对于液相色谱值的范围来说过大。内部、外部验证集的测量值液相色谱值间无显著差异,且偏差相对于液相色谱值而言小于最大值的5%,表明这种误差是可以接受的。
表 4 配对t检验的结果
Table 4 Result of paired t-test
     
计算值-液相色谱值/(g/L)(95%置信区间) 自由度 P值下边界 上边界校正集 2.5~44.3 0.006 1.130 81 0.783内部验证集 5.0~36.3 -1.475 0.503 26 0.892外部验证集 2.1~42.4 -0.829 0.266 49 0.557培养基单因素优化组 15.6~33.3 -3.834 -0.644 13 0.007诱变菌株组 15.7~29.9 0.527 1.963 26 0.046样品集分组 液相色谱值范围/(g/L)

进行培养基优化或诱变筛菌时,待测组分质量浓度的相对大小往往比实际质量浓度更受关注。根据单因素优化组和诱变菌株组误差的置信区间结果,结合置信区间的定义,可以得出2 个样本模型计算值间的“最小差值”的计算公式,即置信区间上、下边界之差的绝对值。2 个样本在光谱计算结果偏差大于“最小差值”,即证明2 个样本在给定置信度下在液相色谱值有显著差异。因此在95%的置信水平上,单因素优化组和诱变菌株组在模型计算值上的“最小差值”必须分别至少大于3.19 g/L和1.436 g/L才能以模型计算值的大小判断液相色谱值,结合图6结果,测量值与模型值间的线性较好,因此可以在满足最小差值的条件下较可靠地由定量模型比较出组分大小。如表5所示,从外部验证集中抽出的10 个样本,分别由各自同一样品的3 个平行光谱计算质量浓度值并进行单样本t检验,以验证3 次平行光谱的稳定性。由结果可知每个样本3 次平行经t检验的显著性均显著大于0.05,说明没有差异,表明模型对同一个样品的预测值具有很高的稳定性。
西峡沟注水系统属于电动机功率和负荷匹配不合理问题,西峡沟注水系统的注水泵型号为3ZS-4/50,其额定排量为5.9 m3/h,额定输出压力为14 MPa,根据注水泵额定参数计算,其需要的功率为23 kW。该泵配置的电动机型号是YVP280M-6,额定功率为55 kW。从泵的额定参数和电动机的额定参数比对,此泵配置的电动机过大,属于“大马拉小车”现象,造成泵机组运行效率低,仅有61.19%。根据注水泵的实际情况更换合适功率的电动机,建议使用37 kW或者45 kW功率的电动机。
表 5 模型稳定性检验结果
Table 5 Results of model stability test
     
数值分类 样品1 样品2 样品3 样品4 样品5 样品6 样品7 样品8 样品9 样品10平行值1/(g/L) 7.08 18.92 17.72 16.86 24.78 25.95 30.18 32.16 38.21 41.88平行值2/(g/L) 7.31 19.54 17.33 16.70 23.93 25.45 31.22 31.94 38.34 42.37平行值3/(g/L) 7.39 19.08 17.15 16.78 24.86 25.87 30.66 31.87 38.91 41.75平均值/(g/L) 7.26 19.18 17.4 16.78 24.52 25.76 30.69 31.99 38.49 42.00显著性(P=0.05) 1.00 1.00 1.00 1.00 0.993 0.985 0.992 1.00 0.989 1.00

2.8 校正样品光谱代表性评价     
图 7 全体涉及样本光谱代表性评价结果
Fig. 7 Representativeness evaluation of all the samples

对特征波段范围的近红外光谱进行主成分分析评价样品集光谱代表性,结果如图7所示。校正集样品的散点完全覆盖了内部和外部验证集,并且基本分布均匀,没有明显的离群点。内部与外部验证集中也均没有出现明显偏离校正集范围的样本点。该结果说明样品集的光谱具备代表性,可以在一定程度上代表实际运用中常见的情况。
3 讨 论
本实验虽然建立近红外聚苹果酸定量模型,但模型对部分样品的预测结果相对于液相色谱测量值仍有较大误差。因此有必要分析近红外模型中误差的来源。
近红外光谱具有信息高度重叠的特征,很难将背景组分对应的光谱信息完全从目的组分的信息中排除,这表明近红外检测相对于中红外等传统光谱分析技术的外推性能较差,定量模型的精度高度受背景组分的影响。因此近红外模型的校正集样品要尽可能地包含各种可能出现的背景信息,即具备“代表性”[25]。“代表性”的表现形式,即校正集样品在光谱的主成分空间上应该能覆盖未知样品,不能有明显偏离,否则模型精度有可能降低。此时需要不断输入新的校正集样品扩大校正集的代表性,然后全体校正集样本重新建模[25]以改善定量模型的精度(也可按照文献[26]中所述方法先在主成分空间上进行聚类,每一小类再分别建模并对类内的未知样品进行预测,从而改善模型精度)。结合图7结果看,校正集是具备代表性的。但是随着未知样品测量的增多,仍然需要适当补充新的校正样本。
本实验所用PLSR本质上是一种线性算法(即光谱矩阵可以经历一系列线性变换,或者乘上一个或几个矩阵后得出质量浓度矩阵)[27],用以描述光谱与质量浓度间的换算关系;而在样品存在散射干扰的情况下二者间的线性关系会发生偏离使预测精度不佳[28]。表3的光谱预处理方法最终确定了MSC+SNV+Savitzky-Golay 55点平滑+一阶导数的预处理方式,能够最好地改善预测精度;然而MSC+SNV(有时要进一步结合导数光谱)是一种常用的消除散射因素干扰的预处理方式[21],加之出芽短梗霉发酵液黏稠、浑浊的直观特征,暗示了出芽短梗霉中存在散射效应,并干扰了光谱与浓度间的线性关系,从而增大了误差。因此,采用非线性算法改进定量模型,是一个努力方向。
液相色谱测量值的精度同样也会增大误差。如图1b所示,液相色谱值质量浓度需要对L-苹果酸峰求峰面积计算得出。然而由于发酵液是一种高度复杂的混合物,液相色谱不一定能完全将L-苹果酸的峰分离开,这种情况下算出峰面积会偏离实际,并进一步在聚苹果酸质量浓度液相色谱测量值中引入较大的系统误差。这很可能是导致本实验中诱变菌株组和单因素优化组样品的液相色谱、计算值间出现较大误差的原因。因此合适的液相色谱测量条件对于近红外建模的精度同样重要。
最后,本实验配对t检验的结论虽然表明近红外模型在单因素优化和诱变筛菌中的误差较大不能进行测量,但是可以在2 个计算值的偏差大于“最小差值”条件下,通过比较2 个计算值的大小实现比较的液相色谱测量值大小的目的,且能够排除因近红外模型的误差、波动导致的“假阳性”现象,证明了近红外模型在快速筛菌和组分优化技术的中的应用价值。
4 结 论
本实验首先联合使用i-PLSR法与mw-PLSR法,确定建模波段为5 638~6 024 cm-1;随后经一系列优化后依次使用MSC+SNV+Savitzky-Golay 55点平滑+一阶导数光谱+前5维因子PLSR建立定量模型,模型的校正集RMSEC为1.619,Rc为0.983 3,内部验证集RMSEP为1.553,Rp为0.970 0,外部验证集的RMSEP为1.378,Rp为0.992 4。结合统计分析的结果表明测量值与模型计算值间无显著差异,误差可以接受,模型稳定性良好,可用于对组分的测量。进一步验证模型在单因素培养基优化和诱变菌种筛选应用中的精度,并结合配对t检验的置信区间结果,证明了虽然在这这2 类应用中模型对聚苹果酸质量浓度的误差较大,但可以在模型计算值的差值分别满足大于3.19 g/L和1.436 g/L的前提下以95%的置信度比较出不同样品中聚苹果酸浓度大小,因此近红外模型有应用于诱变筛菌和培养基组分优化的价值。
参考文献:
[1] FERNANDEZ C E, MANCERA M, HOLLER E. High molecular weight methyl ester of microbial poly (β,L-malic acid) synthesis and crystallization[J]. Polymer, 2006, 47(19): 6501-6508. DOI:10.1016/j.polymer.2006.07.063.
[2] SHIMADA K, MATSUSHIMA K, FUKUMOTO J, et al. Poly-(L)-malic acid; a new protease inhibitor from Penicillium cyclopium[J].Biochemical & Biophysical Research Communications, 1969, 35(5):619-624. DOI:10.1016/0006-291x(69)90449-5.
[3] KAJIYAMA T, KOBAYASHI H, TAGUCHI T, et al. Improved synthesis with high yield and increased molecular weight of poly (α,βmalic acid) by direct polycondensation[J]. Biomacromolecules, 2004,5(1): 169-174. DOI:10.1016/j.ijnonlinmec.2007.04.002.
[4] NAGATA N, NAKAHARA T, TABUCHI T. Fermentation production of poly (β-malic acid) a polyelectrolyticbiopolyester by Aureobasidium sp.[J]. Bioscience, Biotechnology, and Biochemistry, 1993, 57(4):638-642. DOI:10.1271/bbb.57.638.
[5] LIU S J. Investigation of poly (L-malic acid) production by strains of Aureobasidium pullulans[J]. Applied Microbiology and Biotechnology,1996, 46(3): 273-278. DOI:10.1007/s0025300508.
[6] CAO W, LUO J, QI B, et al. β-Poly(L-malic acid) production by fedbatch culture of Aureobasidium pullulans ipe-1 with mixed sugars[J].Engineering in Life Sciences, 2014, 14(2): 180-189. DOI:10.1002/elsc.201200189.
[7] GOODBAN A E, STARK J B. Rapid method for determination of malic acid[J]. Analytical Chemistry, 1957, 29(2): 283-287.DOI:10.1021/ac60122a032.
[8] 王凤荣, 江建梅, 乔长晟, 等. 出芽短梗霉发酵液中聚苹果酸测定方法的比较[J]. 食品工业科技, 2010, 31(6): 347-349.
[9] 郑谊丰, 周华, 王丽燕, 等. 高效液相色谱法测定发酵液中聚苹果酸方法的建立[J]. 食品科技, 2010, 35(4): 243-246.
[10] 乔长晟, 姜少丽, 马正旺, 等. 反向高效液相色谱测定发酵液中的聚苹果酸[J]. 现代食品科技, 2012, 28(4): 453-455. DOI:10.3969/j.issn.1673-9078.2012.04.024
[11] 翁诗甫, 徐怡庄. 傅里叶变换红外光谱分析[M]. 北京: 化学工业出版社, 2015: 1-42.
[12] 董芹. 基于近红外光谱分析技术的透明质酸分子量及含量的快速检测研究[D]. 济南: 山东大学, 2011: 55-67.
[13] 张树明, 杨阳, 梁学军, 等. 葡萄酒发酵过程主要参数近红外光谱分析[J]. 农业机械学报, 2013, 44(1): 152-156. DOI:10.6041/j.issn.1000-1298.2013.01.029.
[14] 郭宇飞, 苏毅, 徐庆阳. 基于近红外检测技术建立发酵过程中L-色氨酸浓度预测模型[J]. 生物技术通讯, 2016, 27(3): 391-395.DOI:10.3969/j.issn.1009-0002.2016.03.020.
[15] LI M Y, EBEL B, CHAUCHARD F, et al. Parallel comparison of in situ Raman and NIR spectroscopies to simultaneously measure multiple variables toward real-time monitoring of CHO cell bioreactor cultures[J]. Biochemical Engineering Journal, 2018, 137: 205-213.DOI:10.1016/j.bej.2018.06.005.
[16] 乔长晟, 郝华旋, 姜少丽, 等. 紫外氦氖诱变选育高产聚苹果酸菌株[J]. 现代食品科技, 2011, 27(11): 1325-1327. DOI:10.3969/j.issn.1673-9078.2011.11.008.
[17] STEVENS A, RAMIREZ-LOPEZ L. An introduction to the prospectr package[EB/OL]. 2014-02-14[2018-10-20]. https://cran.r-project.org/web/p ... rospectr-intro.pdf.
[18] NORGAARD L, SAUDLAND A, WAGNER J, et al. Interval partial least-squares regression (iPLS): a comparative chemometric study with an example from near-infrared spectroscopy[J]. Applied Spectroscopy,2000, 54(3): 413-419. DOI:10.1366/0003702001949500.
[19] JIANG J H, BERRY R J, SIESLER H W, et al. Wavelength interval selection in multicomponent spectral analysis by moving window partial least-squares regression with applications to mid-infrared and near-infrared spectroscopic data[J]. Analytical Chemistry, 2002,74(14): 3555-3565. DOI:10.1021/ac011177u.
[20] 李航. 统计学习方法[M]. 北京: 清华大学出版社, 2012: 10-20.
[21] ÅSMUND R, BERG F V D, ENGELSEN S B. Review of the most common pre-processing techniques for near-infrared spectra[J]. Trends in Analytical Chemistry, 2009, 28(10): 1201-1222. DOI:10.1016/j.trac.2009.07.007.
[22] BJØRN-HELGE M, WEHRENS R. The PLS package: principal component and partial least squares regression in R[J]. Journal of Statistical Software, 2007, 18(2): 1-24.
[23] ZOU X, CHENG C, FENG J, et al. Biosynthesis of polymalic acid in fermentation: advances and prospects for industrial application[J].Critical Reviews in Biotechnology, 2019, 39(3): 408-421. DOI:10.108 0/07388551.2019.1571008.
[24] LI Y, CHI Z, WANG G Y, et al. Taxonomy of Aureobasidium spp. and biosynthesis and regulation of their extracellular polymers[J]. Critical Reviews in Microbiology, 2015, 41(2): 228-237. DOI:10.3109/104084 1X.2013.826176.
[25] 严衍禄, 赵龙莲, 韩东海, 等. 近红外光谱分析基础与应用[M]. 北京:中国轻工业出版社, 2005: 37-40; 190-195.
[26] 江南大学. 基于近红外光谱分析技术的青霉素发酵生产过程多模型监控系统: CN106645009A[P]. 2017-05-10.
[27] ROSIPAL R, KRÄMER N. Overview and recent advances in partial least squares[C]//International Statistical and Optimization Perspectives Workshop” Subspace, Latent Structure and Feature Selection”. Berlin: Springer, 2005: 34-51. DOI:10.1007/11752790_2.
[28] BERTRAN E, BLANCO M, MASPOCH S, et al. Handling intrinsic non-linearity in near-infrared reflectance spectroscopy[J].Chemometrics and Intelligent Laboratory Systems, 1999, 49(2): 215-224. DOI:10.1016/S0169-7439(99)00043-X.

Construction and Application of a Predictive Model for Determination of Polymalic Acid in the Fermentation Broth of Aureobasidium pullulans by Near-Infrared Spectroscopy
ZHANG Yinghao1, XUE Zhaoyang1, ZHAO Tingbin2, YIN Haisong3, QIAO Changsheng1,2,4,*
(1. College of Biotechnology, Tianjin University of Science & Technology, Tianjin 300457, China;2. Tianjin HuizhiBiotrans Biological Engineering Co. Ltd., Tianjin 300457, China;3. School of Bioengineering, Tianjin Modern Vocational Technology College, Tianjin 300350, China;4. Tianjin University-Enterprise Collaboration Innovation Laboratory of Food Green Manufacturing and Safety, Tianjin 300457, China)
Abstract: High performance liquid chromatography (HPLC) was used to measure the polymalic acid concentration in the fermentation broth of Aureobasidium pullulans. Interval partial least square regression (iPLSR) combined with moving window PLSR (MWPLSR) was used to confirm 5 638–6 024 cm-1 as the waveband for modeling. Multiplicative scatter correlation (MSC), standard normal variate (SNV), Savitzky-Golay 55 points smoothing and 1st derivative spectrum were successively operated as spectral pre-processing methods, and then PLSR with the first 5 factors was used to develop a predictive model with the highest accuracy. The root mean square of prediction (RMSEP) and correlation coefficient of prediction (Rp) of the model were 1.553 g/L and 0.970 0 for the internal test set, and 1.378 g/L and 0.992 4 for the external test set,respectively, and a paired t-test at 95% confidence level demonstrated that the maximum deviations between the HPLC values and the model predicted values were calculated as 1.48 and 0.83 g/L, respectively. There was no significant difference among three parallel predictions for one sample. When the model was applied to medium composition optimization and mutant screening,large prediction errors were found with paired t-test. However, the model could reliably predict polymalic acid concentration under the premise that the model calculated values were larger than 3.19 and 1.44 g/L, respectively, indicating the potential application of the near-infrared model in medium composition optimization and strain screening.
Keywords: near-infrared modeling; partial least square; polymalic acid; medium optimization; strain screening; paired t-test DOI:10.7506/spkx1002-6630-20190504-013

收稿日期:2019-05-04
基金项目:滨海-中关村知行卓越创新创业实验室建设项目(17YFCZZC00310);天津市食品绿色制造及安全校企协同创新实验室建设项目(17PTSYJC00080);工业微生物优良菌种选育与发酵技术公共服务平台项目(17PTGCCX00190)
第一作者简介:张英昊(1993—)(ORCID: 0000-0002-1826-5168),男,硕士,研究方向为发酵过程近红外检测。E-mail: zhangyinghao12321@163.com
*通信作者简介:乔长晟(1969—)(ORCID: 0000-0003-2058-3867),男,教授,博士,研究方向为发酵工程。E-mail: qiaochangsheng@163.com
中图分类号:O657.33;Q939.97
文献标志码:A
文章编号:1002-6630(2020)08-0152-07
引文格式:
张英昊, 薛照阳, 赵廷彬, 等. 出芽短梗霉发酵液中聚苹果酸定量近红外模型的建立与应用[J]. 食品科学, 2020, 41(8):152-158. DOI:10.7506/spkx1002-6630-20190504-013. http://www.spkx.net.cn
ZHANG Yinghao, XUE Zhaoyang, ZHAO Tingbin, et al. Construction and application of a predictive model for determination of polymalic acid in the fermentation broth of Aureobasidium pullulans by near-infrared spectroscopy[J].Food Science, 2020, 41(8): 152-158. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-20190504-013.http://www.spkx.net.cn




奥鹏易百网www.openhelp100.com专业提供网络教育各高校作业资源。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|www.openhelp100.com ( 冀ICP备19026749号-1 )

GMT+8, 2024-11-25 17:26

Powered by openhelp100 X3.5

Copyright © 2001-2024 5u.studio.

快速回复 返回顶部 返回列表