使用聚类分析和偏最小二乘法提高 NIR 多成分分析的精度

一、利用聚类分析和偏最小二乘法提高NIR多组分分析精度（论文文献综述）

佘瑶瑶^[1]（2021）在《湖北省虎杖资源初步调查及质量评价》文中指出目的:通过对湖北省内虎杖资源进行初步调查,了解省内虎杖野生资源的分布情况,调研省内栽培虎杖的种植面积与产量,了解省内市场需求量,为虎杖产业合理有序发展提供参考。同时,通过药材常规检查,建立指纹图谱,测定主要有效成分含量及检测药材重金属量,综合评价湖北省虎杖药材的质量,遴选优质种质资源。探讨主成分含量与颜色之间的相关性,建立测定水分和浸出物的定量模型用于药材相关指标的快速检测,旨在为虎杖药材质量评价提供新方法。方法:1.通过查阅文献,调查走访与实地考察初步调查湖北省内虎杖野生资源及栽培现状。2.通过测定水分、灰分、酸不溶性灰分及醇溶性浸出物的含量,对虎杖药材质量进行常规评价。3.通过建立虎杖HPLC指纹图谱,采用聚类分析、主成分分析、偏最小二乘法分析,评价虎杖药材的综合品质。4.通过ICP-MS、原子吸收光谱法测定虎杖药材及其生长土壤中的重金属含量,运用相关分析,进行虎杖药材和生长土壤的重金属安全性评价及分析虎杖对土壤中重金属的吸收特征。5.通过傅里叶变换近红外光谱仪结合偏最小二乘法（PLS）对校正集样品进行扫描、分析与建模,建立测定水分和浸出物的定量模型。6.通过色差仪对虎杖粉末进行色差值测定,与虎杖主要成分含量进行相关性分析。结果:1.虎杖野生资源在湖北省各地区均有分布,产地较为分散,主要分布于十堰、黄冈、恩施、宜昌等地,海拔5～1860米均有分布。目前湖北省虎杖栽培面积达4.78万亩,现每3年为一个采收期,可产干货5.74万吨,主要集中在十堰市房县、黄冈市英山县。其中以十堰房县栽培面积最大,达2.07万亩。湖北省两家虎杖提取物白藜芦醇加工企业虎杖干品年需求量2万吨,需求相对稳定,处于供需平衡状态。2.78批虎杖药材含水量和醇溶性浸出物含量达到药典标准。总灰分有16批药材超过限量值,7批酸不溶性灰分超过限量值。3.虎杖HPLC指纹图谱共标定了9个共有峰,经对照品比对指认了5个化合物,相似度在0.628～0.996,生长年限、采收时间及产地不同导致虎杖成分存在较大差异,偏最小二乘法分析结果显示,大黄素-8-β-O-D葡萄糖苷和白藜芦醇为虎杖野生品和栽培品的差异性化合物。4.36批虎杖土壤与虎杖药材重金属含量结果显示黄冈英山南河镇薛家畈村以及黄冈英山顾家农业虎杖样品中Cd含量超过0.3mg·kg-1,其他地区重金属含量均达标,统计分析结果表明虎杖对生长土壤中的Cd有较强的富集能力,在生产中应当引起重视。5.采用内部交叉检验法建立NIRS法快速测定虎杖中水分和醇溶性浸出物含量模型,水分和浸出物的内部交叉验证决定系数R2分别为90.88、96.15。对预测集进行外部验证,相关系数R分别为0.9910、0.9847。6.虎杖中3种蒽醌类成分与颜色指标值L*（代表颜色亮度）、E*ab（总色差值）存在极显着相关关系（P<0.01）,表明在一定程度上,L*和E*ab值越小,3种蒽醌类成分含量越高。结论:黄冈蕲春（YS-31）相似度仅为0.628,当遗传距离较大时,始终能单独聚为一类。1年生虎杖指纹图谱相似度较低,为0.671,聚类结果显示湖北省内虎杖多数栽培品和野生品聚为一类,说明野生品和栽培品整体差异不明显,偏最小二乘法显示大黄素-8-β-O-D葡萄糖苷和白藜芦醇含量存在显着差异,后续需进一步验证。不同产地虎杖药材存在较大差异,常规检查、指纹图谱综合得分、含量测定结果与药材重金属检测综合结果显示房县军店、荆州松滋、英山龙潭畈村等地所产虎杖质量较优,可作为初步筛选出的优质种源。虎杖种植过程中应当注意产地土壤中Cd含量的监控。利用近红外光谱技术结合化学计量法建立的模型,同时测定虎杖中水分和醇溶性浸出物的含量具有可行性,为虎杖及其制剂快速和无损质量控制提供了新的思路。通过色差仪测定虎杖粉末色差值,可以预测虎杖中3种蒽醌类成分的含量。

唐雪平^[2]（2020）在《基于化学分析与机器学习的铁观音茶叶品质评价体系》文中提出铁观音是中国十大名茶之一,是福建省重要支柱产业。目前铁观音品质评价方法主要为评茶师的人工评价,易受主观因素影响,制约了铁观音茶叶品牌和产业的进一步发展。机器学习（ML）是人工智能的核心,在寻找共同性、区分差异性方面具有传统分类技术难以比拟的优势,在分析技术领域已取得了良好的应用。论文利用气相色谱（GC-MS）、液相色谱（HPLC）和近红外光谱（NIRS）检测技术对铁观音茶样的挥发性成分和甲醇可溶性成分进行检测、分析,再结合机器学习建立模型对铁观音等级品质进行评价。（1）采用GC-MS法对茶样中挥发性成分进行定性、定量分析,并利用余旋夹角、K值聚类、系统聚类和机器学习算法对挥发性特征成分进行分析和建模。结果表明:茶样中共检测出40种挥发性成分,其中不同产区茶样中含量较高的三种成分均为橙花叔醇、α-法尼烯、吲哚,其含量分别为28.8-35.0%、23.7-33.2%和8.4-11.2%;各产区的茶样中挥发性成分在种类和含量存在明显差异。利用余弦夹角法分析不同级别茶样的相似度,发现茶样中共有挥发性成分的相似度随着茶叶等级的降低而降低。数据预处理后,通过K-近邻分类算法（KNN）、自适应提升算法（Adaboost）、极端梯度提升算法（XGBoost）、随机森林算法（RF）、梯度提升树算法（GBDT）、支持向量机算法（SVM）六种机器学习算法对挥发性特征成分进行分析、建模,GCMS-XGBoost算法模型分级效果最优,平均精确率（mAP）为84.4%,确定系数（R2）为0.800,曲线下面积（AUC）为0.782。GCMS-XGBoost算法模型精确率（84.4%）明显高于系统聚类分析（77.2%）和K值聚类分析（78.2%）,具备可实际应用的分级精确率和可靠性。（2）利用HPLC法测定铁观音甲醇提取液中的表没食子儿茶素（EGC）、表儿茶素（EC）、咖啡因（Caffeine）、没食子儿茶素（GC）、茶氨酸（L-Theanine）、表没食子儿茶素没食子酸酯（EGCG）等10种代表性成分的含量,并利用主成分分析法和机器学习对液相特征成分进行分析和建模。结果表明:各等级茶样中EGCG、Caffeine和EGC三种成分含量均明显高于其它成分的含量;不同等级茶样中的EGC、EGCG、Caffeine、EC、GCG和ECG含量均存在三级>一级>二级的规律。HPLC数据经主成分分析法分级的结果与评茶师分级匹配度为83.51%-93.23%,mAP为87.9%,表明所选用的化学组分能够较好地对茶叶品质进行评价。HPLC数据经均值归一化（Norm）法预处理后分别输入XGBoost等六种机器学习算法,发现HPLC-XGBoost算法模型性能最优,模型的mAP为98.9%、R2为0.963、AUC为0.905,模型ROC曲线和PR曲线优异。可见,HPLC-XGBoost模型精确率远高于经典的主成分分析法,可准确地评价铁观音质量等级。（3）用NIRS法对铁观音茶样进行检测,运用标准正态变量变换（SNV）预处理方法对数据进行预处理后,再分别进行自动编码器（AutoEcoder）、主成分分析（PCA）和多层自适应模块化神经网络（HAMNN）降维处理筛选最优的降维方法,最后采用XGBoost等六种机器学习算法建立铁观音近红外光谱-机器学习的品质评价模型。结果显示:六种预处理方法中,SNV法数据预处理效果最佳;HAMNN降维方案优于AutoEcoder和PCA;近红外光谱-机器学习法建模时,NIRS-XGBoost模型分级效果最佳,模型的mAP 95.2%,R2为0.901,AUC值为0.925,模型ROC曲线和PR曲线优异。可见NIRS-XGBoost模型可以准确预测铁观音的等级品质。（4）GC-MS、HPLC和NIRS法检测结合机器学习算法所建立的铁观音品质评价模型相比较,虽然性能指标有一定的差异,但均能较好地评价铁观音的品质。其中,HPLC-XGBoost模型具有最高mAP（98.9%）和R2（0.963）,NIRS-XGBoost模型有较高的mAP（95.2%）和最高的AUC值（0.925）。HPLC-XGBoost和NIRS-XGBoost模型综合性能相当,各项指标均高于GC-MS法所构建模型。GC-MS和HPLC法检测每个样品分别为约250 min和200 min,耗时较长且HPLC法需引入有机溶剂,但可以获得决定茶叶品质的相应化学成分的有关信息,可实现茶样的定性、定量评价,这两者结合机器学习所建立的品质评价体系适用于茶叶生产工艺改进与科研的需要。NIRS法检测每个样品约40 min,耗时短且无需使用有机试剂,方便快捷,但检测结果为光谱数据,不能直接提供与茶叶品质相对应的化学成分信息。NIRS法结合机器学习所建立的评价方法准确、便捷,可满足生产和市场交易环节中快速评价的需要。

季凡凡^[3]（2020）在《基于近红外光检测发酵过程多组分的联合建模方法》文中指出近红外光谱技术具有分析速度快、测量准确性高、测量方式多等优点,现已在国内外多个工程领域得到越来越多的应用。生物乙醇作为新能源的一种,对当今世界的发展越来越重要。生物发酵是生产乙醇的一种重要方式,然而现有乙醇发酵过程主要采用离线检测方式,具有不准确、耗时长等缺点。因此实现在线检测具有重要意义。本文首先介绍应用近红外光谱技术测量生物发酵过程组分参数的主要步骤以及现有的一些光谱预处理方法,包括经典的建模方法如偏最小二乘法（PLS）和偏稳健M回归（PRM）方法,以及模型评价指标如相关系数R2、预测集均方根误差（RMSEP）和范围误差比（RPD）。对于在线检测乙醇发酵过程底物浓度、产物浓度以及生物量,提出一种近红外光谱联合标定建模方法。通过分析乙醇发酵过程中底物浓度、产物浓度以及生物量之间的关联性,给出基于组分偶联性的联合建模方法。此外,采用PRM方法对乙醇发酵过程各组分分别进行单组分建模。采用模型评价参数指标对这两种建模方法进行比较。实验结果表明,相较于单组分建模方法,联合建模方法不仅可以提高建模效率,而且具有更好的预测效果。对于味精生产工艺中的谷氨酸发酵过程,设计一种基于近红外光谱仪的离线测量方案和生产车间在线检测实验平台。考虑到谷氨酸发酵过程中底物葡萄糖、产物谷氨酸以及酵母菌之间具有关联性,采用联合标定建模方法进行光谱建模,并且提出一种基于粒子群优化（PSO）算法的模型参数寻优方法,可以明显提高模型预测精度。实验结果验证所提出方法的可行性和优点。

汪洋^[4]（2020）在《双峰驼乳常规营养成分检测与NIR快速检测模型建立》文中指出双峰驼乳营养丰富,脂肪、乳糖和总干物质显着高于牛乳,尤其降血糖与辅助治疗糖尿病的功效被发现以来,越来越受到关注与重视,并逐步得到产业化开发。品质和安全检测监督势在必行,但目前尚无专用于双峰驼乳常规营养成分的近红外（NIR）快速检测模型。从内蒙古乌海、阿拉善左旗和呼伦贝尔鄂温克旗共采集双峰驼乳153份用于建模研究,同时采集荷斯坦牛奶28份,从广西南宁市采集水牛奶40份,用于通用模型研究评价。所有乳样按国标法测定脂肪、乳糖、蛋白质、水分和灰分五种常规营养素,并用一款台式傅里叶变换研究型近红外（台式NIR）光谱仪和一款微型便携式近红外（微型NIR）光谱仪扫描乳样品,采集乳样的NIR漫透射光谱。用化学计量学软件Unscrambler10.5进行光谱的选择截取及转换等预处理,然后以偏最小二乘法（PLS）拟合校正乳样化学值和预处理后的NIR光谱,建立五种常规营养素近红外（NIR）光谱预测模型。根据模型内部验证参数:模型决定系数（R2）和内部交叉验证均方差（RMSECV）选择最优模型,再根据模型外部验证参数:外部预测均方根误差（RMSEP）、相对分析误差（RPD）和相对标准偏差（RSD）评价模型的稳定性和预测能力。对牛、水牛和双峰驼乳建立的五种常规营养素通用模型的R2都能达0.9以上,但RPD都小于2.5,模型可用于预测,但不够准确,有必要对双峰驼乳的常规营养素建立专用预测模型。台式近红外（NIR）光谱模型R2、RMSECV、RMSEP、RPD和RSD%最优参数分别如下:脂肪 0.9646、0.2036、0.1759、4.3206 和 3.37%;乳糖 0.9223、0.1403、0.1056、3.3568 和 2.09%;蛋白质 0.9999、0.2010、0.0955、5.0387 和 2.66%;水分 0.9952、0.1510、0.1121、12.8670 和 0.21%;灰分 0.9337、0.0202、0.0075、3.1642和0.85%,R2都大于0.92以上,RPD均大于3,预测能力稳定准确。各脂肪、乳糖、蛋白质、水分和灰分最优模型的NIR光谱对应前处理方式分别为SNV、MSC、二阶导、SNV和MSC+SNV。微型近红外（NIR）光谱模型R2均大于0.9,RPD均大于2.4但小于3,模型预测准确度不如台式NIR光谱仪,但现场应用可行。

徐琢频^[5]（2020）在《作物单籽粒近红外快速无损检测的模型转移方法研究》文中认为近红外光谱（Near Infrared Spectroscopy,NIRS）是一种快速无损分析技术。利用近红外通量化分选作物籽粒,有望提高农产品品质、提高作物育种效率、并推进植物表型组发展。建立一个好的单粒作物近红外校正模型需要投入较多的时间、人力和物力。然而,各种来自仪器、测量环境、以及样品方面的变化都可能影响预测结果,使得模型不再适用。所以,提高模型在不同条件下的准确性和适用性是近红外应用中亟待解决的问题。利用模型转移可以校正上述差异,使模型标准化。本论文旨在发展新的模型转移方法提高单粒作物近红外分析时模型的通用性、准确性,促进近红外在粮食生产和作物育种上的推广。主要研究结果包括:一、基于斜率截距法（Slope Bias Correction,SBC）的多种光谱平台间模型转移的评价分析。基于一种经典的、广泛使用的SBC算法,以两组形态和成分分布理想的样品（尿素颗粒、淀粉颗粒）和两组未经加工的自然状态样品（两组单粒水稻）为对象,研究它们的NIR模型在三种具有不同特点的光谱平台间的转移。结果表明,采用SBC能够准确校正理想状态样品模型在NIR平台间的转移,其转移结果（RMSEP（Root Mean Square Error of Prediction,预测均方根误差）为2.86至15.4）接近甚至优于原平台建模结果（RMSECV（Root Mean Square Errorof Cross Validation,交叉验证均方根误差）为1.49至10.8）;但对单粒水稻模型在NIR平台间转移的校正效果较差。因此,需要开发新的算法校正单粒作物光谱分析时的差异,改善模型转移效果。二、提出一种优化定量模型转移的基于相关分析的波长选择方法（Correlation Analysis based Wavelength Selection,CAWS）。该方法基于相关分析评价和筛选两组仪器间响应一致且稳定的波段来改善模型的转移效果。以一组公开的玉米数据集和一组真实检测的米糠数据集为对象,在不同预处理和模型转移算法条件下,通过和其他波长选择方法的比较,介绍了该方法的使用并验证其优越性。结果表明,采用CAWS处理后的两批数据集的最优模型均比其他波长选择方法在相同条件下的RMSEP更低。其中,经过CAWS优化后的玉米模型在转移时的RMSEP为0.070,较前人报道的相同数据集的分析结果（RMSEP）更好,后者为0.1519和0.098。因此,该方法可有效提高定量模型在转移时的准确性,有望推广应用于单粒作物定量模型的转移上。三、提出一种改善定性模型转移的基于CAWS优化的的波长选择方法。此方法在CAWS算法基础上,引入马修斯相关系数（Matthews Correlation Coefficient,MCC）作为波长选择的评价标准,以达到改善定性模型转移效果的目的。通过对公开的药片数据集、真实检测的小麦籽粒和玉米籽粒数据集的光谱分析,以及不同处理下转移结果的比较,验证了该方法的优越性。CAWS优化后的药片、小麦、玉米数据集转移后的MCC值是所有处理中最高、次高和最高的,分别为0.987,0.717和1。结果表明,该方法能够有效提高单粒作物定性模型转移时的判别正确率。四、基于光谱空间转换（Spectral Space Transformation,SST）的自然状态样品和理想状态样品间的模型转移。该方法通过将具有自然状态的单粒水稻样品的光谱用SST算法转化为去除了颖壳干扰的自然状态（单粒糙米）、以及形状成分均匀一致的理想状态（米粉）的光谱,并使用相应状态样品模型（单粒糙米模型以及米粉模型）进行预测的方式,提高单粒水稻NIR分析结果的准确性。结果表明,将单粒水稻光谱转移成糙米和米粉光谱后的预测结果分别接近（RMSEP=0.480）和优于（RMSEP=0.401）直接分析单粒水稻光谱的结果（RMSEP=0.423）。因此,该方法能够一定程度校正单粒水稻理化状态差异对光谱分析的干扰,提高模型的通用性和准确性。该方法有望应用于其他单粒作物的近红外分析上。

宋悦^[6]（2020）在《基于近红外光谱分析技术的纺织物纤维成分检测方法研究》文中研究表明在我国的经济产业结构中纺织工业占据着重要的地位,在促进我国经济发展的同时也对国民生活质量产生重要影响。随着纺织工业的快速发展,纺织品的送检需求也逐年激增,其中纺织品纤维成分的检测是织物检测中的重点项目,然而目前常用的检测手段效率低、操作难度高,难以满足当前庞大的检测需求,需要提出一种精确、检测效率高的织物成分检测方法。近红外光谱分析技术检测精度高、检测速度快捷且不损伤样品,目前在化学分析领域被广泛运用。本文以棉涤二组分纺织物为研究对象,进行了近红外光谱分析技术在织物成分定量分析领域的相关研究,主要内容包括:1.研究了近红外光谱分析技术的原理与特点,分析了近红外技术当前的研究情况和在织物领域的应用,结合其技术原理验证了织物纤维成分近红外分析的可行性,为本研究提供了理论基础。2.设计了织物样本的近红外数据采集实验,测得所有样品的光谱数据后利用相关预处理方法对光谱进行处理,并利用处理后的光谱数据集建立偏最小二乘校正模型,最终实现了织物棉成分的初步预测。3.分析了两种特征优化算法,并利用两种优化方法对光谱数据进行特征波长提取,其中连续投影算法提取的特征波长个数为17,粒子群算法为48,两种方法均能有效地提取特征波长,降低建模的计算量;利用两种特征波长分别进行偏最小二乘建模（SPA-PLS和PSO-PLS）,并与全谱段模型的结果进行对比,优化后模型性能明显优于全谱模型。结果表明,优化算法可有效提取光谱数据中的特征变量,降低模型建立的计算量,提高模型预测的精确性。4.针对粒子群优化算法提取的特征较多的问题,引入变化的惯性权值进行进一步研究,提出三种权值变化函数并同样对织物光谱数据进行优化,最终发现几种方法的结果相近,验证了固定权值的粒子群算法实现了特征提取而未陷入局部最优;联合连续投影算法和粒子群算法对光谱数据进行特征提取,最终的特征变量数虽然降低但预测模型性能反而下降。

陈丽冰^[7]（2020）在《丹参川芎嗪注射液及其中间体的质量一致性评价方法研究》文中研究指明为了提高中药质量一致性,完善中药中间体及制剂的质量评价方法,本研究以丹参川芎嗪注射液及其中间体为研究对象,利用传统质量分析手段、近红外（Near-Infrared,NIR）光谱技术及多变量统计工具建立制剂及其中间体的质量一致性评价方法,完善丹参川芎嗪注射液现有质量评价要求,为生产过程中的质量控制提供参考。本研究的主要内容及学术成果如下:1.建立中间体丹参提取液的高效液相色谱-紫外（High Performance Liquid Chromatography-Ultraviolet,HPLC-UV）指纹图谱分析方法,并对其中7种指标成分5-羟甲基糠醛（5-hydroxymethylfurfural,5-HMF）、丹参素（danshensu,DSS）、原儿茶醛（protocatechualdehyde,PA）、迷迭香酸（rosmarinic acid,RA）、紫草酸（lithospermic acid,LA）、丹酚酸B（salvianolic acid B,SAB）、丹酚酸A（salvianolic acid A,SAA）进行定量分析。完成指纹图谱及定量分析方法的方法学验证,并利用建立的分析方法对30批丹参提取液的指纹图谱及指标含量进行分析,从指纹图谱相似度及指标含量两个角度评价丹参提取液的批次一致性。2.采用主成分分析法（Principal Component Analysis,PCA）对石硫上清液质量进行一致性评价。利用工厂样本7种指标含量建立PCA模型,以工厂稀释样本、实验室制备样本以及异常样本为监测对象,借助异常监测指标Hotelling’s T2和DModX考察模型的质量一致性评价能力。结果表明该方法能准确监测样本异常,有效评价石硫上清液质量。另外,与传统控制图表达形式不同,此次研究将Hotelling’s T2和DModX两个统计量进行结合表示,在一张图中同时描述两个统计量的异常监测情况,提高了异常监测效率,为石硫上清液的质量一致性评价提供了参考。3.建立石硫上清液7种指标的NIR定量分析模型。结合连续投影法（Successive Projections Algorithm,SPA）、竞争性自适应加权采样法（Competitive Adaptive Reweighted Sampling,CARS）、区间偏最小二乘法（Interval PLS,iPLS）及协同间隔偏最小二乘算法（Synergy Interval PLS,siPLS）四种波段选择算法,比较研究溶液和冻干粉两种体系光谱的建模效果。模型结果显示,以冻干粉光谱结合CARS波段选择算法建立的定量模型性能较好,预测均方根误差（Root Mean Square Error of Prediction,RMSEP）较低,R2cal与R2pre均达到0.950以上,表现出较高的预测精度。石硫上清液NIR定量模型的建立为进一步实现质量一致性快速评价奠定了基础。4.建立基于多元全局性分析指标的一致性评价方法,并对关键质控指标进行识别。利用糖类化合物、药效物质酚酸类化合物和无机盐等18个指标对制剂质量一致性进行评价,并与传统HPLC-UV指纹图谱评价结果相比较。结果表明,基于多元全局性分析指标的一致性评价方法比传统指纹图谱评价方法更全面、有效。并利用PCA中的载荷图识别筛选出Na+、果糖（fructose,Fru）、葡萄糖（glucose,Glc）、甘露三糖（manninotriose,Man）、丹参素和丹酚酸B等6个关键质控指标。关键质控指标的识别能够为注射剂的质量控制提供参考,提高质控效率。

蒋薇薇^[8]（2020）在《基于集成学习的有机物红外光谱定量回归方法研究》文中进行了进一步梳理傅里叶变换红外光谱（Fourier Transform Infrared Spectroscopy,FTIR）技术已在农业、工业、食品、环境、制药等各个领域的定量分析中得到了广泛的应用。定量分析是红外光谱分析领域的核心问题之一,红外光谱定量分析是利用已获取的红外光谱及其对应的物理化学特征建立定量分析模型,并通过此模型对未知光谱对应的特征进行估计的一种方法。FTIR红外光谱结合化学计量学方法进行定量分析的过程中,异常样本的存在会显着降低模型的稳定性和预测精度;完整光谱中的噪声、无信息变量以及干扰波长会増加模型复杂度,影响模型的预测性能;此外,近年来深度学习算法的发展为红外光谱定量模型的建立提供了新的思路。本文针对以上几个问题开展了深入研究,完成的主要研究工作和成果总结如下:1)提出了一种改进蒙特卡洛采样的MCCV法识别异常样本。针对蒙特卡洛交叉验证（Monte Carlo Cross Validation,MCCV）均值-方差图法识别异常样本的过程中以等概率选取所有样本进入建模子集,以及采用经验值法设置阈值等问题,通过改变蒙特卡洛随机采样的样本集范围,保证仅正常样本作为建模子集,从而提高异常样本的识别率,同时对改进蒙特卡洛采样的MCCV法筛选出的可疑异常样本进行二次筛选,减少对正常样本的误判率。实验结果验证了改进蒙特卡洛采样的MCCV法的有效性。2)提出了一种移动窗口改进MCUVE-SPA的波长选择算法。针对蒙特卡洛无信息变量消除（Monte Carlo-Uninformative Variable Elimination,MC-UVE）串联连续投影算法（Successive Projections Algorithm,SPA）可能会造成孤立的波长点,利用分子光谱中的大多有效波长具有一定的连续性,使用移动窗口以优选的波长点为起点或中心改进算法,保留有效波长点的连续性,从而改善算法预测模型的精度。实验结果验证了该算法的有效性。3)提出了相关系数-组合区间偏最小二乘法（Correlation Coefficient-Si PLS,CC-Si PLS）。针对组合区间偏最小二乘（Synergy Interval PLS,Si PLS）算法不考虑区间内与组分信息无关的变量的缺点,首先优选出与目标组分信息相关度较高的波长变量,然后再将优选出的波长变量利用Si PLS进行组合区间变量的选择,进一步简化预测模型。实验结果验证了算法的有效性。4)针对光谱预处理对波长选择算法结果的影响进行研究。实验分析了5种预处理方法对波长选择结果的分布情况及所建模型预测情况的影响,结果表明不同的预处理方式和波长选择算法对选择波长的分布及建模效果均有影响。5)提出了一种基于Blending集成学习算法的红外光谱定量回归模型。针对深度学习在红外光谱定量分析领域应用较少,利用梯度提升决策树（Gradient Boosting Decision Tree,GBDT）、线性核函数支持向量机和高斯核函数支持向量机作为基学习器,将GDBT特征与支持向量机特征进行融合,并将其预测结果与GBDT模型和单核支持向量回归模型预测结果进行分析和对比。实验结果表明,集成学习Blending模型用于红外光谱定量回归具有较强的适用性、较高的预测精度和泛化能力。

王笛^[9]（2019）在《基于近红外光谱分析技术的智能烟叶品质检测和产地识别方法研究》文中研究指明近红外光谱分析技术是一种高效快速的现代分析技术,是融合了光谱技术、信息学、化学计量学和计算机技术的一门交叉学科。它以红外通信系统为基础,完成对红外信号的发射和接收,以分子结构理论为依据,将近红外区的光谱吸收带和有机物中的高能分子基团相关联,运用数学和信息学的研究方法,通过智能信息处理技术实现对近红外光谱的分析。它具有操作简单、无损检测和多组分同时检测等优点,能够快速地对待测样品的光学信号进行分析,获得样品的属性和内部品质参数等信息。在实际工程应用中,烟叶的化学成分含量和产地是衡量烤烟品质和进行配方设计的关键指标,传统的分析方法费时费力,具有一定的局限性,难以满足现代化烟草行业智能化发展的需求,近年来近红外光谱分析技术已经得到该领域学者的广泛关注。基于近红外光谱分析技术的烟叶内部品质检测和产地识别的分析方法主要通过对相应数据建立数学模型实现的,然而,目前对这种建模分析的研究较少,现有模型的准确性、稳健性和预测效率离实际应用还有一定差距。近红外光谱分析技术的难点主要体现在以下几个方面:数据中背景信息的干扰、敏感波长的选择、严重的谱峰重叠、复杂的内部特征信息和训练模型过程的极度耗时等。因此,基于近红外光谱分析技术的烟叶品质检测和产地识别建模方法的研究,是实际工程应用和科学研究方法的交汇点,具有实践应用和学术研究的双重意义。本文根据实际应用需求,在对国内外相关技术和理论的深入学习和大量调研的基础上,针对以上建模分析中的共性问题,对基于近红外光谱分析技术的烟叶品质检测和产地识别方法进行深入研究,运用智能信息处理技术进行数据挖掘,以期提高数学模型的准确性、鲁棒性和高效性。本文的研究内容和成果有:（1）针对光谱数据中的噪声降低模型预测性能的问题,提出基于噪声因子的最小角回归（NF-LAR）烟叶品质检测模型。该模型基于对有效微弱信号采集的层面上,将噪声因子作为一种惩罚手段,通过光谱各波长点的噪声大小来制约对应波长点特征被选取的优先级,同时,采用小波变换对数据进行去噪、主成分分析（PCA）法对数据进行特征提取和降维,并采用最小绝对收缩和选择算子算法稀疏回归系数。实验结果表明NF-LAR模型能够很好地处理含噪数据,提高了模型的准确性和鲁棒性。（2）针对敏感波长的选择影响模型预测性能的问题,对本文中高维小样本数据建立了基于遗传算法的支持向量机（GA-SVM）烟叶产地识别模型。该模型基于对有效微弱信号捕获的层面上,采用仿生算法对输入变量进行最佳优化组合,同时,采用Savitzky-Golay卷积平滑和PCA技术对数据进行预处理,用网格搜索法进行参数寻优。实验结果表明GA-SVM模型能提取出和烟叶产地相关的敏感波长,具有更好的识别性能。（3）针对谱峰重叠严重、内部特征信息复杂而影响模型预测性能的问题,提出了基于权重优化的卷积神经网络模型（GDSV-CNN）烟叶产地识别模型。该模型基于对光谱特征描述的层面上,采用深度网络挖掘光谱数据内部不显着的特征信息,建立烟叶产地和光谱特征的复杂映射关系,通过对网络各层权重进行特定方差的高斯分布（GDSV）初始化,避免训练网络过程中出现梯度消失或爆炸现象,加快了模型的收敛速度,进一步提升了模型的识别性能。同时,算法中采用了批量标准化、L2正则化和dropout技术避免了过拟合现象。实验结果表明本文提出的GDSV-CNN模型具备很强的复杂特征提取能力,具有更好的鲁棒性,也说明深度网络模型更适合对海量数据的信息挖掘和分析。（4）针对深度网络对海量数据训练极度耗时问题和因新增样本数据而重新训练网络导致的耗时问题,提出了基于Takagi-Sugeno的模糊宽度学习系统（TS-FBLS）烟叶产地识别模型。该模型基于对光谱信息分析效率的层面上,通过TS模糊子系统对原始数据进行推理并自适应提取有效特征,采用伪逆计算和增量式学习方式加快模型的训练速度。实验结果表明,本文提出的TS-FBLS不仅具有更高的预测精度,而且在训练速度上占有极大的优势,有效地弥补了深度学习和重新训练网络的耗时问题。

曲江北^[10]（2020）在《基于紫外-可见连续光谱对农村污水处理出水COD在线监测方法的研究》文中提出随着社会经济的发展以及人民生活水平的提高,人类对于水环境的状况也越来越关注和重视。在农村区域,农村污水并没有得到有效的处理并且存在不达标排放,对环境的整洁和人体的健康造成了极大的危害。目前农村开始普遍采用分散式处理的模式,逐渐形成了污水处理设施规模小、位置分散、数量众多的特点。因此,需要结合农村自身的经济、环境状况,寻求一种经济、高效的水质COD实时在线监测方法来保障农村污水的达标排放。紫外-可见光谱法,作为一种快速、廉价、无二次污染的监测方法,逐渐被应用于水质COD的监测,但其在实际应用中的监测效果并不理想。因此,本文将以实际农村污水处理设施出水为研究对象,旨在提高紫外-可见光谱法COD监测模型的预测精确度和稳定性,实现有效应用。论文的主要研究内容包括:（1）在紫外-可见光谱法的理论基础上,选择若干种具有代表性物质进行实验配水,分别配置不同浓度的单组分溶液、双组分溶液以及多组分溶液。通过实验研究验证了水样在紫外-可见光区域的吸光度与溶液COD浓度之间具有良好的相关性,证明了紫外-可见光谱法水质COD预测方法的可行性,为文章后续的研究奠定基础。（2）以实际农村污水处理设施出水为研究对象,采用正态分布检验、主成分分析、聚类分析对水样的COD浓度及光谱数据进行检验,分别利用偏最小二乘法、支持向量机、BP-神经网络算法对紫外-可见光谱法水质COD预测模型进行构建,通过对模型预测结果的比较分析得出偏最小二乘法建模最合适,所构建的模型相关系数R2为0.931,均方根误差RMSE为11.6。（3）针对紫外-可见光谱法水质预测模型构建过程中光谱数据存在信息冗余的情况,采用波段筛选、逐步回归等方法进行特征波长筛选。在保证模型精度的前提下简化建模过程,最优波长的筛选结果为251nm、356nm和363nm,所构建的多元线性回归模型相关系数R2为0.924。（4）采用三维荧光光谱区域积分法对水样中的各类组分进行定量分析,并利用聚类分析对水样进行识别分类。最后分别对每一类水样的数据构建水质COD预测模型,极大提高了模型的预测精确度,最优预测模型相关系数R2高达0.994。（5）开发了基于紫外-可见光谱的水质COD在线监测设备,完成了总体架构设计、硬件设备的选择和集成、软件的安装调试。采用实际污水对水质在线监测设备进行性能测试,预测结果的相对误差在10%以内、重复性RSD低于3.48%。

二、利用聚类分析和偏最小二乘法提高NIR多组分分析精度（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、利用聚类分析和偏最小二乘法提高NIR多组分分析精度（论文提纲范文）

（1）湖北省虎杖资源初步调查及质量评价（论文提纲范文）

摘要

Abstract

缩略词表

前言

第一章湖北省虎杖资源初步调查

1.虎杖在湖北省内的资源分布调查

2.结果

2.1 湖北省内虎杖野生资源分布现状

2.2 湖北省内虎杖栽培现状及市场需求

3 小结

第二章虎杖药材的常规检查

1 仪器与试药

2 方法与结果

2.1 水分测定

2.2 总灰分、酸不溶性灰分测定。

2.3 醇溶性浸出物测定

3 小结

第三章虎杖HPLC指纹图谱建立及湖北省虎杖样品含量测定

1 仪器与试剂

2 方法与结果

2.1 提取溶剂选择

2.2 检测波长选择

2.3 色谱条件

2.4 溶液的制备

2.5 指纹图谱研究方法学考察

2.6 虎杖指纹图谱构建及相似度评价

2.7 有效成分的含量测定

2.8 基于化学计量学方法的虎杖药材分析与比较

3 小结

第四章虎杖药材重金属含量及其生长土壤重金属相关性分析

1 仪器与试剂

2 方法与结果

2.1 土壤重金属测定方法

2.2 虎杖药材中重金属含量测定方法

2.3 土壤重金属环境质量评价

2.4 药材重金属质量评价

2.5 虎杖对重金属的吸收特征

3 小结

第五章近红外光谱法测定虎杖中水分和醇溶性浸出物

1 仪器及试药

2 方法

2.1 水分测定

2.2 醇溶性浸出物测定

2.3 近红外光谱采集

3 实验结果

3.1 校正集和验证集样品的选择

3.2 NIR校正模型

3.3 模型验证

4 结论与讨论

第六章基于色差原理分析虎杖有效成分含量与颜色值的相关性

1 仪器与试剂

2 方法与结果

2.1 虎杖样品中5种有效成分含量测定

2.2 虎杖样品色泽测定

2.3 相关性分析

2.4 回归分析

3 讨论

结语

1.主要研究成果

2.创新

3.展望

参考文献

附录

附录一

1.文献综述虎杖本草考证及品质研究进展

2.综述参考文献

附录二

附录三

致谢

（2）基于化学分析与机器学习的铁观音茶叶品质评价体系（论文提纲范文）

摘要

Abstract

主要符号对照表

第1章绪论

1.1 铁观音的概述

1.1.1 铁观音的主要产区

1.1.2 铁观音的制作工艺与分类

1.1.3 铁观音的组成与功效

1.2 茶品质的评价方法

1.2.1 感官评价法

1.2.2 化学评价法

1.2.3 电子鼻评价法

1.2.4 电子舌评价技术

1.2.5 其他评价技术

1.3 近红外光谱技术

1.3.1 近红外光谱技术概述

1.3.2 近红外光谱技术在茶叶评价中的应用

1.4 品质评价中的机器学习方法

1.4.1 机器学习方法简介

1.4.2 食品品质评价中常用的机器学习方法

1.5 研究意义和内容

1.5.1 研究意义

1.5.2 研究内容

第2章基于GC-MS指纹图谱构建铁观音茶叶品质评价体系

2.1 实验材料和仪器

2.1.1 主要仪器与设备

2.1.2 实验材料

2.2 实验方法

2.2.1 茶样的前处理和萃取头前处理

2.2.2 茶样挥发性成分的萃取

2.2.3 GC-MS条件

2.2.4 GC-MS数据处理和分析

2.2.5 基于GCMS-ML技术的铁观音品质评价建模方法

2.3 结果与讨论

2.3.1 不同茶产区的挥发性成分组成

2.3.2 相似度计算和峰重叠率的计算

2.3.3 聚类分析对茶叶品质进行评价

2.3.4 基于GCMS-ML的茶叶品质分级机器学习模型构建

2.4 小结

第3章基于HPLC指纹图谱构建铁观音茶叶品质评价体系

3.1 实验材料和仪器

3.1.1 试剂

3.1.2 主要仪器与设备

3.1.3 茶叶样品

3.2 实验方法

3.2.1 拟检测的主要成分

3.2.2 标准品溶液配制

3.2.3 色谱条件

3.2.4 样品前处理

3.2.5 数据处理和分析

3.2.6 基于HPLC-机器学习方法的茶叶品质分级模型建立

3.3 结果与讨论

3.3.1 检测方法

3.3.2 不同产地和等级茶样中可溶性成分的含量

3.3.3 茶样液相组分的主成分分析

3.3.4 基于HPLC-ML方法的茶叶品质评价模型的建立

3.4 小结

第4章 NIRS法构建铁观音茶叶品质评价模型

4.1 实验材料和仪器

4.1.1 材料与试剂

4.1.2 主要仪器与设备

4.2 数据分析与建模方法

4.3 实验过程数据与结果讨论

4.3.1 红外光谱的采集最佳条件

4.3.2 NIRS光谱特征和预处理

4.3.3 近红外光谱特征降维

4.3.4 参数优化策略

4.3.5 近红外光谱数据建模结果分析

4.4 小结

第5章基于不同机器学习算法的评价模型的比较

5.1 模型综合性能评价

5.2 三种数据采集操作对比

5.3 NIRS-ML模型用于在线分析的可能性

5.4 小结

第6章总结与展望

6.1 主要结论

6.2 项目创新之处

6.3 展望

参考文献

致谢

附表A

附表B

附表C

附表D

附表E

附图F

个人简历、在学期间发表的学术论文及研究成果

附件

（3）基于近红外光检测发酵过程多组分的联合建模方法（论文提纲范文）

摘要

Abstract

1 绪论

1.1 研究背景

1.1.1 生物发酵工程简介

1.1.2 近红外光谱检测技术

1.2 国内外研究现状

1.3 课题的主要研究内容与意义

1.4 论文组织结构

2 近红外光谱检测原理与常用方法介绍

2.1 近红外光谱技术检测原理

2.2 光谱预处理方法

2.3 偏最小二乘法

2.3.1 偏最小二乘法标定建模

2.3.2 模型因子数的选择

2.4 偏稳健M回归

2.5 模型评价方法

2.6 本章小结

3 基于MLS-SVR乙醇发酵过程多组分联合标定建模方法

3.1 乙醇发酵过程简介

3.2 实验设计与实验方法

3.3 乙醇发酵过程在线监测实验方案

3.4 实验数据采集

3.5 多组分联合建模方法概述与建模效果对比分析

3.5.1 基于MLS-SVR的联合标定建模方法

3.5.2 独立标定建模与联合标定建模预测结果对比与参数分析

3.6 本章小结

4 味精发酵过程多组分联合建模方法

4.1 味精发酵过程简介

4.2 实验方案与数据采集

4.3 基于粒子群算法的联合标定建模方法

4.3.1 粒子群算法原理

4.3.2 改进的粒子群算法

4.4 结果与分析

4.5 本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

（4）双峰驼乳常规营养成分检测与NIR快速检测模型建立（论文提纲范文）

摘要

Abstract

1 引言

1.1 双峰驼乳

1.2 近红外光谱技术

1.2.1 近红外光谱技术原理

1.2.2 近红外光谱技术的优点与缺点

1.2.3 光谱具体测量方式与光程的选择

1.3 近红外光谱技术与化学计量学

1.4 近红外光谱技术在食品中的应用

1.4.1 近红外光谱技术在乳与乳制品中的应用

1.4.2 近红外光谱技术在粮食中的应用

1.4.3 近红外光谱技术在肉制品中的应用

1.4.4 近红外光谱技术在其它食品中的应用

1.4.5 研究目的及意义

2 材料和方法

2.1 实验材料

2.1.1 乳样信息

2.1.2 实验药品

2.1.3 仪器设备

2.2 实验方法

2.2.1 模型建立优化路线

2.2.2 常规营养素的测定

2.2.3 NIR光谱扫描

2.2.4 数据的整理和统计

2.3 模型的建立与优化

2.3.1 光谱区间的选择

2.3.2 光谱的预处理

2.3.3 选择预处理方式

2.3.4 异常样品的判别

2.3.5 计算异常样本

2.3.6 PLS模型的建立

2.3.7 模型评判参数

2.4 模型的建立

2.4.1 主因子数的选择

2.4.2 剔除异常值

2.4.3 模型的选择

2.5 建立通用乳及特种乳模型

3 结果与分析

3.1 五种常规营养素化学值

3.1.1 营养素化学值正态性检验

3.1.2 营养素化学值描述性统计

3.1.3 三种家畜乳的NIR通用模型

3.2 双峰驼乳NIR快速检测模型

3.2.1 双峰驼乳台式近红外(NIR)快速检测模型的建立

3.2.2 双峰驼乳微型NIR光谱仪快速检测模型的建立

4 讨论

4.1 通用乳模型的建立

4.2 双峰驼乳模型的建立

4.2.1 SPSS分析

4.2.2 台式近红外光谱仪模型

4.2.3 微型近红外光谱仪模型

4.3 本研究的不足

4.3.1 样本量

4.3.2 光谱预处理

4.3.3 建模方法

5 结论

致谢

参考文献

作者简介

（5）作物单籽粒近红外快速无损检测的模型转移方法研究（论文提纲范文）

摘要

ABSTRACT

第1章绪论

1.1 选题背景及意义

1.1.1 选题背景

1.1.2 选题意义

1.2 文献综述及研究进展

1.2.1 近红外光谱技术

1.2.2 近红外光谱的基本原理

1.2.3 近红外光谱仪器

1.2.4 近红外光谱分析的流程

1.2.5 光谱预处理方法

1.2.6 光谱的变量选择

1.2.7 奇异样本的剔除

1.2.8 多元校正模型

1.2.9 近红外定量模型的评价

1.2.10 近红外定性模型的评价

1.2.11 化学计量学方法的进展

1.2.12 近红外光谱应用的进展

1.2.13 作物单籽粒近红外快速无损分析

1.2.14 作物单籽粒近红外分析的进展

1.2.15 作物单籽粒近红外分析的瓶颈

1.2.16 模型转移

1.2.17 经典的模型转移方法

1.2.18 新的模型转移方法

1.2.19 模型转移的应用进展

1.3 本文研究内容

1.4 研究方法、技术路线和论文结构安排

第2章基于斜率截距法的多种光谱平台间模型转移的评价分析

2.1 引言

2.2 材料和方法

2.2.1 样本集

2.2.2 光谱采集

2.2.3 单粒水稻直链淀粉和蛋白质的微量分析

2.2.4 模型构建

2.2.5 模型转移

2.3 结果与讨论

2.3.1 三种平台采集的光谱

2.3.2 化学值检测结果

2.3.3 三种近红外平台上模型的交叉验证

2.3.4 三种近红外平台间的模型转移

2.4 本章小结

第3章一种用于定量模型转移的基于相关分析的波长选择方法

3.1 引言

3.2 材料和方法

3.2.1 基于相关分析的波长选择法

3.2.2 样本和处理

3.2.3 数据分析

3.3 结果与讨论

3.3.1 两组数据集的模型转移结果

3.3.2 CAWS和siPLS选择波长的比较

3.3.3 不同波长的模型转移结果

3.3.4 两个数据集结果的比较

3.4 本章小结

第4章一种用于定性模型转移的基于CAWS优化的波长选择方法

4.1 引言

4.2 材料和方法

4.2.1 基于相关分析的波长选择法的优化

4.2.2 基于稳定一致波长选择的模型转移算法

4.2.3 数据集和处理

4.2.4 化学计量学处理

4.3 结果与讨论

4.3.1 模型校正结果

4.3.2 模型的转移结果

4.3.3 三组样本集波段选择的比较

4.3.4 三组样本集的转移结果的比较

4.4 本章小结

第5章基于光谱空间转换的自然状态样品和理想状态样品间的模型转移

5.1 引言

5.2 材料和方法

5.2.1 单粒水稻蛋白质光谱分析的两种方法

5.2.2 样品制备

5.2.3 样品预处理和光谱采集

5.2.4 单粒水稻蛋白质含量的微量分析

5.2.5 光谱空间转换

5.2.6 多元校正

5.3 结果与讨论

5.3.1 单粒水稻的蛋白质含量分布

5.3.2 三种形态的水稻样品的原始光谱

5.3.3 模型优化

5.3.4 水稻的光谱空间转换

5.3.5 单粒水稻蛋白质含量模型的外部验证结果

5.3.6 单粒糙米和米粉的蛋白质含量模型的外部验证结果

5.4 本章小结

第6章结论与展望

6.1 研究结论

6.2 研究展望

参考文献

附录

致谢

在读期间发表的学术论文与取得的其他研究成果

（6）基于近红外光谱分析技术的纺织物纤维成分检测方法研究（论文提纲范文）

摘要

abstract

第一章绪论

1.1 研究背景与意义

1.2 近红外光谱分析技术的特点

1.3 近红外光谱仪及光谱分析方法的研究现状

1.3.1 用于织物纤维检测的近红外光谱仪

1.3.2 近红外光谱分析技术在纺织领域的研究现状

1.3.2.1 纺织纤维的定性鉴别

1.3.2.2 纺织纤维的定量预测

1.4 本文的内容概述

第二章近红外光谱分析技术

2.1 近红外光谱分析技术的原理

2.1.1 近红外光谱技术的测量原理

2.1.2 固体样品近红外光谱分析的原理

2.2 近红外光谱分析技术中的化学计量学方法

2.2.1 化学计量学方法的概述

2.2.2 光谱数据的预处理

2.2.2.1 光谱增强方法

2.2.2.2 光谱数据平滑

2.2.2.3 求导

2.2.2.4 多元散射校正

2.2.3 特征光谱筛选

2.2.4 数学建模方法

2.2.4.1 多元线性回归法

2.2.4.2 偏最小二乘法

2.3 数学模型的评价标准

2.4 本章小结

第三章预测模型的建立与分析

3.1 实验设计

3.1.1 实验样品与仪器

3.1.2 数据采集

3.2 织物光谱数据的预处理研究

3.2.1 预处理方法的选择

3.2.2 奇异纺织样品的剔除

3.2.3 划分训练集和预测集

3.3 偏最小二乘回归模型的建立

3.4 本章小结

第四章优选算法在织物近红外定量分析中的研究

4.1 连续投影算法对光谱数据的优化研究

4.1.1 连续投影算法的原理

4.1.2 连续投影算法优化的结果

4.2 粒子群算法对光谱数据的优化研究

4.2.1 粒子群算法的原理

4.2.2 粒子群算法用于特征光谱筛选

4.2.3 粒子群算法优化的结果

4.3 结果分析

4.4 本章小结

第五章粒子群算法用于织物近红外光谱分析的改进研究

5.1 粒子群算法惯性权值的改进

5.1.1 惯性权值的改进内容

5.1.2 惯性权值改进方案的结果

5.2 粒子群算法结合连续投影算法用于光谱优化的研究

5.2.1 联合优化方案的内容

5.2.2 联合优化方案的结果

5.3 本章小结

第六章总结与展望

6.1 工作总结

6.2 未来展望

参考文献

攻读硕士期间发表的论文及所获得研究成果

致谢

（7）丹参川芎嗪注射液及其中间体的质量一致性评价方法研究（论文提纲范文）

致谢

摘要

Abstract

缩略语

1 绪论

1.1 研究背景

1.2 中药质量评价手段

1.3 近红外光谱定量模型建立

1.4 丹参川芎嗪注射液质量研究进展

1.5 研究思路与内容

2 中间体丹参提取液的指纹图谱分析及多指标含量测定

2.1 引言

2.2 实验部分

2.2.1 仪器与试剂

2.2.2 实验方法

2.2.3 数据处理

2.3 结果与讨论

2.3.1 指纹图谱方法学验证

2.3.2 指纹图谱的建立

2.3.3 定量分析方法学验证

2.3.4 丹参提取液含量分析结果

2.4 小结

3 石硫上清液质量一致性评价

3.1 引言

3.2 实验部分

3.2.1 仪器与试剂

3.2.2 实验方法

3.2.3 数据处理

3.3 结果与讨论

3.3.1 PCA模型结果

3.3.2 样本指标含量组成讨论

3.3.3 Hotelling's T2和DModX的结合表示图

3.4 小结

4 石硫上清液七种指标成分的近红外定量模型建立

4.1 引言

4.2 实验部分

4.2.1 仪器与试剂

4.2.2 实验方法

4.2.3 数据处理

4.3 结果与讨论

4.3.1 光谱采集

4.3.2 光谱预处理

4.3.3 样本划分

4.3.4 定量模型的建立

4.3.5 指标不同体系光谱波段选择结果讨论

4.4 小结

5 基于多元全局性分析指标的一致性评价

5.1 引言

5.2 实验部分

5.2.1 仪器与试剂

5.2.2 实验方法

5.2.3 数据处理

5.3 结果与讨论

5.3.1 方法学验证

5.3.2 大分子杂质检测分析结果

5.3.3 糖类分析结果

5.3.4 酚酸类化合物含量测定和指纹图谱一致性评价

5.3.5 无机盐离子分析结果

5.3.6 多元统计分析

5.3.7 关键指标识别

5.4 总结

6 总结与展望

参考文献

作者简历

（8）基于集成学习的有机物红外光谱定量回归方法研究（论文提纲范文）

致谢

摘要

abstract

第一章绪论

1.1 研究背景及选题意义

1.1.1 有机化合物定量检测

1.1.2 分子红外吸收光谱技术

1.1.3 FTIR分析技术

1.2 国内外研究现状

1.3 课题来源与主要研究内容

1.3.1 课题来源

1.3.2 本文主要研究内容

第二章傅里叶变换红外光谱分析技术

2.1 引言

2.2 傅里叶变换红外光谱学

2.2.1 FTIR 光谱仪工作原理

2.2.2 干涉图和光谱图

2.2.3 朗伯比尔定律

2.2.4 红外吸收数据库

2.3 光谱预处理

2.3.1 常用的光谱预处理方法

2.3.2 基于小波变换的预处理方法

2.4 化学计量学方法

2.4.1 异常样本识别方法

2.4.2 校正集选取

2.4.3 波长选择算法

2.4.4 定量回归方法

2.5 实测数据采集

2.6 模型评价标准

2.7 本章小结

第三章基于模型集群策略的奇异样本识别

3.1 引言

3.2 算法与理论基础

3.2.1 蒙特卡洛法

3.2.2 蒙特卡洛交叉验证法

3.2.3 标准化残差

3.3 改进蒙特卡洛采样法剔除异常样本

3.3.1 标准归一化

3.3.2 改进蒙特卡洛采样

3.3.3 疑似奇异样本二次检测

3.4 实验数据

3.4.1 Hawkins-Bradu-Kass数据

3.4.2 药片数据

3.4.3 玉米数据

3.5 Hawkins-Bradu-Kass数据集实验

3.6 药片光谱实验

3.6.1 最佳主成分数

3.6.2 奇异样本的识别

3.6.3 建模与分析

3.7 玉米光谱实验

3.7.1 异常样本诊断及预测结果比较

3.7.2 预测集异常样本分析

3.8 本章小结

第四章基于串联策略的波长选择算法

4.1 引言

4.2 常用波长选择算法存在的问题

4.3 实验数据

4.3.1 玉米数据

4.3.2 柴油光谱数据

4.3.3 实测乙烯(C2H4)气体

4.4 移动窗口改进的MCUVE-SPA波长选择算法

4.4.1 MC-UVE

4.4.2 SPA

4.4.3 MCUVE-SPA-MW算法和原理

4.5 MCUVE-SPA-MW实验及分析

4.5.1 玉米光谱实验

4.5.2 柴油光谱实验

4.5.3 实测气体光谱实验

4.5.4 结果与讨论

4.6 串联策略改进SiPLS波长选择算法

4.6.1 算法介绍

4.6.2 玉米光谱实验

4.6.3 柴油光谱实验

4.6.4 结果与讨论

4.7 本章小结

第五章预处理方法对波长选择算法的影响

5.1 引言

5.2 常见光谱预处理方法

5.3 实验及结果

5.3.1 实验数据

5.3.2 玉米光谱实验

5.3.3 柴油光谱实验

5.3.4 结果与讨论

5.4 本章小结

第六章基于集成学习算法的定量回归模型

6.1 引言

6.2 集成学习算法理论

6.2.1 梯度提升决策树算法

6.2.2 支持向量回归

6.2.3 基于Blending集成学习的定量回归算法

6.3 实验数据

6.4 实验及分析

6.4.1 药片光谱实验

6.4.2 柴油光谱实验

6.4.3 结果与讨论

6.5 本章小结

第七章总结与展望

7.1 总结

7.2 研究展望

参考文献

攻读博士学位期间的学术活动及成果情况

（9）基于近红外光谱分析技术的智能烟叶品质检测和产地识别方法研究（论文提纲范文）

中文摘要

英文摘要

符号表

缩写词表

1 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 主要研究内容和贡献

2 近红外光谱的分析方法

2.1 引言

2.2 近红外光谱概述

2.2.1 近红外光谱分析技术的原理和特点

2.2.2 近红外光谱分析技术基础

2.3 近红外光谱仪实验平台

2.3.1 近红外光谱仪的构成和原理

2.3.2 数据采集

2.4 智能信息处理技术

2.5 近红外光谱中的分析方法

2.5.1 信号预处理方法

2.5.2 矩阵变换方法

2.5.3 回归分析方法

2.5.4 模式识别算法

2.5.5 智能优化算法

2.6 近红外光谱分析建立数学模型的核心技术

2.7 定量分析和定性分析模型性能评价指标

2.7.1 定量分析模型性能评价指标

2.7.2 定性分析模型性能评价指标

2.8 本章小结

3 基于噪声因子的最小角回归烟叶品质检测模型

3.1 引言

3.2 模型的建立

3.2.1 基于线性回归的偏最小二乘法

3.2.2 基于非线性回归的最小二乘支持向量机

3.2.3 基于Lasso的最小角回归

3.3 基于噪声因子的最小角回归方法

3.3.1 改进原因

3.3.2 噪声尺度的计算方法

3.3.3 基于噪声因子的LAR算法过程

3.4 实验数据的获取

3.5 近红外数据的预处理

3.5.1 异常值剔除

3.5.2 小波变换去噪

3.5.3 主成分分析法降维

3.6 实验结果与讨论

3.6.1 烟叶近红外光谱的特点

3.6.2 烟叶化学成分含量值的统计分析

3.6.3 改进前后模型在预测精度方面的对比分析

3.6.4 改进前后模型在运算效率方面的对比分析

3.6.5 改进前后模型在可解释性方面的对比分析

3.7 本章小结

4 基于遗传算法的支持向量机烟叶产地识别模型

4.1 引言

4.2 支持向量机

4.2.1 支持向量机中的核函数

4.2.2 支持向量机多分类的实现思想

4.3 数据来源

4.4 数据的预处理

4.4.1 主成分分析降维及其效果

4.4.2 SG平滑去噪及其效果

4.5 支持向量机中参数的选择

4.5.1 核函数的选择

4.5.2 模型参数的选择

4.6 基于遗传算法的SVM优化方法

4.7 GA-SVM参数的设定

4.7.1 种群大小的设定

4.7.2 交叉和变异概率的确定

4.8 遗传算法对主成分个数的选择

4.9 GA-SVM模型的评估

4.10 本章小结

5 基于权重优化的卷积神经网络烟叶产地识别模型

5.1 引言

5.2 卷积神经网络

5.2.1 卷积层

5.2.2 池化层

5.2.3 批量标准化

5.2.4 分类器和损失函数

5.2.5 激活函数

5.2.6 Dropout技术

5.3 基于权重优化的卷积神经网络

5.3.1 改进原因

5.3.2 改进方法的公式推导

5.4 数据来源

5.5 卷积神经网络中参数的设定和选择

5.5.1 卷积神经网络模型中学习率的设定

5.5.2 卷积神经网络层数的设定

5.5.3 激活函数的选择

5.6 实验结果及分析

5.6.1 改进前后模型的实验结果对比

5.6.2 改进后模型的性能评价指标结果

5.6.3 改进后模型与其它分类模型的识别性能对比

5.7 本章小结

6 基于TS的模糊宽度学习系统烟叶产地识别模型

6.1 引言

6.2 宽度学习系统

6.2.1 特征节点

6.2.2 增强节点

6.2.3 求伪逆及增量学习

6.3 基于Takagi-Sugeno的模糊宽度学习系统

6.3.1 改进原因

6.3.2 改进方法

6.4 实验结果及分析

6.4.1 网络输入节点数量的选择

6.4.2 增量学习的实验结果及分析

6.4.3 改进前后模型的实验结果对比

6.4.4 模型在训练时间上的优势

6.5 本章小结

7 总结和展望

7.1 工作总结

7.2 工作展望

参考文献

附录

A 攻读博士期间发表的论文

B 攻读博士期间参与的科研项目

C 学位论文数据集

致谢

（10）基于紫外-可见连续光谱对农村污水处理出水COD在线监测方法的研究（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 农村污水处理排放现状

1.2 COD监测方法的国内外研究现状及分析

1.2.1 COD在线监测方法

1.2.2 紫外-可见光谱法COD监测方法的现状分析

1.3 主要研究内容

1.3.1 研究背景及意义

1.3.2 研究内容

1.3.3 技术路线图

第二章典型有机组分的吸收光谱特征

2.1 紫外-可见光谱理论基础

2.1.1 分子吸收光谱原理

2.1.2 朗伯-比尔定律

2.1.3 紫外-可见光谱法基本原理

2.2 不同组分的吸收光谱特征

2.2.1 实验方案

2.2.2 单组分水样

2.2.3 双组分水样

2.2.4 多组分水样

2.3 本章小结

第三章紫外-可见连续光谱COD预测模型的构建

3.1 材料与方法

3.1.1 研究区域及样本采集

3.1.2 水质指标测定

3.1.3 紫外-可见光谱法数据分析方法

3.1.4 紫外-可见光谱法建模方法

3.2 水质常规指标分析

3.3 光谱法模型构建

3.3.1 数据检验及异常值剔除

3.3.2 数据预处理

3.3.3 统计学方法建模

3.3.4 机器学习建模

3.3.5 模型评价

3.4 本章小结

第四章基于特征波长筛选的模型简化方法

4.1 材料与方法

4.1.1 数据的来源

4.1.2 特征波段筛选方法介绍

4.1.3 特征波长筛选方法介绍

4.1.4 相关性分析

4.2 特征波段筛选

4.3 特征波长筛选

4.4 本章小结

第五章基于三维荧光光谱的分类建模方法

5.1 三维荧光微观机制

5.2 材料与方法

5.2.1 研究区域及样品采集

5.2.2 实验器材

5.2.3 三维荧光光谱数据的预处理方法

5.2.4 聚类分析

5.2.5 实验方案

5.3 光谱数据处理

5.4 水样分类及建模

5.5 本章小结

第六章光谱法水质COD在线监测设备的开发

6.1 在线监测设备硬件设计

6.1.1 光谱仪系统的设计

6.1.2 PLC系统

6.1.3 显示屏

6.2 在线监测设备软件设计

6.2.1 水样光谱数据的采集、处理

6.2.2 水质预测模型的嵌入、运算

6.2.3 数据的显示、储存、远程传输

6.3 在线监测设备性能测试

6.3.1 性能要求

6.3.2 性能指标

6.3.3 测试结果

6.4 本章小结

第七章结论与展望

7.1 结论

7.2 创新点

7.3 建议与展望

参考文献

致谢

攻读硕士学位期间已发表或录用的论文

四、利用聚类分析和偏最小二乘法提高NIR多组分分析精度（论文参考文献）

[1]湖北省虎杖资源初步调查及质量评价[D]. 佘瑶瑶. 湖北中医药大学, 2021(09)
[2]基于化学分析与机器学习的铁观音茶叶品质评价体系[D]. 唐雪平. 华侨大学, 2020(01)
[3]基于近红外光检测发酵过程多组分的联合建模方法[D]. 季凡凡. 大连理工大学, 2020(02)
[4]双峰驼乳常规营养成分检测与NIR快速检测模型建立[D]. 汪洋. 内蒙古农业大学, 2020(02)
[5]作物单籽粒近红外快速无损检测的模型转移方法研究[D]. 徐琢频. 中国科学技术大学, 2020(01)
[6]基于近红外光谱分析技术的纺织物纤维成分检测方法研究[D]. 宋悦. 中北大学, 2020(09)
[7]丹参川芎嗪注射液及其中间体的质量一致性评价方法研究[D]. 陈丽冰. 浙江大学, 2020(11)
[8]基于集成学习的有机物红外光谱定量回归方法研究[D]. 蒋薇薇. 合肥工业大学, 2020(01)
[9]基于近红外光谱分析技术的智能烟叶品质检测和产地识别方法研究[D]. 王笛. 重庆大学, 2019(01)
[10]基于紫外-可见连续光谱对农村污水处理出水COD在线监测方法的研究[D]. 曲江北. 上海交通大学, 2020(01)

标签：聚类分析论文; 成分分析论文; 近红外光谱论文; 预测模型论文; 建模软件论文;

使用聚类分析和偏最小二乘法提高 NIR 多成分分析的精度

一、利用聚类分析和偏最小二乘法提高NIR多组分分析精度（论文文献综述）

二、利用聚类分析和偏最小二乘法提高NIR多组分分析精度（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、利用聚类分析和偏最小二乘法提高NIR多组分分析精度（论文提纲范文）

（1）湖北省虎杖资源初步调查及质量评价（论文提纲范文）

（2）基于化学分析与机器学习的铁观音茶叶品质评价体系（论文提纲范文）

（3）基于近红外光检测发酵过程多组分的联合建模方法（论文提纲范文）

（4）双峰驼乳常规营养成分检测与NIR快速检测模型建立（论文提纲范文）

（5）作物单籽粒近红外快速无损检测的模型转移方法研究（论文提纲范文）

（6）基于近红外光谱分析技术的纺织物纤维成分检测方法研究（论文提纲范文）

（7）丹参川芎嗪注射液及其中间体的质量一致性评价方法研究（论文提纲范文）

（8）基于集成学习的有机物红外光谱定量回归方法研究（论文提纲范文）

（9）基于近红外光谱分析技术的智能烟叶品质检测和产地识别方法研究（论文提纲范文）

（10）基于紫外-可见连续光谱对农村污水处理出水COD在线监测方法的研究（论文提纲范文）

四、利用聚类分析和偏最小二乘法提高NIR多组分分析精度（论文参考文献）

猜你喜欢