一、数据挖掘及其在电厂中的应用(论文文献综述)
谷小兵,李建强,蒋志容,徐贤,陶君[1](2021)在《基于划分关联规则的脱硫塔运行优化》文中认为如今火电厂广泛应用的脱硫技术之一是湿法脱硫,其脱硫装置耗电量较大,极大地降低了电厂的经济效益。为了提高经济效益降低脱硫电耗,选取1个月的电厂历史运行数据,采用基于模块划分的关联规则算法对某电厂脱硫系统(4台定频泵、1台变频泵)参数进行挖掘。挖掘目标为4种不同负荷下浆液循环泵最优组合,最佳pH值及运行液位。分别得到pH和液位的最佳运行值为5.3±0.2,10.78 m以及A、B、C、D 4个负荷模块下的泵的优化组合。优化后A、B模块每小时可节约电费分别为674,182元,C、D模块可节约耗电费用836元。该算法挖掘得到的运行优化工况库满足电厂运行要求,具有实际可行性,可为电厂脱硫运行提供一定的参考依据。
杨光辉,封均康[2](2021)在《基于改进IAA算法的网络入侵数据挖掘仿真》文中研究说明采用目前方法挖掘网络入侵数据时未考虑数据之间的关联规则,导致网络入侵数据挖掘过程的检测时间长、检测效率低、误报效率高。提出基于改进Apriori算法的网络入侵数据挖掘方法,利用改进后的Apriori算法产生网络入侵数据之间的关联规则,依据产生的关联规则对网络入侵数据进行特征抽取,最后将抽取出的特征放入贝叶斯数据分类器中进行数据分类,实现网络入侵数据挖掘。实验表明,基于改进的Apriori算法在网络入侵数据挖掘过程中的挖掘时间短、检测效率高、误报效率低,具有一定的应用性。
朱晴[3](2020)在《融合关联规则挖掘算法的信息化教学管理系统设计》文中提出为提升高校教学管理的水平与效率,设计融合关联规则挖掘算法的信息化教学管理系统。该系统的关键组成部分为客户端、服务器和数据库,客户端和服务器分别负责面向用户的交互功能呈现和系统应用程序的逻辑运行,系统通过创建涵盖教学管理不同方面数据的数据库体系,采用改进关联规则挖掘算法,从系统数据库内挖掘用户各方面教育信息关联数据,并通过客户端主界面为用户提供教学、选课、课程等服务。以某高校信息平台为例测试该系统性能,结果表明,该系统能够实现课程查询功能,客户端兼容性较好,能够应用于各类浏览器及操作系统内,应用性较强,且具有良好的数据挖掘性能。
徐樾,彭道刚,赵慧荣,孙宇贞[4](2020)在《基于改进Apriori关联规则与SKohonen网络的制粉系统性能优化研究》文中认为对于目前电厂历史运行数据库高维度、大容量,挖掘效率低,算法占用较多的计算资源等问题,基于350 MW机组制粉系统历史稳态运行数据库,提出了基于目标制导的改进Apriori关联规则挖掘算法,利用目标制导方式对数据库进行降维和压缩,进一步通过改进Apriori算法将数据库矩阵转储为有效项坐标数组,挖掘制粉系统给煤机速率、排烟含氧量、排烟温度和一次风量等参数,以原煤单位净发电量为经济评价,获得了优化参数下全工况的制粉系统最优参数值。研究表明:对于中低负荷段,通过减少磨煤机运行台数和增加磨煤机出力,可以有效减少煤耗、一次风量和氮氧化物排放;单耗实验验证,参数优化后磨煤机单耗明显下降,能够有效降低厂用电率。
莫荣超[5](2020)在《基于数据挖掘的火电机组运行经济性研究》文中指出运行优化是当前火电机组节能减排的主要研究方向,既保证机组生产安全同时也是提高经济运行的重要手段。目前火电机组最优工况的关键和难点在于如何确定目标值、运行优化操作指导等。随着智能电厂的兴建、云存储技术的普及应用,电力大数据应运而生。大数据是21世纪计算机领域的研究热点,它包含关联分析、统计分析、模型预测等先进技术,数据挖掘能够提取蕴含知识规律的隐藏信息。火电厂管理信息系统(MIS)中存储着大量机组历史运行数据,数据挖掘能够发现其中蕴含的最优工况,对提高火电机组经济性运行具有重要指导意义。然而随着机组智能化和用电量增长,MIS存储的数据也越来越大,使得传统的数据挖掘算法无法胜任运算性能需求,云计算的出现正好解决了这个难题。本文以机组实际运行数据为基础,采用云计算与数据挖掘相结合的方法来分析火电大数据用以指导机组经济性运行。对电站运行优化中机组能耗损失、目标值的确定、经济性指标、云计算平台的搭建等几个方面进行分析研究,采用基于云计算的并行聚类算法,该算法拥有更高的计算效率。首先对云计算平台Hadoop及其子构架Map Reduce(分布式计算框架)与HDFS(分布式文件系统)进行分析与研究,用3台计算机搭建实验平台,为数据挖掘的底层实现提供了基础。然后根据数据挖掘技术,介绍了模糊C均值聚类(FCM)算法的原理与应用,将粗糙集理论(Rough集)与FCM算法相结合形成新算法,称为RFCM算法,利用粗糙集的属性约简对数据进行降维,实现数据挖掘过程中的数据预处理。最后在云计算平台上运行RFCM算法,将某1000MW机组历史运行数据应用到云计算平台下进行聚类分析,实验挖掘出最优工况点,并验证了算法的高效性,为火电机组运行经济性提供了依据。
苏鸣[6](2020)在《基于改进关联规则算法的空气质量数据关联性研究》文中认为近年来,随着我国经济建设和社会生产力的快速发展,空气污染已经成为大众和政府特别关注的重要话题。利用日趋成熟的数据挖掘手段,通过关联性理论方法,从空气质量数据中挖掘有价值的隐藏信息,通过分析,得到隐含在海量数据中的关联规则,对空气环境治理决策的制定具有重要意义。基于频繁模式增长(FP-growth)算法思想提出的关联规则算法,存在建树过程复杂,计算支持度繁琐的问题,导致挖掘效率较低。为此,论文提出了一种改进的关联规则算法BCLARM算法,该算法对FP-Tree进行了改进,提出了位编码链表(BC-List)结构,加快了频繁项集的挖掘速度。为了提升算法处理海量数据的能力,将BCLARM算法在Spark平台上进行了实现。最后,研究将该算法用于挖掘空气质量指标间关联性,分析产生空气污染的原因,为空气环境治理策略的制定提供理论依据。论文主要工作内容如下:(1)提出一种基于位编码链表的关联规则算法,用来解决FP-Growth算法存在的建树复杂,挖掘效率不足的问题。算法首先采用基于位图表示的节点编码模型生成位图树(BC-Tree),以BC-Tree的节点信息作为数据结构通过按位运算来快速获取BC-List的节点集,避免了复杂的交集运算,提高了连接效率;其次通过使用超集等价和支持度计数剪枝策略,缩小了挖掘频繁模式的搜索空间。实验证明,该算法相比于FIN算法和DFIN算法具有更快的挖掘速度。(2)针对海量的数据,提出基于Spark平台的的F-BCLFARM算法,该算法使用了一种基于负载均衡的分组策略,用来对BCLFARM算法在Spark平台上的实现进行分组优化,用来达到提升挖掘效率的目的。通过实验,证明了F-BCLFARM算法在并行效果、可扩展性和运行时间上均有良好的表现,并且在处理稀疏数据集和稠密数据集时均具备较高的挖掘效率。(3)将改进的基于Spark分布式平台的F-BCLFARM算法运用于挖掘影响空气污染的空气质量指标之间的关联关系。从监测采集设备中获取每小时空气质量与气象数据,进行数据处理及离散化,并录入数据库。利用论文提出的F-BCLFARM算法挖掘处理后的数据,产生关联规则,分析关联规则并根据结果推测产生空气污染的原因,为空气环境治理提供决策支持。
许玲[7](2019)在《改进的K-means算法研究与实现》文中提出初始中心和相似性度量方法的选择都会影响K-means算法精准程度,论文研究的目的是引入新的相似性度量方法和初始中心参数选择技术,从而提高算法的准确度。论文研究内容及方法如下:首先,论文引入密度极小值理论,基于密度参数的基础上,利用欧氏距离计算数据集的密度参数,获取所有的密度参数之后,获取K个中心,如果数据对象A到K个中心具有相同的距离,此时排序簇中数据对象到A的密度距离,选择最小的密度距离并将A归至对应的类中,这就可以使数据对象与邻近的数据对象变得更加紧凑,表明数据对象与邻近对象密度更高,能够更加准确的反映数据集内部的分布式结构关系。其次,论文引入互信息作为相似性度量方法,可以利用互信息评估数据对象之间互相包含的程度,适用于模糊度较高的文档数据以及上下文信息包含量较大的应用场景,比如在文本聚类中,如果两篇文章同属于一个簇,这两片文档的特征词含量一般重叠的较多,因此可以更加准确的发现数据集潜在的结构。论文实验结果表明,引入密度极小值设置初始中心,可以提高K-means算法的准确度;利用互信息改进K-means算法的相似性度量,改进后的K-means算法能够较准确描述数据对象之间的关系,反映数据集的内部结构分布特征,提高数据聚类的稳定性和准确性。改进的K-means算法应用于文本文档聚类过程中,与传统的K-means算法相比,可以提高文本聚类的准确度,能够提高网络文本聚类效果。
胡世昌[8](2019)在《Apriori算法的研究与改进》文中进行了进一步梳理本文系统的研究了Apriori算法和FP-growth算法。针对Apriori算法在挖掘频繁项集时需要多次扫描数据库进行频繁的IO操作而导致挖掘效率低下的缺点,提出了Node-Apriori(Node based Apriori)算法。该算法通过两个方面提高Apriori算法的执行效率。其一是通过二进制编码的方式编码项集和事务记录,有效的减少了项集和事务记录内存的占用,并通过利用等效的二进制数之间运算代替集合之间的运算有效的提高了运算的执行效率。其二是通过节点的方式组织候选项集,可以减少统计候选项集需要遍历的事务记录的数量。但是Node-Apriori算法仍然优缺点,由于采用的是广度优先搜索的方式搜索频繁项集,这样会导致在挖掘完频繁k-项集的时候,同级节点较多,并且同级节点中每个节点包含的事务记录是可能重复的,这样仍然会对内存占用有一定的需求。针对这个缺点,提出了Tree-Apriori(Tree based Apriori)算法,该算法利用FP-Tree的方式组织事务记录,每个节点都代表一棵子树,通过对树中节点进行合并和更新的操作就可以完成频繁项集的挖掘。通过实验验证了算法Tree-Apriori的执行效率是远远好于Node-Apriori算法和Apriori算法的。本文找到了Apriori和FP-growth的联系。Tree-Apriori是Node-Apriori的一种实现,但是在时间和空间上都是远优异于Node-Apriori算法的。并且,Tree-Apriori算法和FP-growth算法总的实现框架相似,Apriori算法和FP-growth算法在根本上是联系的。因为最近食品安全问题频繁爆出,所以选择了西安市食品抽检数据来挖掘关联规则。希望挖掘到食品安全问题的核心部分,在食品安全问题爆出之前解决掉,从而提高人们日常生活中对购买食品的放心程度。在经过数据挖掘的一系列步骤之后,挖掘到了许多关联规则,对之后的抽查提供了方向。
马万祺[9](2019)在《基于规则推理融合算法的重型卡车道路运输危险预警研究》文中进行了进一步梳理近几年随着中国物流行业在所有新型产业中的不断发展,物流运输的方式也在不断更新。其中,汽车物流在所有物流运输企业中有重要的作用,同时推动的物流行业的发展。在汽车物流行业中,以重型卡车为主要交通运输的方式,由于近些年,道路运输事故频发,重型卡车的道路运输安全预警监测问题也成为国家关注的重要问题。针对以上要求,在“阜阳重型卡车安全监测”的项目基础上,论文在对重卡道路的安全预警问题上提出了相应算法并对重型卡车道路运输危险预警系统进行实现与设计,通过数据挖掘以及相关计算机技术实现了车辆物流的信息化操作,提高了汽车物流的安全运输水平。针对目前重型卡车道路运输危险预警系统的数据分析与预测等问题,在系统中使用数据挖掘技术,在数据挖掘流程的步骤下,通过使用关联规则中的Apriori算法,可以针对在重卡道路运输危险预警中出现的相关条件,计算出影响重型卡车运输产生危险情况的条件之间的关联度,在得到影响重型卡车道路运输危险的关联条件后,通过对数据进行预处理操作,后使用BP神经网络的自主学习,通过BP神经网络,将其的输出结果为后面在使用D-S证据理论对重型卡车道路运输危险预警数据进行验证时,可以当做其基本分配函数(BPA),随后根据证据理论的合成规则对重型卡车道路运输中已经处理过的数据进行融合分析,最终根据其合成结果是否为1来判断BP神经网络的对重型卡车道路运输预测的准确性,进而降低重型卡车在道路行驶过程中所产生危险的风险性,保障驾驶员的生命和财产安全。通过结合重型卡车道路运输危险预警的具体特点和实际要求,对重型卡车道路运输危险预警系统的需求功能性方面分别进行两个方面的阐述,通过对重型卡车道路预警分析,得出在该系统中的框架的整体性[2],同时在采用基于J2EE的编程语言在B/S的开发模式和SSM的框架基础下,编写出页面原型,设计出系统的静态页面,根据重型卡车道路运输危险预警系统的需求,在此基础上,通过设计出该系统的(truk-monitoring)数据库以及基于重型卡车的车胎温度表、车胎压力表等相关数据表的设计,实现了胎温监测分析、胎压监测分析、轴温监测分析以及综合数据分析等功能。图29表24参51。
陈红平[10](2019)在《大数据环境下商品流通企业经营审计研究》文中研究表明商品流通企业在持续经营过程中,需要审计人员对企业经营绩效、经营流程、经营决策等进行科学严谨的评价,从企业经营管理角度出发实施经营审计,以发现经营管理中存在的问题并提出相应的改善措施,进而不断完善经营管理制度,达到降低经营风险,实现经营绩效最大化的目的。本文首先从审计范围、审计技术方法、审计人员素质等方面分析了大数据环境下商品流通企业经营审计现状以及发展趋势。然后根据现行经营审计存在审计范围局限、时效性不强、技术方法存在缺陷等问题,结合大数据相关理论与方法,构建了大数据环境下商品流通企业经营审计系统框架,描述了该系统的数据处理流程,并基于数据处理流程角度分析了相关审计技术,研究了孤立点算法和ARIMA模型在商品流通企业经营审计中的应用。最后对大数据环境下商品流通企业销售业务经营审计进行了案例分析,在分析了解企业背景基础上,制定审计目标并设计审计程序,按照数据采集、数据处理、数据分析的流程,分别利用Python实现了孤立点算法和ARIMA模型在销售业务经营审计数据分析中的应用:(1)基于孤立点算法的审计数据分析,探究从销售业务数据中,筛选出不符合业务规则的异常数据,将异常数据作为发现审计疑点的思路,分别对异常数据进行详细审查,判断其是否为审计疑点;(2)基于ARIMA模型的审计数据分析,探究利用历史销售数据进行规律分析,得到符合数据发展规律的ARIMA模型,并基于历史数据进行模型预测分析,比较模型预测值与销售计划预测值,判断计划预测值是否可靠。如果模型预测值与销售计划预测值产生较大差异,审计人员需要结合企业战略规划、市场需求分布、市场竞争等情况进行综合分析,寻找产生差异的原因,并提醒企业重新审核销售计划。由案例结果分析可知,大数据环境下商品流通企业经营审计系统框架具有一定的实用性,利用数据挖掘等技术进行审计数据分析有助于提高经营审计效率、拓宽经营审计范围以及降低经营审计成本。
二、数据挖掘及其在电厂中的应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、数据挖掘及其在电厂中的应用(论文提纲范文)
(1)基于划分关联规则的脱硫塔运行优化(论文提纲范文)
0 引言 |
1 基于模块划分的关联规则挖掘算法 |
1.1 分区目标的划分 |
1.2 数据库选择 |
2 脱硫系统参数挖掘 |
2.1 吸收塔液位和pH值的确定 |
2.2 浆液循环泵的组合挖掘 |
2.3 挖掘参数关联性分析 |
2.4 挖掘结果与实际运行的对比 |
3 结论 |
(2)基于改进IAA算法的网络入侵数据挖掘仿真(论文提纲范文)
1 引言 |
2 基于Apriori算法的关联规则挖掘 |
2.1 Apriori算法改进 |
1)并行化: |
2)矩阵化: |
3)计算支持度: |
2.2 挖掘准确性 |
3 抽取特征 |
4 数据挖掘 |
5 实验结果与分析 |
6 结束语 |
(3)融合关联规则挖掘算法的信息化教学管理系统设计(论文提纲范文)
0 引言 |
1 融合关联规则挖掘算法的信息化教学管理系统 |
1.1 系统设计 |
1.1.1 系统总体结构设计 |
1.1.2 系统数据库设计 |
1.2 关联规则挖掘算法应用 |
1.2.1 数据挖掘过程设计 |
1.2.2 关联规则挖掘算法设计 |
1)关联规则挖掘算法 |
2)Apriori算法核心 |
3)Apriori算法改进 |
1.2.3 改进Apriori算法在系统中的应用 |
1.3 查询课程实现 |
2 系统性能测试 |
2.1 系统功能测试 |
2.2 系统兼容性测试 |
2.3 系统数据挖掘性能分析 |
3 结论 |
(4)基于改进Apriori关联规则与SKohonen网络的制粉系统性能优化研究(论文提纲范文)
引 言 |
1 制粉系统运行优化参数挖掘 |
1.1 制粉系统优化模型数据库 |
1.2 磨煤机组合方式 |
2 基于目标制导的关联规则挖掘算法 |
2.1 改进Apriori算法原理 |
2.2 基于S_Kohonen神经网络的工况划分和数据预处理 |
2.2.1 S_Kohonen神经网络原理 |
2.2.2 S_Kohonen算法聚类 |
2.3 分位数分组离散化 |
2.4 基于目标制导的维度约束和样本压缩 |
2.5 制粉系统最优运行工况挖掘流程 |
3 应用实例与结果分析 |
4 结 论 |
(5)基于数据挖掘的火电机组运行经济性研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 课题背景及意义 |
1.2 国内外研究现状 |
1.2.1 数据挖掘研究现状 |
1.2.2 火电机组运行经济性研究状况 |
1.2.3 云计算数据挖掘与运行优化 |
1.3 本论文的主要工作 |
第2章 云计算数据挖掘的理论与方法 |
2.1 云计算平台介绍 |
2.1.1 Hadoop原理 |
2.1.2 HDFS分布式文件系统 |
2.1.3 MapReduce计算框架 |
2.1.4 MapReduce程序编写流程 |
2.2 数据挖掘理论 |
2.2.1 聚类分析 |
2.2.2 FCM聚类算法 |
2.3 Rough集理论概念 |
2.3.1 Rough集的定义 |
2.3.2 属性约简 |
2.4 本章小结 |
第3章 火电机组运行经济性分析 |
3.1 机组能耗损失分析 |
3.2 机组经济性指标 |
3.3 锅炉效率的计算 |
3.4 确定数据挖掘目标 |
3.5 本章小结 |
第4章 基于MapReduce的 RFCM算法并行化 |
4.1 云计算数据挖掘的应用意义 |
4.2 FCM算法的不足 |
4.3 改进的FCM算法及其工作流程 |
4.4 本章小结 |
第5章 云平台搭建及应用 |
5.1 Hadoop安装与搭建 |
5.1.1 搭建基础平台 |
5.1.2 搭建Java环境 |
5.1.3 搭建Hadoop环境 |
5.2 数据预处理 |
5.3 算法应用 |
5.4 结果分析 |
5.4.1 运行优化分析 |
5.4.2 算法效率分析 |
5.5 本章小结 |
第6章 总结与展望 |
参考文献 |
攻读硕士学位期间发表的论文及其它成果 |
致谢 |
(6)基于改进关联规则算法的空气质量数据关联性研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景与意义 |
1.2 国内外研究现状 |
1.3 论文主要研究内容 |
1.4 论文章节安排 |
第二章 关联规则与分布式计算 |
2.1 关联规则的基本概念 |
2.2 关联规则的发现流程 |
2.3 关联规则算法 |
2.3.1 Apriori算法 |
2.3.2 FP-Growth算法 |
2.4 分布式计算 |
2.4.1 Spark简介 |
2.4.2 基于Spark的 FP-Growth算法 |
2.5 本章小结 |
第三章 基于BC-List的关联规则挖掘算法BCLARM |
3.1 BCLARM算法描述 |
3.1.1 构建BC-Tree与 BC-List |
3.1.2 超集等价与支持度计数优化策略 |
3.2 BCLARM算法总体流程 |
3.3 实验设计与结果分析 |
3.4 本章小结 |
第四章 基于Spark的改进关联规则算法F-BCLARM |
4.1 F-BCLARM算法基本思想 |
4.1.1 同基频繁项集 |
4.1.2 基于负载均衡的分组优化策略 |
4.2 F-BCLARM算法描述 |
4.3 实验设计与结果分析 |
4.3.1 实验数据集与实验环境 |
4.3.2 实验结果分析 |
4.4 本章小结 |
第五章 F-BCLARM算法在空气质量指标关联性分析中的应用 |
5.1 空气质量指标关联性挖掘总体流程 |
5.2 数据处理 |
5.2.1 数据采集与预处理 |
5.2.2 数据离散化 |
5.3 空气质量指标关联规则挖掘结果与分析 |
5.3.1 关联规则挖掘 |
5.3.2 规则分析 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 论文总结 |
6.2 展望 |
参考文献 |
攻读学位期间所取得的相关科研成果 |
致谢 |
(7)改进的K-means算法研究与实现(论文提纲范文)
摘要 |
Abatract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目的与意义 |
1.3 国内外研究现状 |
1.3.1 国外研究现状 |
1.3.2 国内研究现状 |
1.4 本文研究内容 |
1.5 本文组织结构 |
第二章 相关理论 |
2.1 数据挖掘 |
2.2 聚类方法 |
2.3 相似性度量方法 |
2.4 信息论 |
2.5 本章小结 |
第三章 K-means算法原理及应用现状 |
3.1 K-means算法基本原理 |
3.2 K-means算法应用处理流程 |
3.3 K-means算法应用存在问题 |
3.4 K-means算法应用改进现状 |
3.5 K-means算法改进的基本原则 |
3.6 本章小结 |
第四章 K-means算法初始中心点优化 |
4.1 现有K-means初始中心点选择方法 |
4.2 问题的提出 |
4.3 改进K-means算法 |
4.4 实验及结果分析 |
4.4.1 实验设计 |
4.4.2 图像数据实验结果分析 |
4.4.3 文本数据实验及结果分析 |
4.5 本章小结 |
第五章 K-means算法改进设计 |
5.1 K-means算法改进思路 |
5.2 基于信息论的K-means算法设计 |
5.3 改进的K-means算法分析 |
5.4 改进的K-means算法实验分析 |
5.4.1 实验环境与实验数据 |
5.4.2 实验结果分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 论文总结 |
6.2 下一步工作 |
参考文献 |
致谢 |
(8)Apriori算法的研究与改进(论文提纲范文)
摘要 |
Abstract |
第一章 引言 |
1.1. 研究背景和意义 |
1.2. 国内外研究现状 |
1.3. 论文的研究内容和创新点 |
1.3.1. 论文的主要研究内容 |
1.3.2. 本论文主要的创新点 |
1.4. 本文的组织结构 |
第二章 频繁项集挖掘中的基本概念和算法 |
2.1. 基本概念和性质 |
2.2. Apriori算法 |
2.2.1. 性质及定义 |
2.2.2. Apriori算法的优势 |
2.2.3. 算法描述 |
2.2.4. Apriori算法的缺陷 |
2.3. FP-growth算法 |
2.3.1. 构建FP-Tree |
2.3.2. 挖掘频繁项集 |
2.3.3. 算法的优点 |
2.4. 本章小结 |
第三章 基于压缩事务记录的改进Apriori算法 |
3.1. 基本概念 |
3.2. 实例介绍 |
3.3. Node-Apriori算法描述 |
3.4. 算法的性能分析 |
3.5. 实验验证 |
3.6. 本章小结 |
第四章 基于FP-Tree的改进Node-Apriori算法 |
4.1. 算法起源 |
4.2. 实例介绍 |
4.3. Tree-Apriori算法描述 |
4.4. 算法的性能分析 |
4.5. 从Apriori算法到FP-growth算法 |
4.6. 实验验证 |
4.7. 本章小结 |
第五章 Tree-Apriori算法在西安市食品抽查数据中的应用 |
5.1. 实验环境 |
5.2. 数据准备 |
5.3. 挖掘过程和结果分析 |
5.4. 本章小结 |
第六章 总结与展望 |
6.1. 总结 |
6.2. 展望 |
参考文献 |
攻读学位期间的研究成果 |
致谢 |
(9)基于规则推理融合算法的重型卡车道路运输危险预警研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 论文研究背景 |
1.2 国内外研究现状 |
1.2.1 国内车辆道路运输危险预警研究现状 |
1.2.2 国外车辆道路运输危险预警研究现状 |
1.3 论文研究意义 |
1.3.1 理论意义 |
1.3.2 实践意义 |
1.4 论文研究内容和章节安排 |
1.4.1 论文研究内容 |
1.4.2 论文章节安排 |
2 相关技术 |
2.1 数据挖掘 |
2.1.1 数据挖掘简介 |
2.1.2 数据挖掘的流程 |
2.1.3 数据挖掘的方法 |
2.2 关联规则算法 |
2.2.1 Apriori算法 |
2.2.2 FPTree算法 |
2.2.3 Aprior算法和FPtree算法的比较 |
2.3 BP神经网络 |
2.3.1 BP神经网络概述 |
2.3.2 BP神经网络的学习过程 |
2.4 DS证据理论 |
2.4.1 DS证据理论概述 |
2.4.2 DS证据理论的计算过程 |
2.5 本章小结 |
3 重卡道路运输模型及实例分析 |
3.1 重卡车辆道路运输危险隐患问题 |
3.2 数据挖掘算法的选择 |
3.3 关联规则算法在重卡车辆道路运输危险问题的应用分析 |
3.3.1 关联规则挖掘步骤 |
3.3.2 数据收集 |
3.3.3 数据基础处理 |
3.3.4 模型构建 |
3.4 本章小结 |
4 基于多数据融合的重型卡车运输过程中发生的危险预警分析 |
4.1 总体设计 |
4.2 数据级融合 |
4.3 决策级数据融合 |
4.3.1 决策级数据融合步骤 |
4.3.2 数据预处理 |
4.3.3 BP神经网络的建立 |
4.3.4 DS证据理论融合信息 |
4.4 本章小结 |
5 系统的实现 |
5.1 需求分析 |
5.1.1 系统总体需求分析 |
5.1.2 系统功能需求分析 |
5.2 系统逻辑设计 |
5.3 数据库设计 |
5.4 系统功能模块设计与实现 |
5.4.1 胎温监测 |
5.4.2 实时车速监控 |
5.4.3 综合数据分析 |
5.4.4 系统基础信息 |
5.5 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
作者简介及读研期间主要科研成果 |
(10)大数据环境下商品流通企业经营审计研究(论文提纲范文)
摘要 |
Abstract |
1 导论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 内部审计相关研究 |
1.2.2 经营审计相关研究 |
1.2.3 大数据相关研究 |
1.3 研究目的与内容 |
1.3.1 研究目的 |
1.3.2 研究内容 |
1.4 研究方法与技术路线 |
1.4.1 研究方法 |
1.4.2 技术路线 |
1.5 论文创新点 |
2 相关理论基础 |
2.1 内部审计理论基础 |
2.1.1 资本保全理论 |
2.1.2 信息不对称理论 |
2.1.3 委托代理理论 |
2.2 经营审计 |
2.2.1 经营审计内涵 |
2.2.2 经营审计内容及目标 |
2.2.3 经营审计流程 |
2.3 大数据相关理论与方法 |
2.3.1 大数据的内涵 |
2.3.2 大数据关键技术 |
2.3.3 孤立点算法 |
2.3.4 ARIMA时间序列分析模型 |
3 大数据环境下商品流通企业经营审计现状及发展趋势 |
3.1 商品流通企业经营审计现状及存在的问题 |
3.1.1 审计范围局限 |
3.1.2 审计实施滞后 |
3.1.3 审计机构模式设置不合理 |
3.1.4 审计技术方法落后 |
3.1.5 审计人员素质有待提高 |
3.2 大数据环境下商品流通企业经营审计发展趋势分析 |
3.2.1 审计模式实时化 |
3.2.2 审计范围总体化 |
3.2.3 审计技术方法多样化 |
3.2.4 审计人员素质综合化 |
4 大数据环境下商品流通企业经营审计系统框架研究 |
4.1 大数据环境下商品流通企业经营审计系统框架构建的前提 |
4.1.1 企业信息化水平 |
4.1.2 企业持续经营 |
4.2 大数据环境下商品流通企业经营审计系统框架构建及分析 |
4.2.1 系统框架构建 |
4.2.2 系统框架分析 |
4.3 大数据环境下商品流通企业经营审计系统数据处理流程 |
4.3.1 数据采集阶段 |
4.3.2 数据处理阶段 |
4.3.3 审计分析阶段 |
4.3.4 审计报告阶段 |
4.4 大数据环境下商品流通企业经营审计技术研究 |
4.4.1 大数据环境下商品流通企业经营审计技术分析 |
4.4.2 孤立点算法在商品流通企业经营审计中的研究 |
4.4.3 ARIMA模型在商品流通企业经营审计中的研究 |
5 大数据环境下商品流通企业销售业务经营审计案例分析 |
5.1 企业背景概述 |
5.2 审计计划阶段 |
5.2.1 审计目标制定 |
5.2.2 审计程序设计 |
5.3 基于孤立点算法的审计数据分析 |
5.3.1 数据采集及预处理 |
5.3.2 孤立点算法应用 |
5.3.3 孤立点算法应用结果分析 |
5.4 基于ARIMA模型的审计数据分析 |
5.4.1 数据采集及预处理 |
5.4.2 ARIMA模型应用 |
5.4.3 ARIMA模型应用结果分析 |
6 研究结论与展望 |
6.1 研究结论 |
6.2 展望 |
致谢 |
参考文献 |
附录 |
个人简历、在学期间发表的学术论文及取得的研究成果 |
四、数据挖掘及其在电厂中的应用(论文参考文献)
- [1]基于划分关联规则的脱硫塔运行优化[A]. 谷小兵,李建强,蒋志容,徐贤,陶君. 中国环境科学学会2021年科学技术年会——环境工程技术创新与应用分会场论文集(三), 2021
- [2]基于改进IAA算法的网络入侵数据挖掘仿真[J]. 杨光辉,封均康. 计算机仿真, 2021(07)
- [3]融合关联规则挖掘算法的信息化教学管理系统设计[J]. 朱晴. 现代电子技术, 2020(23)
- [4]基于改进Apriori关联规则与SKohonen网络的制粉系统性能优化研究[J]. 徐樾,彭道刚,赵慧荣,孙宇贞. 热能动力工程, 2020(04)
- [5]基于数据挖掘的火电机组运行经济性研究[D]. 莫荣超. 华北电力大学, 2020
- [6]基于改进关联规则算法的空气质量数据关联性研究[D]. 苏鸣. 河北工业大学, 2020
- [7]改进的K-means算法研究与实现[D]. 许玲. 安徽大学, 2019(02)
- [8]Apriori算法的研究与改进[D]. 胡世昌. 青岛大学, 2019(02)
- [9]基于规则推理融合算法的重型卡车道路运输危险预警研究[D]. 马万祺. 安徽理工大学, 2019(01)
- [10]大数据环境下商品流通企业经营审计研究[D]. 陈红平. 重庆理工大学, 2019(08)