一、汇总型多表连接查询的一种优化方法(论文文献综述)
夏维邑[1](2021)在《大数据并行join算法的实现与评测》文中认为
郑蕾[2](2021)在《基于强化学习的RDF图数据智能管理》文中进行了进一步梳理
魏裕瑛[3](2021)在《电网资产管理系统多连接查询算法优化与应用》文中指出近几年我国经济高速发展和电网行业的不断变革,电网企业资产管理系统面临数据量剧增、数据库表关系复杂、数据更新频繁的问题,如何能高效的利用数据庞大的电网资产数据成为电网企业关注并亟需解决的热门问题。目前电网资产管理系统存在数据量大、数据类型复杂等问题,电网资产管理系统多连接查询是查询处理中较复杂的操作,数据库表连接操作的性能严重影响了多连接查询处理效率,所以搜索最优执行计划成为影响电网资产管理系统查询效率的关键。现阶段提出的数据库多连接查询算法无法快速、全面地获得最优的查询计划。灰狼优化算法因参数少、易实现、简单高效等特点常被用于解决电网资产管理系统的查询NP(Non-deterministic Polynomial)问题。但由于狼群搜索机制的局限性,导致传统灰狼优化算法后期收敛速度慢且容易陷入局部最优,从而影响了电网资产管理系统的查询效率和数据利用率。因此基于传统灰狼优化算法的研究提出了一种多因子动态权重策略和混合模拟退火算法的新型灰狼优化算法。在现有动态权重策略基础上,我们进一步提出了多因子动态权重策略,这种方法通过增加不同比例的动态权重来协调搜索个体,从而加快搜索机制的收敛速度。另外我们将模拟退火算法引入到灰狼优化算法中,利用Metropolis原则良好的随机突跳性为平衡局部最优和全局最优搜索能力,避免陷入局部最优。采用群智能优化算法常用的13个基准测试函数,对本文提出的改进的灰狼优化算法进行性能测试。结果显示本文提出的灰狼优化算法精确度提高到了e-324,较传统灰狼优化算法平均收敛速度提高了10%。将改进的灰狼优化算法应用于电网资产管理系统的数据库多连接查询优化中,通过设计并构建电网资产管理系统关系型数据库模型,利用查询代价模型对改进后的灰狼优化算法筛选查询计划获得最优查询路径。通过多次数据查询证明数据库查询效率得到了提高,解决了系统查询速度慢、查询效率低等问题。灰狼优化算法的改进和应用为未来的电网资产管理系统数据库多连接查询的研究与开发提供了有益的借鉴与参考。
吴夏川[4](2021)在《铁路货车轮轴数字化检修系统的设计与实现》文中研究表明随着铁路高速重载战略的实施,对货车质量提出更高要求,轮轴作为铁路货车关键部件,其检修过程是影响货车质量的关键环节之一。既有的轮轴检修系统开发时间较早,主要依赖人工录入,不能满足轮轴检修过程数字化、信息采集自动化、数据共享化、应用综合化的实际需要,因此需要结合轮轴检修发展及国内外相关技术的现状,开展铁路货车轮轴数字化检修系统的设计与实现研究。本文是以基于信息化实现轮轴检修过程管理为目标,研究了铁路货车轮轴数字化检修系统架构及功能设计,通过开展二维码、物联网、研发框架、移动应用技术等研究,研发“web+移动应用”的铁路货车轮轴数字化检修系统,提供了检修信息电子化流转、流程自动控制、进度监控、轮对存储管理、轮轴自动选配支出、质量闭环控制等功能,主要开展如下工作:(1)深入调研分析货车检修系统的发展现状,研究了二维码、物联网、研发框架、移动应用的相关技术,结合对货车轮轴检修业务流程的梳理,完成了系统需求分析。(2)研究提出了货车轮轴数字化检修系统的技术方案,包括总体架构、功能架构、技术架构、功能架构、数据架构等。(3)采用Spring Boot+Vue的前后端分离模式研发实现了系统功能,阐述了轮轴检修系统的检修工序、质量管理、生产计划、综合管理等模块的实现。论文的研究成果,在实践中试用取得良好的应用效果,提升了轮轴检修质量和效率,促进了检修业务流程优化创新,具有十分重要的现实意义。
滕静涵[5](2021)在《Tor节点数据管理系统的设计与实现》文中研究表明近些年来,随着互联网用户对通信安全的要求愈加严苛,匿名通信工具的应用也日益广泛,在保护用户通信身份的同时,其自身安全性和传输效率也成为衡量匿名工具的重要指标。本文选用匿名通信系统Tor作为研究目标,其传输过程对用户透明,用户无法了解传输链路的节点效率及安全性,低带宽、不稳定节点的存在使Tor网络的性能及安全性受到影响。目前市面并无成熟的针对Tor节点信息进行采集并展示的平台,因此,本文围绕Tor节点的运行日志,分析各类信息特征及关联,通过重新组织并分析数据为用户提供Tor网络节点的完整信息,实现Tor节点数据管理系统。本论文主要完成以下工作:首先,研究匿名通信的背景下Tor网络节点的透明性带来的通信安全和效率问题,结合当前研究现状提出对Tor节点信息进行整合的需求。同时对数据源进行分析,梳理文件内在关联关系,根据需求设计Tor节点数据管理系统的总体架构。其次,根据历史日志的文件组织形式和分类特征,提出了针对压缩文件的并行下载及解压的高效数据采集框架,结合定时任务实现完整的数据采集过程,为后续的数据预处理及分析提供支持。接着,针对历史日志,研究并设计了数据预处理及数据分析模型。将原始日志通过预处理实现数据结构化,重新组织按时间纵向发布的日志信息,并对不同类别的文件维度进行统一,解决数据冲突。借助关联属性实现数据融合,从节点角度横向汇总节点的完整历史信息,并根据指纹特点设计高效的文件存取策略,快速定位节点信息。针对实时数据文件,将Tor网络上活跃的实时节点各个维度的特征信息进行整合,根据共识权重建立实时节点优先级列表。最后,以SSM(Spring+SpringMVC+MyBatis)框架为基础设计并实现Tor节点数据管理平台,整合包括定时数据采集、数据文件浏览、历史日志预处理及分析、分析结果展示在内的完整功能,并从功能及性能方面对系统进行测试。经测试,系统性能稳定且安全可靠。
陆姗姗[6](2021)在《面向OLAP的存内查询优化技术研究》文中进行了进一步梳理OLAP(Online Analytical Processing,联机分析处理)查询是数据库系统中典型的一类查询,其特点是查询频率较低,但通常会涉及到非常复杂的聚合计算。在回答涉及大数据量的聚合查询时,现有的SQL数据库系统需要引入大量的磁盘I/O来读取OLAP查询所需的原始数据,导致OLAP查询延迟无法达到用户的需求。针对OLAP查询优化问题,本论文提出了一种基于存内处理(PIM,Processing-In-Memory)的优化方案,用于加速OLAP中的聚合查询。本文分别在语句级和操作符级上设计了 Agile Query和Smarter Query两种查询优化方案,并进行了性能验证。总体而言,本论文的主要工作和贡献可总结为如下两个方面:1.提出了一种面向OLAP查询的语句级查询优化方法Agile Query。该方法包含了两个新的设计。首先,我们使用一个内存哈希索引来缓存聚合查询及对应的查询结果,新到达的聚合查询如果在内存索引中命中则可以直接返回结果,从而减少OLAP查询时的I/O操作次数。我们给出了详细的内存哈希索引设计以及相应的查询算法。其次,为了解决缓存更新问题,提出了一种增量式缓存更新策略,在确保缓存数据和原始数据之间一致性的前提下,避免了重新执行查询带来的额外I/O代价。2.提出了一种面向OLAP查询的操作符级查询优化方法Smarter Query。该方法在Agile Query基础上,提出了三方面的改进:(1)对数据分块缓存聚合操作结果,在新查询与已缓存查询存在数据范围重叠时最大程度复用已缓存的结果,减少回答新查询需要扫描的磁盘数据量;(2)提出基于代价的缓存替换策略,更合理地选择被淘汰的缓存数据,提高后续查询的命中率;(3)以操作符为缓存粒度更加灵活地复用缓存,不再需要查询语句相同时才命中,避免重复的请求再次触发数据移动和计算。我们在MySQL数据库上分别实现了这Agile Query和Smarter Query方法,并在不同大小的数据集和不同查询分布情况下进行了实验,与MySQL上的传统查询方法进行比较。结果表明,在Zipf查询分布下,Agile Query方案的吞吐量比MySQL高了9倍以上,而在随机和均匀的分布式查询下吞吐量也获得了 2-3倍的提升。同时,Smarter Query方案在Agile Query方案的基础上进一步提升了高于50%的性能。本文的研究工作为实现OLAP实时查询提供了可行的方案,对实时的大数据处理也有一定的参考价值。
廖佳[7](2021)在《计算密集型大流量数据的接力计算与动态分流研究及工程实践》文中进行了进一步梳理大流量数据处理与研究方面,相较于成熟而先进的I/O密集型应用(如抢购火车票、“双十一”抢购商品等),我国计算密集型数据的处理仍然处于发展阶段,许多情况下已成为性能瓶颈,也是一个亟待解决的问题。典型的密集计算应用场景如大型科学计算、省市级的社保医保数据的计算与服务、大数据的AI计算与分析、税务数据的计算与优化、图像数据的分析与甄别等。本文研究一套计算密集型大流量数据的接力计算与动态分流处理模型,实现大流量数据的动态分流与接力计算模式,使复杂计算通过拆分和接续计算,充分利用系统的存储资源和计算资源,快速完成大流量和复杂的计算任务。主要研究内容及工作如下:首先,动态分流算法研究与实现。采用微服务架构搭建整体框架,对数据存储模块中的热点数据或使用频繁数据进行一体化转换,预存储在内存型数据存储模块以供快速读取,研究并实现动态分流算法将大流量数据分布在不同计算节点并行计算,缓解单节点大流量数据的计算压力,并对数据整合机制进行研究,最终将分布在不同计算节点的运行结果统一汇总。其次,接力计算模型研究与实现。将内存型数据存储技术作为过渡,数据存储模块的读写分离技术为基础,将复杂计算任务分解至多层接力计算节点上,并且利用计算节点的资源信息作为判定标准,将计算任务分配在指定节点上并行完成,有效减轻了单计算端的运算压力。再次,异步非阻塞中间件研究与实现。通过技术研发及整合,使计算过程的数据读写、计算分配、计算调度等环节,实现了纯粹的异步非阻塞和流式数据处理模式,充分提高了系统并发性并节省系统资源,消除内部瓶颈。最后,克隆数据存储集群研究与部署。通过执行自研SQL捕获器结果和对数据存储模块中同步失败的服务节点进行移除熔断操作,有效保障数据同步的可靠性。在研究过程中,通过一个完整的工程实践,构建了通过以上研究实现的工程平台。该微服务构架的平台及部分研究成果已经在工程实践中得以应用。通过不同数量级计算数据的测试,记录了其运行时间、资源利用率、计算准确度、完整度等指标,以及对指标数据的整理分析,证明了该模型能够显着提升数据计算的效率,对超高并发数据的处理和计算密集性数据的计算方法及类似应用场景,具有借鉴与参考性的价值。
刘光芮[8](2021)在《分布式列式内存数据库存储引擎优化方法的设计与实现》文中指出随着大数据时代的到来,人类存储了大量数据,如何高效的处理这些数据也越来越引发人们思考。传统的在线事务联机处理(Online Transaction Processing,OLTP)型数据库系统不能有效的满足人们分析海量数据的需求,而在线联机分析处理(Online Analytical Processing,OLAP)数据库系统受到广泛关注,成为人们研究热点。内存容量的扩大和价格的平民化,使得数据可以直接存储于更接近CPU的内存之中,内存配合列式存储的方式,可以极大的提升数据处理效率。但目前内存数据库的存储依然有些不足,比如:数据分布散乱,不能有效过滤无关数据,导致需要访问多个数据分片;数据组织方式单一,对于不同特性的数据采用相同的数据编码方式。本文将针对分布式列式内存数据库存储引擎的各种问题,从数据划分、数据存储、数据传输、数据计算等多个方面提出优化方案,目的是高效组织数据,降低内存使用的同时,提升存储引擎访问效率。主要工作内容如下:1.设计并实现新的数据分区方式。改变数据原有离散存放的特性,提出一种适合分析场景下的数据划分方式,并建立多级统计信息。将数据按某属性值划分为若干组,组内按另一属性值排序,并且每组按列为单位存储和管理数据,减少原始表Row ID的影响,只需维护组内的Row ID映射关系,减少维护Row ID的代价。每组的各列数据可继续划分为更小的存储单位,并在每个层级建立统计信息,以便按不同粒度选择扫描数据。2.设计并实现多种存储格式和中间数据结构。针对不同的数据组织形式,可按照数据自身特性选择适当的数据存储格式,兼顾访问速度与空间使用效率。并基于存储结构,优化不同节点间传输数据的中间数据结构,降低网络通信开销,并减少内存消耗。3.设计并实现存储层算子。基于特有的数据分区方式,在一定情况下选择存储层算子,使之可以在存储引擎中完成部分计算,减少大量数据传输,提升存储引擎的资源利用率,降低查询时延。本论文是在自主研发的分布式列式内存数据库GoldFish基础上优化,并对优化后的系统从功能和性能两方面进行测试,结果显示,内存占用大幅减少,查询性能也有不同程度的提升。
何东升[9](2021)在《基于图神经网络的数据库查询方法优化与实现》文中研究表明随着互联网技术的发展,数据呈现井喷的趋势,大数据成为信息时代的主旋律。对于数据库领域而言,随之面临的难题就是如何有效的组织和管理数据。为了满足存储的需求,不断催生了许多新型架构的数据库,但是对于查询性能的优化还未能取得突破性的发展。如何提升数据库查询执行性能,一直是数据库领域的重要研究方向,传统数据库查询优化方法已经无法胜任当前大规模的数据量以及新型架构的数据库。得益于人工智能技术的成熟发展,利用深度学习强大的学习能力,可以有效的解决诸多难题。人工智能技术和数据库融合也成为当前发展的重要方向之一,有不少研究也取得了不错的进展,但依然还面临巨大的挑战。针对查询优化中未能有效利用数据分布特征及关联关系,提出了一种基于图神经网络的数据库优化方法,有效的利用图神经网络对于图结构数据的特征提取能力,分析查询计划树的结构特征以及数据数据关联特征,主要算法包括数据基数估计GCE(GNN Based Cost Estimation)和连接顺序优化算法RGOS(Reinforcement-learning and GNN Based Join Order Selection)。其中基数估计算法主要利用Tree-LSTM(Long Short-Term Memory)树型图神经网络提取查询计划树的结构特征,并使用图卷积网络提取各个数据列的关联关系及连接的拓扑关系,通过对大量历史数据的学习提升查询准确率,为物理优化阶段提供更可靠的评价依据。连顺序优化主要利用图卷积算法提取查询特征和连接顺序特征,并利用强化学习算法感知数据库真实环境,以真实反馈来不断挑战和优化模型,从而提升连接顺序决策的效果。最终本文将上述两个优化算法应用到开源分布式关系数据库TiDB中。实验结果表明,基数估计算法GCE相较于TiDB原始的基数估计算法,准确率提升12倍左右;同时连接优化算法RGOS,能够提升TiDB平均查询性能40%。
鲍涛[10](2021)在《车联网安全事件大数据分析系统的研究与实现》文中进行了进一步梳理车联网是当今时代下热门的话题,本文将车联网中安全事件分为行为类安全事件和信息类安全事件,且重点介绍车联网中安全事件的产生和处理流程,将处理整个流程的系统称作车联网安全事件大数据分析系统。为了介绍此系统,本文将从以下五个部分展开。基于常用设计模式,搭建了安全事件监听系统的框架,在保证安全事件的可扩展性的同时,也可以用于安全事件的收集和获取,达到了其与它功能模块或者系统解耦合的目的。基于C/S服务架构,设计并实现车云互动安全中间件模块,该模块可用于当前车联网系统内部的特定数据规范化传输,保证特定数据以合适的大小、加密、高效且完整地传输至接收方。目前特定数据主要为安全事件短消息数据和GPS短消息数据。将车联网安全事件划分为5个等级,将驾驶员也划分为5个等级,并提出历史安全指数和即时安全指数这两个概念,达到以量化的方式处理车联网安全事件等级和驾驶员安全等级的目的。设计并实现了安全事件工单系统,该系统可以展示和推动安全事件的处理进程。最后本系统达到对安全事件可跟踪可核实可处理的目的。基于聚类分析的原理,设计并实现了对驾驶员部分属性分簇的流程,且该流程可以用于边界不明显的驾驶员属性,最终达到了将驾驶员进行抽象化的目的。
二、汇总型多表连接查询的一种优化方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、汇总型多表连接查询的一种优化方法(论文提纲范文)
(3)电网资产管理系统多连接查询算法优化与应用(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
序言 |
1 引言 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文研究内容和组织 |
1.4 本章小结 |
2 查询优化关键技术和基础理论模型 |
2.1 分布式数据库 |
2.1.1 分布式数据库介绍 |
2.1.2 分布式数据库查询过程 |
2.1.3 数据库查询代价 |
2.2 查询优化 |
2.2.1 查询优化原理 |
2.2.2 多连接查询优化原理 |
2.3 多连接查询TSP问题 |
2.3.1 多连接查询与TSP问题介绍 |
2.3.2 多连接代价评估模型 |
2.4 灰狼优化算法 |
2.4.1 灰狼优化算法研究现状 |
2.4.2 灰狼优化算法原理 |
2.5 本章小结 |
3 基于灰狼优化算法的改进和验证 |
3.1 多因子动态权重策略 |
3.2 引入模拟退火算法 |
3.3 改进的灰狼优化算法流程 |
3.4 算法实验验证和分析 |
3.4.1 算法精确度分析 |
3.4.2 算法收敛速度分析 |
3.5 本章小结 |
4 电网资产管理系统的数据库设计与多连接查询优化应用 |
4.1 电网资产管理系统 |
4.1.1 电网资产管理系统数据特征 |
4.1.2 电网资产管理系统架构 |
4.1.3 电网资产管理算法优化功能 |
4.2 电网资产管理系统数据库表设计 |
4.2.1 基础资产模块数据设计 |
4.2.2 投入产出模块数据设计 |
4.3 电网资产管理系统多连接查询优化过程 |
4.3.1 概貌统计 |
4.3.2 语法树 |
4.3.3 设计代价评估函数 |
4.3.4 灰狼位置更新及速度 |
4.4 结果分析和效果展示 |
4.4.1 实验环境 |
4.4.2 实验设计 |
4.4.3 查询代价评估 |
4.4.4 运行时间评估 |
4.4.5 效果展示 |
4.5 本章小结 |
5 结论 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(4)铁路货车轮轴数字化检修系统的设计与实现(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 主要研究内容 |
1.4 论文组织结构 |
1.5 本章小结 |
2 相关技术 |
2.1 二维码技术 |
2.2 架构技术 |
2.2.1 SpringBoot框架 |
2.2.2 Vue框架 |
2.2.3 Mybatis框架 |
2.2.4 微信小程序开发平台 |
2.3 物联网技术 |
2.4 本章小结 |
3 系统需求分析 |
3.1 用户分析 |
3.2 业务流程分析 |
3.3 功能性需求分析 |
3.4 非功能性需求分析 |
3.5 本章小结 |
4 系统设计 |
4.1 系统总体构架 |
4.2 系统技术架构 |
4.3 系统功能架构 |
4.3.1 检修工序模块 |
4.3.2 质量检查模块 |
4.3.3 生产计划模块 |
4.3.4 综合管理模块 |
4.3.5 用户管理模块 |
4.3.6 权限管理模块 |
4.3.7 移动端模块 |
4.4 数据架构 |
4.4.1 数据库选型 |
4.4.2 数据接口 |
4.4.3 数据库设计 |
4.5 本章小结 |
5 系统实现 |
5.1 检修工序模块实现 |
5.1.1 检修工序 |
5.1.2 轮对选配支出 |
5.2 质量检查模块实现 |
5.2.1 质量检查 |
5.2.2 问题反馈 |
5.3 生产计划模块实现 |
5.4 综合管理模块实现 |
5.4.1 数据统计查询 |
5.4.2 工序监控 |
5.4.3 轮对储存管理 |
5.4.4 实时通信 |
5.5 用户管理模块实现 |
5.5.1 添加用户 |
5.5.2 在线用户管理 |
5.6 权限管理模块实现 |
5.6.1 登录和验证 |
5.6.2 权限分配 |
5.7 移动端模块实现 |
5.7.1 信息电子化流转 |
5.7.2 轮轴检修工序 |
5.8 其它功能实现 |
5.8.1 CORS跨域 |
5.8.2 事务配置 |
5.8.3 访问记录 |
5.8.4 文件上传、下载 |
5.9 应用效果 |
5.10 本章小结 |
6 总结与展望 |
6.1 论文总结 |
6.2 未来展望 |
参考文献 |
附录 A 数据表结构 |
附录 B 轮对储存实现代码 |
附录 C 实时通信实现代码 |
附录 D 访问记录实现代码 |
附录 E 文件上传下载实现代码 |
作者简历及攻读学位期间取得的科研成果 |
学位论文数据集 |
(5)Tor节点数据管理系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要研究内容 |
1.4 论文组织结构 |
1.5 本章小结 |
第二章 相关技术 |
2.1 Tor匿名通信系统 |
2.1.1 匿名通信与Tor概述 |
2.1.2 Tor工作原理 |
2.1.3 Tor脆弱性分析 |
2.2 Spark内存计算框架 |
2.2.1 Spark与Hadoop |
2.2.2 Spark核心机制 |
2.2.3 Spark运行架构 |
2.3 数据预处理 |
2.3.1 预处理意义 |
2.3.2 预处理过程 |
2.4 本章小结 |
第三章 Tor节点数据管理系统需求分析 |
3.1 系统数据需求 |
3.1.1 数据源分析 |
3.1.2 采集频率分析 |
3.1.3 数据量分析 |
3.1.4 数据流向分析 |
3.2 系统功能需求 |
3.2.1 数据采集模块 |
3.2.2 历史日志模块 |
3.2.3 实时数据模块 |
3.3 系统性能需求 |
3.4 可行性分析 |
3.5 本章小结 |
第四章 Tor节点数据管理系统的设计 |
4.1 总体设计 |
4.1.1 系统功能模块设计 |
4.1.2 系统技术架构设计 |
4.2 并行采集框架设计 |
4.2.1 目录解析 |
4.2.2 并行下载 |
4.2.3 并行解压 |
4.3 数据分析模型设计 |
4.3.1 日志路径解析 |
4.3.2 数据预处理 |
4.3.3 数据融合 |
4.3.4 高效存取方案设计 |
4.4 模块详细设计 |
4.4.1 数据采集模块的设计 |
4.4.2 历史日志模块的设计 |
4.4.3 实时数据模块的设计 |
4.5 数据库设计 |
4.6 本章小结 |
第五章 Tor节点数据管理系统的实现 |
5.1 并行采集框架实现 |
5.1.1 目录解析 |
5.1.2 并行下载 |
5.1.3 并行解压 |
5.2 数据分析模型实现 |
5.2.1 关联共识和带宽信息 |
5.2.2 注入出口数据 |
5.3 模块实现及界面展示 |
5.3.1 数据采集模块 |
5.3.2 历史日志模块 |
5.3.3 实时数据模块 |
5.4 本章小结 |
第六章 系统测试 |
6.1 测试环境 |
6.2 功能测试 |
6.3 性能测试 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 工作总结 |
7.2 展望 |
参考文献 |
致谢 |
(6)面向OLAP的存内查询优化技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 通用数据库查询优化技术 |
1.2.2 面向OLAP的查询优化技术 |
1.2.3 存内处理 |
1.3 论文研究内容 |
1.4 论文组织结构 |
第2章 相关工作 |
2.1 OLTP和OLAP |
2.2 基于存内处理的研究 |
2.3 常见的内存替换策略 |
2.4 本章小结 |
第3章 语句级存内查询优化方案 |
3.1 引言 |
3.2 相关工作 |
3.2.1 触发器 |
3.2.2 哈希表 |
3.3 语句级存内查询优化方案 |
3.3.1 内存哈希索引 |
3.3.2 哈希表增量更新算法 |
3.3.3 Agile Query的执行过程 |
3.4 实验设计与分析 |
3.4.1 TPC-H基准 |
3.4.2 查询分布 |
3.4.3 实验配置 |
3.4.4 实验结果 |
3.5 本章小结 |
第4章 操作符级存内查询优化方案 |
4.1 引言 |
4.2 操作符级存内查询优化方案 |
4.2.1 分块缓存 |
4.2.2 用户自定义函数 |
4.2.3 基于代价的缓存替换策略 |
4.2.4 内存哈希索引 |
4.2.5 SmarterQuery的执行过程 |
4.3 实验设计与分析 |
4.3.1 实验配置 |
4.3.2 实验结果 |
4.4 本章小结 |
第5章 总结与展望 |
5.1 论文工作总结 |
5.2 下一步的研究工作 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(7)计算密集型大流量数据的接力计算与动态分流研究及工程实践(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 论文研究内容 |
1.4 论文组织结构 |
2 相关技术介绍分析 |
2.1 微服务架构 |
2.2 微服务框架Spring Cloud |
2.3 响应式异步非阻塞框架WebFlux |
2.4 非阻塞客户端WebClient |
2.5 内存型数据存储技术 |
2.6 响应式关系型数据库访问技术R2DBC |
2.7 本章小结 |
3 接力计算与动态分流处理的技术路线及框架 |
3.1 系统总体框架 |
3.2 计算节点状态监测研究 |
3.3 动态分流算法模型 |
3.4 接力计算模型设计 |
3.5 异步非阻塞中间件研究 |
3.6 克隆数据存储集群设计 |
3.7 本章小结 |
4 接力计算与动态分流处理模型实现 |
4.1 计算节点状态监测实现 |
4.2 数据分流模块实现 |
4.3 接力计算模块实现 |
4.4 异步非阻塞中间件实现 |
4.5 克隆数据存储集群实现 |
4.6 本章小结 |
5 系统功能测试与结果分析 |
5.1 系统架构集成 |
5.2 测试环境 |
5.3 测试结果分析 |
5.4 测试平台展示 |
5.5 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
在校期间的科研成果 |
在校期间的工程开发与实践 |
(8)分布式列式内存数据库存储引擎优化方法的设计与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究历史与现状 |
1.3 本文的主要贡献与创新 |
1.4 本论文的结构安排 |
第二章 相关技术与典型系统 |
2.1 列式数据库常见优化技术 |
2.1.1 数据压缩 |
2.1.2 向量化执行 |
2.1.3 延迟物化 |
2.2 布隆过滤器 |
2.3 分布式OLAP数据库 |
2.3.1 Power Drill |
2.3.2 Click House |
2.4 本章小结 |
第三章 系统总体设计 |
3.1 系统背景与设计目标 |
3.1.1 系统背景 |
3.1.2 系统设计目标 |
3.2 系统总体架构与模块设计 |
3.3 主要流程分析 |
3.3.1 导入流程 |
3.3.2 查询流程 |
3.3.3 节点变动流程 |
3.4 优化方案 |
3.4.1 数据分区的设计 |
3.4.2 存储格式设计 |
3.4.3 中间数据结构的设计 |
3.4.4 存储层算子设计 |
3.5 本章小结 |
第四章 系统详细设计与实现 |
4.1 底层基础工具的实现 |
4.1.1 网络通信框架的实现 |
4.1.2 定时器的实现 |
4.1.3 线程池的实现 |
4.2 数据存储结构的实现 |
4.2.1 基础数据结构实现 |
4.2.2 关键存储结构实现 |
4.2.3 总体存储结构实现 |
4.3 中间数据结构的实现 |
4.4 存储层算子实现 |
4.4.1 Scan算子实现 |
4.4.2 Group算子实现 |
4.4.3 Local Join算子实现 |
4.5 导入系统的实现 |
4.5.1 数据库读取组件模块实现 |
4.5.2 数据服务器模块实现 |
4.6 本章小结 |
第五章 系统测试与分析 |
5.1 测试环境 |
5.1.1 硬件环境 |
5.1.2 系统拓扑 |
5.1.3 测试数据集 |
5.2 功能测试 |
5.2.1 导入功能 |
5.2.2 全表查询功能 |
5.2.3 范围查询功能 |
5.2.4 分组功能 |
5.2.5 连接功能 |
5.2.6 排序功能 |
5.3 性能测试 |
5.3.1 范围查询性能测试 |
5.3.2 分组查询性能测试 |
5.3.3 连接查询性能测试 |
5.4 存储数据内存开销测试 |
5.5 本章小结 |
第六章 总结与展望 |
致谢 |
参考文献 |
(9)基于图神经网络的数据库查询方法优化与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 国内外发展及研究现状 |
1.2.1 传统数据库查询优化发展及研究现状 |
1.2.2 深度学习与数据库查询优化融合的研究现状 |
1.3 本文的主要研究内容与贡献 |
1.4 本论文的结构安排 |
第二章 相关理论与技术的分析与研究 |
2.1 TiDB总体架构 |
2.2 查询处理过程 |
2.2.1 执行生命周期 |
2.2.2 Volcano计算模型 |
2.3 查询优化过程 |
2.3.1 代价估计 |
2.3.2 连接顺序算法 |
2.4 图神经网络相关知识 |
2.4.1 图的拉普拉斯算子 |
2.4.2 图的卷积操作 |
2.4.3 图卷积神经网络 |
2.5 本章小结 |
第三章 需求分析及方案设计 |
3.1 设计目标 |
3.2 需求分析 |
3.3 系统总体架构设计 |
3.4 算法设计 |
3.4.1 数据采集算法设计 |
3.4.2 基数及代价估计算法设计 |
3.4.3 连接顺序优化算法设计 |
3.5 本章小结 |
第四章 查询优化模块的详细设计与实现 |
4.1 网络通信设计与实现 |
4.2 数据收集模块的具体实现 |
4.2.1 查询接口 |
4.2.2 全局性数据的采集 |
4.2.3 离线数据的采集 |
4.2.4 在线数据的采集 |
4.3 基数估计模块详细实现 |
4.3.1 数据处理与表示 |
4.3.2 网络模型实现 |
4.3.3 基数估计与TiDB的结合 |
4.4 连接顺序优化模块详细实现 |
4.4.1 数据处理与表示 |
4.4.2 网络模型构建 |
4.4.3 连接顺序优化与TiDB的结合 |
4.5 本章小结 |
第五章 实验与测试 |
5.1 系统测试环境 |
5.2 系统可用性测试 |
5.3 算法性能测试 |
5.3.1 基数估计性能测试 |
5.3.2 连接顺序性能测试 |
5.4 本章小结 |
第六章 全文总结与展望 |
6.1 全文总结 |
6.2 课题展望 |
致谢 |
参考文献 |
攻读专业硕士学位期间取得的成果 |
(10)车联网安全事件大数据分析系统的研究与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 选题背景及意义 |
1.2 国内外研究现状 |
1.2.1 国内研究现状 |
1.2.2 国外研究现状 |
1.3 本文的主要工作 |
1.4 论文结构 |
第二章 相关技术及理论 |
2.1 大数据分析系统 |
2.2 HADOOP生态系统 |
2.2.1 实例说明 |
2.3 实时计算框架 |
2.3.1 Kafka消息中间件 |
2.3.2 Flink计算框架 |
2.4 ZOOKEEPER分布式协调服务 |
2.5 数据库 |
2.5.1 Elasticsearch |
2.5.2 Mysql |
2.5.3 Sqlite |
2.5.4 Redis |
2.6 K-MEANS聚类分析 |
2.7 安全事件 |
2.8 安全等级 |
2.8.1 实例说明 |
2.9 本章小结 |
第三章 系统需求分析 |
3.1 需求概述 |
3.2 业务描述 |
3.2.1 业务顶层逻辑描述 |
3.2.2 系统角色 |
3.2.3 业务流程图 |
3.3 系统功能性需求 |
3.3.1 安全事件监听子系统 |
3.3.2 车云互动安全中间件 |
3.3.3 安全事件数据分析子系统 |
3.3.4 安全事件工单子系统 |
3.3.5 大数据画像子系统 |
3.4 系统非功能性需求 |
3.4.1 安全性 |
3.4.2 高可用性 |
3.4.3 可扩展性 |
3.5 本章小结 |
第四章 系统设计 |
4.1 系统架构设计 |
4.2 安全事件监听子系统设计 |
4.2.1 设计思想 |
4.2.2 概要设计 |
4.2.3 详细设计 |
4.3 车云互动安全中间件设计 |
4.3.1 设计思想 |
4.3.2 概要设计 |
4.3.3 详细设计 |
4.4 安全事件数据分析子系统设计 |
4.4.1 设计思想 |
4.4.2 概要设计 |
4.4.3 详细设计 |
4.5 安全事件工单子系统设计 |
4.5.1 概要设计 |
4.5.2 详细设计 |
4.6 大数据画像子系统设计 |
4.6.1 概要设计 |
4.6.2 详细设计 |
4.7 本章小结 |
第五章 系统实现与测试 |
5.1 开发环境 |
5.1.1 硬件环境 |
5.1.2 软件环境 |
5.2 系统功能实现 |
5.2.1 安全事件监听子系统功能实现 |
5.2.2 车云互动安全中间件功能实现 |
5.2.3 安全事件数据分析子系统功能实现 |
5.2.4 大数据画像子系统功能实现 |
5.3 系统功能性测试 |
5.3.1 车云互动安全中间件 |
5.3.2 安全事件数据分析子系统 |
5.3.3 安全事件工单子系统 |
5.3.4 大数据画像子系统 |
5.4 系统非功能性测试 |
5.4.1 压力测试 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 后续工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
四、汇总型多表连接查询的一种优化方法(论文参考文献)
- [1]大数据并行join算法的实现与评测[D]. 夏维邑. 哈尔滨工业大学, 2021
- [2]基于强化学习的RDF图数据智能管理[D]. 郑蕾. 哈尔滨工业大学, 2021
- [3]电网资产管理系统多连接查询算法优化与应用[D]. 魏裕瑛. 北京交通大学, 2021
- [4]铁路货车轮轴数字化检修系统的设计与实现[D]. 吴夏川. 中国铁道科学研究院, 2021(01)
- [5]Tor节点数据管理系统的设计与实现[D]. 滕静涵. 北京邮电大学, 2021(01)
- [6]面向OLAP的存内查询优化技术研究[D]. 陆姗姗. 中国科学技术大学, 2021(08)
- [7]计算密集型大流量数据的接力计算与动态分流研究及工程实践[D]. 廖佳. 四川师范大学, 2021(12)
- [8]分布式列式内存数据库存储引擎优化方法的设计与实现[D]. 刘光芮. 电子科技大学, 2021(01)
- [9]基于图神经网络的数据库查询方法优化与实现[D]. 何东升. 电子科技大学, 2021(01)
- [10]车联网安全事件大数据分析系统的研究与实现[D]. 鲍涛. 电子科技大学, 2021(01)