一、文献与摘要(31)(论文文献综述)
王佳琳[1](2021)在《Meta分析摘要和全文的信息完整性评价及其相关性分析 ——基于肿瘤免疫治疗文献的研究》文中研究指明
刘洪飞[2](2021)在《融合信任度及不确定上下文质量修正模型的本体建模研究》文中研究指明本文针对如何更好的建模上下文进行了研究。在上下文的建模和利用中存在着一些问题,本文针对低质量上下文、模糊上下文和缺失上下文三个方面进行了提高上下文质量、模糊本体建模和补全缺失上下文的研究。然后分别将它们应用在了光伏发电预测、文献摘要、文献检索的领域。研究内容如下:研究内容1:对于低质量上下文,本文提出了一种新的方法来建立了高质量本体模型,该本体模型可提高上下文质量。该本体先将上下文按照其来源的不同进行分类,共分为用户上下文、网络上下文、传感器上下文和邻居上下文四种。然后对这些分类后的上下文进行质量评估,最后选择高质量的上下文来代替低质量上下文,从而提高上下文的质量。上述研究成果可应用在光伏发电预测领域,解决环境上下文数据质量低的问题。在仿真实验中,本文建立了光伏发电高质量本体来获取光伏功率预测所需要的上下文信息。结合门控循环神经网络预测模型,该方法可以提高光伏功率的预测精度,使得在光伏并网时电网能更加安全地运行。研究内容2:对于模糊上下文,本文构建了一种模糊上下文本体来对用户文章的上下文进行建模和收集,并将其应用于文献摘要领域来提高文献摘要的精度。在文献摘要领域,各种词汇由于其所处领域不同会呈现不同的意思。本文提出的方法可以通过模糊上下文本体中的领域隶属度、用户兴趣隶属度和主题隶属度找出能够准确描述文章内容的词语。最后通过这些关键的摘要词语来获得准确的摘要。通过文献摘要实验证明,该模糊本体较传统方法平均精度可以提高15%左右,使得读者们通过摘要就能准确了解文章内容。研究内容3:完全缺失的上下文,新发表文献的被引频率为空,就属于完全缺失上下文。本文通过对新发表文章的被引频率进行推理预测,然后将推理得到的被引频率应用在了文献检索中,从而提高了文献检索的精度。具体是通过将文献上下文本体和模糊神经网络推理模型结合,利用其它存在的上下文推理得到缺失的上下文并将这些文献检索上下文应用于文献检索领域。经过文献检索实验表明,该方法比单纯使用Best Matching方法平均精度提高了20%左右,并且该方法可以使检索到的文献更符合用户兴趣。
石雯茜[3](2021)在《基于粗糙数据推理的文本关键词与摘要抽取算法》文中研究表明互联网的飞速发展使得网络文本数据呈现爆发性的增长。快速发展的互联网在给用户带来便利的同时,也使得用户很难从海量复杂的数据中快速、准确、全面地获取自身所需的信息。文本关键词与摘要抽取作为自然语言处理领域两个重要的研究课题,其目的均为生成描述文本主旨的精简内容,从而揭示文本的关键信息。为挖掘文本数据之间潜在的关联,本文在研究关键词与摘要抽取算法的基础上,深入研究了粗糙数据推理理论,重点研究了基于图模型的TextRank排序算法。基于图模型的TextRank算法是一种有效的关键词抽取算法,在抽取关键词时可取得较高的准确度,但其仍有不足。该算法在构造图的关联边时,所采用的共现窗口规则仅考虑了局部词汇间的关联,并具有较大的随意性与不确定性。针对这一问题,本文提出了一种基于粗糙数据推理理论的改进TextRank关键词抽取算法,粗糙数据推理可扩大关联范围,增加关联数据,得到的结果更加全面。结合粗糙数据推理理论中的关联规则,该文提出的算法做了以下改进:依据词义对候选关键词进行划分,再通过粗糙数据推理对不同分类中候选词间的关联关系进行推理。实验结果表明,与传统的TextRank算法相比,改进后算法的抽取精度有了明显地提高,证明了利用粗糙数据推理的思想能有效地改善算法抽取关键词的性能。同时,为使改进的TextRank算法考虑到外部知识对关键词抽取的影响,本文提出了基于粗糙数据推理的词向量聚类TextRank关键词抽取算法。该算法在利用粗糙数据推理挖掘候选词间潜在关联的基础上,又引入Word2Vec模型,利用其训练得到候选词向量进行聚类,并依据聚类结果对候选关键词图的节点进行非均匀的加权,进而使得单文本的外部知识融合到算法中,提高算法的抽取效果。实验结果说明,与现有的很多改进算法相比,该算法的抽取效果有一定的提高。考虑到文本关键词对摘要抽取结果的影响,本文通过对TextRank自动文本摘要算法的研究发现,该算法在进行摘要抽取时仍存在很多不足之处。首先,该算法的抽取结果与文本主题的相关性较差,且现有算法大都未考虑关键词对文本摘要句的影响,同时,算法综合的外部特征也比较片面。为解决上述问题,本文提出基于粗糙数据推理的加权图模型自动文本摘要算法。该算法基于前期对关键词的研究,得到其所需的关键词集,利用LDA主题模型对文本的主题信息进行挖掘,再综合文本的整体结构以及候选句的上下文信息对算法做出改进。实验结果表明,与经典的算法相比,改进的摘要算法的抽取效果更优。
刘庆霞[4](2020)在《基于语义网的实体摘要方法研究》文中指出语义网是下一代万维网发展的重要方向,随着语义网的发展,大量易于机器理解的RDF数据集被构建并发布出来。RDF数据以三元组形式描述实体相关的事实。实体摘要问题,即从用于描述待摘要实体的大量三元组中,选出包含关键信息且满足容量限制的一个子集作为摘要,最终提供给用户以满足用户的信息需求。本文关注实体摘要方法的设计和评价两方面的研究。方法的设计面临三方面的挑战。首先,要能合理评价三元组的质量。现有工作普遍基于统计方法度量三元组在图结构中的特性,而对其文本内容不够重视,未考虑其内容对用户阅读体验的影响。其次,要能够理解三元组间关系。现有工作最常关注的是三元组间的冗余关系,并通过添加约束的方式避免选入冗余内容。然而现有基于约束的方式对冗余的处理不够灵活,且难以与摘要的其他性质均衡考虑。此外,三元组间的其他复杂关系也会影响摘要的质量,也应予以识别和度量。最后,要能充分获知用户的偏好。现有实体摘要工作主要基于非监督方式,借助专家对用户偏好的假设来设计模型。然而专家的假设难以全面涵盖所有的因素,因此有必要探索其他机制让摘要方法能直接从数据获知用户的偏好。方法的评价方面,评测集的构建是其中关键。评测集的质量决定了各摘要方法的能力能否被公平且全面地进行比较。现有实体摘要评测集存在各种局限,包括采用的数据集单一、面向特定领域、规模小、包含的实体三元组类型不全等问题。并且,其中大部分评测集已无法公开获取。因此,缺乏公开可用的高质量评测集是实体摘要评价方面目前亟需解决的问题。所面临的上述问题,本文提出了不同的解决方案,主要包括以下内容:1.提出基于内容优化的实体摘要方法ESSTER。该方法基于三元组在全局和局部RDF图结构中的表现对结构重要性给出了灵活的度量方式。为了提升用户的阅读体验,该方法提出三元组可读性的概念,并借助文本语料实现对可读性的计算。而为了降低冗余,该方法从逻辑冗余、数值冗余和文本冗余三个方面明确了冗余度的计算方式,从而使降冗余能够作为优化目标中的项与其他特性综合计算。为了同时优化结构重要性、文本可读性和语义低冗性,该方法将实体摘要问题建模为0-1二次背包问题并求解。实验结果表明,该方法在同样基于非监督的方法中取得目前最佳效果。2.提出基于内容编码的实体摘要方法Deep LENS。现有实体摘要方法主要基于非监督方式,而为了从标记数据中获取用户的偏好,Deep LENS尝试探索监督学习在处理实体摘要问题上的潜力。该方法利用多层感知机和注意力机制设计深度神经网络模型,能够对实体描述内容基于与候选三元组的关系进行编码,生成的编码满足排列不变性。该模型最终输出对候选三元组以实体描述内容编码为上下文的打分,用以构造实体摘要。实验结果表明,该方法生成的摘要质量显着优于所有对比方法。3.提出基于用户反馈的实体摘要问题,并提出该场景下的实体摘要方法DRESSED。为了直接了解用户个体对摘要内容的要求,本文在实体摘要中引入基于“删除-替换”的用户反馈场景,使摘要方法有机会获取用户对摘要的反馈信息,并用来生成新的摘要。在该场景下提出的DRESSED方法利用深度神经网络设计策略函数,并基于强化学习对策略函数进行优化。实验结果表明,DRESSED在用户实验和模拟实验中都取得了优于对比方法的效果。4.构建实体摘要方法的评测集ESBM。该评测集克服了现有评测集存在的各种局限,并满足现有研究对高质量评测集的要求。本文详细介绍了该评测集的设计与构建过程,并对该评测集的数据进行了分析。目前ESBM已成为实体摘要领域公开可获取的规模最大的评测集,并已在一些现有工作中被使用,本文基于ESBM开展的实验也进一步验证了该评测集的有效性。
蒋鹏[5](2020)在《基于神经网络的文本摘要及其评价方法的研究》文中研究说明评价是自然语言处理领域中的热点研究方向,这些研究的共性是模型对原文语义的理解。随着科技的快速发展,特别是机器学习和深度学习的发展,这些研究可以很好的应用到机械产品设计的用户需求分析中。客户的产品需求中存在大量的信息,应用这些技术可以准确概括产品设计要求并且通过评价方法判断自动文本摘要模型对客户需求的解析是否准确。摘要研究主要包括摘要的生成和摘要评价,其中抽取式和抽象式摘要是自动文本摘要生成的两种主流的方式。抽取式摘要直接提取原文中的重要语句拼接形成摘要,但随着神经网络的发展,抽象式摘要成为了摘要生成的主流方法。该方法使用深度学习理论训练模型理解原文,进而生成摘要。模型生成摘要后需要对摘要的质量进行评价,摘要评价主要包括外部评价和内部评价。内部评价方法利用参考摘要与系统摘要的信息重合度评价摘要的质量。而外部评价方法与内部评价方法恰恰相反,这种评价方法无需参考摘要,它利用系统摘要代替原文档执行某个文档应用。虽然文本摘要和摘要评价都取得了较好的发展,但摘要模型在准确定位原文关键语义信息和主流的内部摘要评价标准ROUGE在计算待评价语句之间的深层语义信息方面及该种方法的评价结果不受参考摘要主观性的影响仍然有进步的空间,由此可以进一步推动摘要及评价研究的发展。本文对基于神经网络的文本摘要及其评价方法进行了研究。首先,为解决摘要模型难以定位并获取关键语义信息而导致摘要生成不准确的问题,提出了一种基于定位注意力与竞争机制的摘要模型,该模型提高了摘要生成的准确率。其次,本文为解决摘要评价方法ROUGE仅计算系统摘要与参考摘要之间的共现信息未考虑待评价语句之间的深层语义信息和评价结果受参考摘要主观性的影响的问题,将摘要评价方法的研究分为两部分。第一,提出了一种使用选择门和类内度量的语义匹配模型,能够解决摘要和原文语义匹配中存在非相似冗余特征而导致匹配准确率低的问题。第二,提出了使用语义相似的摘要评价模型,将使用选择门和类内度量的语义匹配模型与特征融合算法结合去完善摘要评价标准。针对基于神经网络的文本摘要及其评价方法的研究,本文的主要贡献如下:首先,为解决摘要模型难以定位并获取关键语义信息而导致生成摘要不准确的问题,本文设计了一种基于定位注意力与竞争机制的摘要模型。该模型主要包括三个部分:基于定位注意力和倒叙结构的序列到序列网络、基于选择门编码器网络和竞争机制。首先,通过重要信息概率叠加的方式利用关键字辅助关键句,增加注意力机制分配关键信息的权重进而定位关键语义信息,将其输入解码器生成摘要。同时,将关键句输入基于选择门编码器网络中,通过计算词语在句子中的语义分配概率挑选关键信息,将信息输入解码器中生成摘要。进而设计一种计算摘要与关键句余弦值的竞争机制,对以上两个网络生成的摘要进行优选,作为最终结果。实验表明,该模型在LCSTS中文数据集上测试Rouge-1为38.17%、Rouge-2为22.24%、Rouge-L为34.97%,优于目前较好的RNN-distract和DRGD模型。其次,为解决摘要和原文匹配中存在非相似冗余特征而导致匹配准确率低的问题,本文设计一种使用选择门和类内度量的语义匹配模型。首先,将待比较的句子经过双向长短时记忆网络向量化后输入选择门,通过计算词语在句子中的语义分配概率挑选最接近原始语义的关键特征,减少冗余信息的干扰。其次,提出了一种学习细粒度相似特征的融合损失方法,计算聚合层和预测层语义向量之间的距离,将其与原损失函数共同反馈到选择门,进而迭代优化关键特征,使得特征类内间距更小,进而利于句子语义匹配。实验表明,该方法在中文自制数据集和Quora英文数据集上测试,准确率分别能够达到96.01%和88.67%,优于目前表现较好的双向多角度匹配模型。最后,为解决ROUGE摘要评价方法只计算系统摘要与参考摘要之间的重叠信息及评价结果受参考摘要主观性的影响而导致摘要评价不合理的问题,本文设计一种使用语义相似的摘要评价模型。首先,将摘要和原文输入上述使用选择门和类内度量的语义匹配模型中计算语义相似得分。其次,本文提出了一种得分特征融合算法,使用语义相似得分和ROUGE得分计算置信距离矩阵、关系矩阵,通过界限值计算最佳融合组,再使用极大似然法计算最佳融合组的最优融合评价分数。实验表明,该方法在中文数据集上测试,变异系数F-1-cv是55.593、58.488和71.462,变异系数F-L-cv是52.736、61.685和74.857。在英文数据集上测试,变异系数F-1-cv是105.621、42.626和43.124,变异系数F-L-cv是107.996、42.062和37.298,在扩展实验中也证明优于ROUGE评价方法。总体而言,本文分别从摘要模型准确定位原文关键语义信息和完善ROUGE摘要评价方法的合理性等几个方面解决摘要生成不准确和摘要评价不合理的问题,并取得了明显的成效,对未来文本摘要技术应用到机械产品设计的需求分析中概括设计要素提供了技术支持。
秦菲[6](2020)在《基于深度学习的自动生成文本摘要及其评估的研究》文中指出随着互联网的快速发展,信息的爆炸式增长,文本信息是人们获取信息的主要来源,近年来自然语言处理技术受到越来越多研究者的重视,自动生成文本摘要技术是该技术的一个重要研究分支。本文针对自动生成文本摘要技术进行研究,并将句子语义相似度匹配技术和摘要评价技术作为摘要技术的支持性研究。首先通过改进传统注意力机制和损失函数,提出了一个基于语义相似注意力机制的摘要模型,将原文与生成摘要两者的语义特征向量余弦相似距离与条件概率损失函数相融合共同反馈至注意力机制,使生成的摘要更贴近原文语义。其次,通过研究语义相似性在摘要技术和摘要评估上的应用,提出了一种基于最优特征的句子语义相似匹配模型,用于判断两条句子语义相似程度。最后,在语义相似匹配模型的基础上通过结合Rouge摘要评估算法,提出了一种基于最优融合分数的摘要评估方法,使评估结果更加接近于人工评价。本文主要贡献如下:1.针对当前摘要模型难以获取与原文语义相关的上下文信息,导致生成摘要不准确的问题。本章提出了一种基于语义相似注意力机制的摘要模型。首先,建立了一个语义相似注意力机制,通过计算编码器和解码器隐藏层状态之间的余弦距离,同时将该距离引入注意力机制中辅助该机制获取与原文语义相似度较高的上下文语义信息。其次,提出了一种学习语义相似特征的融合损失方法,将余弦距离与原损失函数加权融合反馈至语义相似注意力机制,进而迭代更新上下文信息。最后,解码器利用最贴近原文的语义信息生成准确性更高的摘要。实验结果表明,该模型在Rouge-1和Rouge-2评价分数上有0.65%和0.17%的提高。2.本章设计了一个基于择优选择机制的语义匹配模型,用于句子相似性识别的最优特征匹配以提高准确度。相较于没有使用特征择优机制的模型,该模型使用最贴近原文语义的关键特征进行匹配,从而获得更高的匹配性。本章提出了一种改进的语义信息选择机制,通过计算词语在句子中的语义分配概率挑选尽可能接近原文语义的一个候选特征。同时,设计了一种新的注意力焦点机制,通过迭代更新信息权重得到另一个可能影响匹配准确性的候选特征,然后利用上下文向量和两个候选特征设计了一种择优算法计算挑选系数,进而从候选特征中选择最优特征进行语义匹配。实验结果表明,该模型在英文和中文数据集上匹配准确率有1.86%和0.86%的显着提升,优于目前表现较好的匹配模型。3.针对Rouge评估方法未考虑原文与生成摘要之间语义相关,仅计算两者之间重合单元的分数,导致评估不合理的问题,本章设计了一种基于最优融合分数的摘要评估方法。首先,提出了一个带有选择门的句子语义相似匹配模型,通过计算词语概率分布获得原文与生成文本两者的关键特征,使用该特征进行句子相似度匹配,并得到语义相似度得分。其次,使用Rouge-1、Rouge-2和Rouge-L方法分别计算原文和生成文本之间重叠单元的得分。最后,通过计算语义相似分数和Rouge分数的置信距离矩阵和相关矩阵得到两者的最佳融合候选结果,进而使用最大值原理得到最优融合数据。实验表明,本章方法使用中文数据集和英文数据集在不同模型生成的摘要上进行评价都接近人工评价标准。综上所述,这三方面的研究内容是一个完整的体系,基于语义相似注意力机制的摘要模型是核心,一种基于最优融合分数的摘要评估方法是验证,而基于择优选择机制的句子语义相似匹配模型是两者的重要内容。
林超然[7](2020)在《基于专利数据挖掘的关键共性技术识别及预测研究 ——以3D打印为例》文中进行了进一步梳理面对以技术保护为导向的国际环境,摆脱技术依赖、全面提升我国技术水平是重要的战略选择,受限于创新资源,集中优势力量开发关键共性技术是非常必要的。关键共性技术是社会技术构成中最为重要和核心的部分,开发关键共性技术,能够保障国家产业安全、推动创新型集群发展、指导战略新兴产业技术选择、实现国家层面的技术预见并带动多产业协同升级。关键共性技术具有准公共物品属性,不可避免地存在关键共性技术供给主体缺位、搭便车等问题,导致关键共性技术供给不足,阻碍了我国技术创新由追赶向超越转变之路。因此,通过科学手段识别关键共性技术,预测关键共性技术未来趋势,并有针对性的提出发展关键共性技术的对策建议是重要的研究课题。本研究首先在梳理和归纳国内外相关研究成果的基础上,介绍了关键共性技术等概念的概念、内涵和特征;通过专利计量理论、共现理论以及技术生命周期理论阐述了关键共性技术的理论背景;基于国内外研究趋势构建了关键共性技术识别与预测的研究框架,并根据研究框架对本研究的总体逻辑思路做出解析。其次,基于本研究所提出的关键共性识别及预测的研究框架,设计了数据的采集思路,研究选择以专利数据作为技术信息来源,并以3D打印技术为例,构建了专利检索表达式获得3D打印相关专利数据,经过专利文本预处理以及隐含狄利克雷分布(LDA)模型聚类,获得了3D打印技术主题类别信息以及时间趋势。再次,从动力因素、微观基础以及宏观表现三方面探讨了技术主题演化机理,并通过演化博弈仿真分析,验证了演化假设;基于这些假设条件,得到3D打印相关技术主题的混淆关系以及转移关系,为关键共性技术识别提供了分析基础。接下来,基于共现理论和隐马尔可夫模型(HMM)构建了关键共性技术的识别框架,使用Viterbi算法识别专利文献中的专业术语,通过将技术主题的共类特征数值化,作为共性程度的度量,将技术主题节点在技术演化转移网络中的关键程度作为技术关键性的表征,并使用Page Rank算法衡量技术主题的关键性。应用该框架得到3D打印技术的关键性度量以及共性程度度量,进而识别得到3D打印技术领域种的关键共性技术;为验证识别框架的准确性,将识别结果与《产业关键共性技术发展指南(2017年)》所提出关键共性技术做以对比,对比显示识别结果相关程度较高。随后,结合LDA主题模型以及HMM模型,预测3D打印技术主题研发趋势、3D打印技术主题研发结构,并从短期、中期和长期角度预测未来3D打印技术领域中关键共性技术构成;采用灰色预测、IPC分类号聚类方法作为对比,验证预测结果的准确性,且预测准确程度优于对比方法;通过随机剔除原始数据后重复实验验证了本研究方法的稳健性。最后,从国家层面、企业层面角度提出促进我国关键共性技术发展的对策建议,主要包括构建促进关键共性技术发展的制度体系、完善关键共性技术研发的配套服务工作、建立政企以及非盈利性组织的合作机制等,强调国家扶持、中介服务专业化、技术共享、技术创新战略布局的重要意义;在此基础之上,有针对性的提出加快我国3D打印关键共性技术快速发展的对策建议。结果表明,本研究所提出的关键共性技术识别及预测框架总体效果较好,识别精度高、预测结果准确且稳定性较高。3D打印关键共性技术识别案例中,共得到31个技术主题,其中底座、降噪减震以及喷头技术是目前研发热点,激光粉末成型技术、可循环技术、彩色打印技术、打印头技术、义齿打印技术、打印过程中冷却散热技术、底座技术以及树脂光固化技术为3D打印领域关键共性技术;未来针对喷头、作业平台等技术主题的研究将逐渐减弱,而激光聚焦、打印头、彩色打印、可循环、物料/送料、控制以及义齿等技术主题,将成为未来几年的研发焦点,是值得投入研发力量的重要研发方向。
徐燕燕[8](2019)在《中美博士论文摘要中元话语使用及其身份建构的对比研究》文中指出随着国际学术交流的不断拓展,英语写作作为进入国际学术舞台和加强国际学术交流的重要一步愈发受到重视。语篇中话语资源的运用对整个语篇结构、作者的观点态度、立场身份及科研成果的推广都具有重要作用。元话语作为话语资源的一种不仅可以有效组织语篇,且能够帮助作者与读者之间形成良好的互动关系。自1959年“元话语”这一术语提出之后,引起了国内外广大学者的关注。作为学术语篇重要组成部分,摘要写作是文章内容精要的再现。目前学术界对摘要的研究大多集中于语步或体裁的研究,对摘要中元话语的研究涉及较少,尤其是跨语言和跨学科的摘要中元话语使用的对比研究更显阙如。本研究对国内外元话语的研究前沿、关键文献、核心作者、主要期刊等维度的研究成果进行回顾,并在回顾的基础上对元话语已有的研究进行深度述评。接着,结合元话语和身份建构相关的理论搭建本研究的分析框架,以中美两国教育学科与通信学科共200篇博士论文摘要为研究对象,对比分析两者中元话语的使用及其建构的身份差异。研究结果发现:两者摘要中元话语的使用和身份的建构既存在相同点又有差异。第一,中美两国教育学科与通信学科博士论文摘要中都包括对过渡语、框架标记语、内指标记、语码注释语、自我指称语、介入式标记语、情感标记语、鉴别标记语和评判标记语这9种类型的使用。建构的身份类型方面,包括组织者、对话者和评价者这3大主类,分别细分为衔接者,解释者,自发互动者,他发互动者,评他者和评我者。此外,作者在摘要中建构衔接者身份的包括过渡语、框架标记语和内指标记语,建构解释者身份的元话语是语码注释语,建构自发互动者身份的元话语为自我指称语,建构他发互动者身份的元话语是介入式标记语,建构评价者身份的元话语包括情感标记语、鉴别标记语和评判标记语。在子类元话语类型方面,我们研究发现:国内教育学科和通信学科博士论文摘要中对过渡语、框架标记语及自我指称语的使用频次和频率较高。此外,通信学科在过渡语、框架标记语、语码注释语、自我指称语、鉴别标记语和评判标记语的使用上高于教育学科。建构的主次类身份类型方面,研究结果显示:在主类身份中的组织者和对话者方面,国内通信学科的频次和频率都高于教育学科。在评价者方面,通信学科的频次和频率低于教育学科。在次类身份中的衔接者和自发互动者方面,通信学科的频次和频率高于教育学科。在解释者、他发互动者和评他者方面,结果相反。第二,美国教育与通信学科摘要中,通信学科元话语使用总量高于教育学科,过渡语仍是居于第一位,两者对内指标记这类元话语的使用均较少。框架标记语方面,通信学科高于教育学科。鉴别标记语方面,教育学科高于通信学科,这两类元话语类型在学科之间存在较大差异。身份类型方面,3大主类身份上,通信学科的频次和频率都高于教育学科。在次类身份层面上,通信学科在衔接者、自发互动者、评我者和解释者方面高于教育学科。但他发互动者和评他者方面,则结果相反。第三,中美两国教育学科中,美国的频率高于国内,国内在过渡语、框架标记语和自我指称语方面,这三种类型的元话语使用频率、频次和百分比较高,而美国则是在自我指称语和评判标记语方面,使用频率最高。其次,在框架标记语方面存在显着差异,美国的使用频次和频率明显高于国内。主类身份类型上,在组织者和评价者方面,美国博士论文摘要中使用的频次高于国内。在对话者方面,国内的频次高于美国,但是,就频率层面而言,则存在较大差异,美国三种身份使用的频率明显高于国内,两国评价者和对话者的频率差异较小。在次类身份层面上,中美两国中,美国对衔接者和自发互动者两类身份的使用频率高于国内,尤其是衔接者身份。第四,中美两国通信学科中,美国的频率高于国内,国内排名前四位高频率类型的元话语分别为过渡语、框架标记语、语码注释语和自我指称语,美国则为过渡语、框架标记语、自我指称语和评判标记语。在其他类型方面,国内情感标记语的频率最低,美国介入式标记语的频率最低。身份类型方面,美国博士论文摘要中三种主类身份类型使用的频次均高于国内。在次类身份方面,衔接者和自发互动者两类身份的频次和频率都较高。他发互动者方面,频次上,国内的使用高于美国;频率上,国内低于美国。在解释者、评他者和评我者层面上,国内的频次和频率都低于美国的使用。基于以上的比较分析,本研究从学科差异、语言差异、思维方式、文化差异等方面归纳影响差异的因素。首先,元话语使用差异总结如下:学科差异方面,因文科类人文色彩较浓厚,因此在介入式标记语方面表现明显。理工科侧重于数据的客观性和科学性,因此多使用框架标记语和语码注释语来架构文章结构。语言差异方面,因研究的语料分析是英语和汉语的摘要,故在统计结果中英文“and”出现频率较高,因此框架标记会广泛运用。思维方式方面,中国作者的写作中更多是将客观事实与他人观点的结合,然后直观总结出自己的主观意识。此外,中国作者更侧重事实的描述,在摘要中对过渡语的使用较少。而英文作者注重于逻辑思维和学术写作中的严谨性。文化差异方面,受中国传统儒家思想的影响,国内作者写作中使用情感类和评价类的元话语较少。而美国作者更直接表达自身感受和批判思维。其次,身份建构差异的影响主要是中国作者们偏向集体主义文化导向,作者写作过程中通常会通过群体或学术团体来表达自己的观点,因此个体身份的体现不明显。相反,美国的个人主义思想在社会占据主流,个性化思想通过写作也能体现,在科研成果的创新之处和独特见解地方,作者们多会通过自我身份凸显来表达自身科研的突出成就。因此,中美两国之间在次类自发互动者与主类评价者身份上差异明显。最后,以期通过差异分析为文理科作者摘要的写作提供一定的借鉴与启示。本研究的启示包括两点。理论上,元话语理论与身份建构理论的结合,对作者在摘要写作中合理表达观点和身份具有借鉴和启示。实践上,对教师教学而言,教师需在教学中加强元话语理论和身份理论等知识的教授;对学生学习而言,学生应增强对语言文化知识的学习,从而提高摘要写作水平。
王攀成[9](2019)在《基于话题模型和引文信息的相关工作自动生成》文中进行了进一步梳理研究者在撰写科技文献时,需要撰写相关工作章节,通过和已有研究的对比来彰显自身研究的创新和价值。撰写相关工作章节需要作者阅读大量的相关文献,并对相关文献中和自身工作相关的部分进行分析概括和凝炼,这需要耗费作者大量的时间和精力,因此本文对相关工作章节自动生成技术展开研究,旨在为研究者在生成相关工作章节时提供参考和帮助。针对相关工作生成中的文档内容相关性建模问题,本文首先利用话题模型对需要生成相关工作的目标文献和它的参考文献集之间的相关性进行建模,提出了话题模型Query Topic Sum来描述目标文献和参考文献的生成过程,将目标文献的生成过程建模为从背景词汇分布ΦB和文档特定词汇分布ΦD中采样得到;将参考文献的生成过程建模为从背景词汇分布ΦB、文档特定词汇分布ΦD以及与目标文献相关的词汇分布ΦT中采样得到,本文利用ΦT来实现目标文献和参考文献的相关性度量。本文针对科技文献摘要中文献长度过长、内容选择困难的问题,引入了外部的引文信息用于相关工作生成。本文为每篇参考文献提供了3至20条引文,从参考文献中找到和引文最相符的文本片段,也叫作被引片段,将被引片段看作是经过学术界标注的参考文献中的重要语句。本文提出了基于两层集成模型的被引片段自动识别技术在CL-Sci Summ数据集上取得了最佳性能,应用被引片段识别技术,本文为每篇参考文献找出了最相符的被引片段。本文构建了相关工作生成的大规模评测数据集NudtRwG,并提出了结合话题模型和引文信息的统一的相关工作生成模型ToC-RWG。ToC-RWG利用Query Topic Sum得到的参考文献与目标文献相关的话题分布φT作为目标分布,以被引片段作为候选语句,利用KL散度作为指标去优化摘要的一元组分布和ΦT的距离来生成相关工作。最终,经过后处理步骤的文本作为生成的相关工作。实验表明,本文基于话题模型和引文信息的相关工作生成模型ToC-RWG在基准模型的基础上实现了显着的性能提升,证明了本文模型的有效性。
季小阳[10](2019)在《建立知识驱动的迁移学习方法比较多物种的精子功能生物学特性》文中研究表明随着社会经济的不断发展,动物繁殖在畜牧业和动物生产中变的越来越重要。提高动物繁殖率可以不断扩大良种覆盖率,提高动物生产效率以及增加经济效益。其中精子生物学特性研究是动物繁殖学的核心内容,与物种的延续和遗传进化紧密相关。随着高通量测序技术以及生物信息技术的发展,基于已发表的海量文献,我们已经获得了较为详细的精子生物学基因功能、基因表达以及突变检测位点等基因组数据信息。但这些基因功能和细胞生物学先验知识主要集中在人类或者一些模式动物中,在不同物种的知识分布上却不平衡。当我们将研究对象确定为某一种畜牧动物时,却发现并没有可靠和足够的数据信息支持该物种的生物学研究。本研究针对这一问题,基于已发表的精子生物学海量文献、比较基因组学数据、功能基因组学数据以及知识驱动的自动化文献挖掘方法,构建多个物种的精子生物学特性的知识图谱,实现物种间精子生物学特性的知识迁移。具体的研究内容与结果如下:(1)以“公共健康”关键词的文献摘要作为对照组,构建“精子”生物学特性知识图谱。基于知识驱动的自动化文献挖掘统计方法,获得精子生物学特性相关的特异性基因1195个,特异性实体2162个,以及1195个基因与2162个实体之间的关联矩阵,作为标准模型。同时基于标准化知识分类,获得89个精子生物学特性实体类别,以及与该实体类别最相关的文献摘要信息。(2)结合IPA、KEGG数据库的信号通路的通路特征(pathway signatures)数据信息,获得精子生物学特性实体类别显着相关的信号通路(即精子生物学特性类别信号通路),以及该信号通路所富集的基因。进一步分析,我们获得每一个精子生物学特性类别中被显着激活和被显着抑制的信号通路。以及187个信号通路中每一个信号通路被显着激活和被显着抑制所对应的精子生物学特性类别。(3)基于物种基因组学数据和同源基因组数据信息,构建蒙古族五畜“山羊、绵羊、双峰驼、马、牛”的精子生物学特性知识图谱。结合人类精子生物学特性的标准知识数据库和信号通路功能数据库,进行物种间精子生物学特性的知识迁移。我们发现11个精子生物学特性类别信号通路在5个物种中是显着保守的(z-score>5),以及获得不同物种中特异性保守的精子生物学特性类别信号通路(z-score>3)。同时,在相对保守的110个精子生物学特性类别信号通路所富集的基因网络中(z-score>3),发现RAF1、和EGF基因是网络中的枢纽基因。(4)在“马和驴、山羊和绵羊”两对近缘物种之间进行精物生物学特性的可迁移性评估。分别获得每对近缘物种之间显着保守且可以互相进行迁移的精子生物学特性类别信号通路,以及单个物种显着特异性保守且不可迁移的精子生物学特性类别信号通路(Z-score>5)。(5)在“单峰驼、双峰驼、羊驼、野生双峰驼”4个骆驼科物种之间进行精子生物学特性的可迁移性评估。获得4个物种之间显着保守且可以迁移的13个精子生物学特性类别信号通路,以及单个物种特异性保守且不可迁移的精子生物学特性类别信号通路(Z-score>3)。同样,还获得只在某一物种的精子生物学特性类别中没有被显着激活的信号通路,如“Toll-like Receptor Signaling”信号通路在羊驼的精子细胞DNA和蛋白质结构相关的生物学特性中没有被显着激活,而在单峰驼、双峰驼和野生双峰驼中被显着激活。因此,我们以精子生物学文献摘要作为知识背景,构建知识驱动的自动化文献统计挖掘方法绘制了精子生物学标准知识图谱。同时,采用迁移学习方法构建多物种精子比较功能生物学组,进而实现物种间精子生物学特性的可迁移性评估,为深入了解不同物种的精子生物学特性提供了一定的数据和理论基础。
二、文献与摘要(31)(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、文献与摘要(31)(论文提纲范文)
(2)融合信任度及不确定上下文质量修正模型的本体建模研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究背景 |
1.2 主要研究目的和意义 |
1.3 国内外研究现状 |
1.4 本文研究内容与创新点 |
1.5 论文结构安排 |
第2章 相关理论与技术 |
2.1 上下文感知计算 |
2.1.1 上下文的定义和分类 |
2.1.2 上下文的感知和获取 |
2.1.3 上下文的建模 |
2.1.4 上下文的推理 |
2.2 本体建模方法 |
2.2.1 本体的要素 |
2.2.2 本体的构建方法 |
2.2.3 本体的建模语言和模糊本体 |
第3章 可提高上下文质量的高质量上下文本体 |
3.1 上层本体模型 |
3.2 加入优化上下文质量层的中层本体模型 |
3.2.1 上下文质量表示层 |
3.2.2 实现上下文质量的修正 |
3.3 下层光伏发电预测领域本体模型 |
3.4 光伏发电预测模型 |
3.5 其他领域的上下文本体 |
3.6 仿真实验 |
3.6.1 评估高质量本体模型 |
3.6.2 光伏预测模型实验 |
3.7 小结 |
第4章 利用模糊上下文本体与机器学习方法进行文献摘要的研究 |
4.1 文献领域词语的模糊性和模糊本体 |
4.2 文本摘要介绍 |
4.3 文本摘要相关研究 |
4.3.1 基于统计的自动摘要方法 |
4.3.2 基于主题的方法 |
4.3.3 基于图模型的自动摘要方法 |
4.3.4 基于机器学习的自动摘要方法 |
4.3.5 基于本体的自动摘要方法 |
4.4 基于模糊本体的文本摘要方法 |
4.4.1 模糊本体的定义 |
4.4.2 词语的领域隶属度 |
4.4.3 词语的作者兴趣隶属度 |
4.4.4 词语的文档主题隶属度 |
4.4.5 句子选择与摘要过程 |
4.5 仿真实验 |
4.5.1 数据准备与评测标准 |
4.5.2 实验结果与分析 |
4.6 小结 |
第5章 利用补全的上下文提高文档检索效率 |
5.1 基本的信息检索方法 |
5.1.1 布尔检索 |
5.1.2 倒排索引 |
5.1.3 排名检索模型 |
5.2 基于文章兴趣度的信息检索 |
5.2.1 文献检索上下文本体 |
5.2.2 建立基于兴趣度的文献检索模型 |
5.3 仿真实验 |
5.3.1 数据准备与评测标准 |
5.3.2 实验结果与分析 |
5.4 小结 |
第6章 总结与展望 |
参考文献 |
致谢 |
在学期间主要科研成果 |
一、发表学术论文 |
二、申请发明专利 |
三、获奖情况 |
(3)基于粗糙数据推理的文本关键词与摘要抽取算法(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文的主要研究内容 |
1.4 论文的组织结构 |
2 相关理论与技术基础 |
2.1 粗糙数据推理理论 |
2.1.1 粗糙集理论 |
2.1.2 粗糙推理空间 |
2.1.3 粗糙数据推理 |
2.2 文本关键词抽取技术 |
2.2.1 基于统计特征的关键词抽取方法 |
2.2.2 基于词图模型的关键词抽取方法 |
2.2.3 基于主题模型的关键词抽取方法 |
2.2.4 Word2Vec模型 |
2.2.5 关键词抽取的评价 |
2.3 文本摘要抽取技术 |
2.3.1 文本摘要抽取算法 |
2.3.2 LDA主题模型 |
2.3.3 摘要质量评估方法 |
2.4 本章小结 |
3 基于粗糙数据推理的TextRank关键词抽取算法 |
3.1 基于粗糙数据推理的TextRank关键词抽取算法 |
3.1.1 TextRank关键词抽取算法分析 |
3.1.2 基于粗糙数据推理的改进算法 |
3.2 关键词抽取实验及结果分析 |
3.2.1 实验数据 |
3.2.2 评价标准及实验环境 |
3.2.3 实验结果及分析 |
3.3 本章小结 |
4 基于粗糙数据推理的词向量聚类TextRank关键词抽取算法 |
4.1 基于粗糙数据推理的词向量聚类TextRank关键词抽取算法 |
4.1.1 改进算法分析 |
4.1.2 基于粗糙数据推理的词向量改进算法 |
4.2 关键词抽取实验及评价标准 |
4.2.1 实验数据 |
4.2.2 评价标准及实验环境 |
4.3 实验结果及分析 |
4.3.1 确定权重系数α、β |
4.3.2 对比实验 |
4.3.3 实验结果及分析 |
4.4 本章小结 |
5 基于粗糙数据推理的加权图模型自动文本摘要 |
5.1 TextRank摘要算法分析研究 |
5.2 基于粗糙数据推理的加权图模型自动文本摘要 |
5.2.1 TextRank权值 |
5.2.2 候选句权重调整 |
5.2.3 冗余处理 |
5.2.4 基于粗糙数据推理的加权摘要抽取 |
5.3 实验数据及环境 |
5.3.1 实验数据 |
5.3.2 评价标准及实验环境 |
5.4 实验结果及分析 |
5.4.1 确定权重系数α、β、γ |
5.4.2 对比实验 |
5.4.3 实验结果及分析 |
5.5 本章小结 |
结论 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(4)基于语义网的实体摘要方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 问题陈述 |
1.2.1 基本概念 |
1.2.2 实体摘要问题定义 |
1.3 研究现状 |
1.3.1 实体摘要方法 |
1.3.2 实体摘要评价 |
1.4 主要工作 |
1.4.1 基于内容优化的实体摘要 |
1.4.2 基于内容编码的实体摘要 |
1.4.3 基于用户反馈的实体摘要 |
1.4.4 实体摘要方法的评测集 |
1.5 论文结构 |
第二章 相关工作 |
2.1 实体摘要方法的技术特征 |
2.1.1 通用特征 |
2.1.2 专用特征 |
2.2 实体摘要方法的宏观架构 |
2.2.1 简单架构 |
2.2.2 基于随机游走的架构 |
2.2.3 基于相似度分组的架构 |
2.2.4 基于MMR重排序的架构 |
2.2.5 组合优化 |
2.2.6 监督学习 |
2.3 实体摘要的评价方法 |
2.3.1 评价指标 |
2.3.2 评测集 |
2.4 相关的其他摘要问题 |
2.5 本章小结 |
第三章 ESSTER: 基于内容优化的实体摘要 |
3.1 方法概述 |
3.2 模型设计 |
3.2.1 结构重要性 |
3.2.2 文本可读性 |
3.2.3 语义低冗性 |
3.2.4 组合优化模型 |
3.3 模型求解 |
3.4 评测实验 |
3.4.1 实验设置 |
3.4.2 参评方法 |
3.4.3 实验结果与分析 |
3.5 本章小结 |
第四章 DeepLENS: 基于内容编码的实体摘要 |
4.1 方法概述 |
4.2 模型设计 |
4.2.1 三元组编码 |
4.2.2 实体描述编码 |
4.2.3 三元组打分 |
4.3 模型训练 |
4.4 评测实验 |
4.4.1 实验设置 |
4.4.2 参评方法 |
4.4.3 实验结果与分析 |
4.5 本章小结 |
第五章 DRESSED: 基于用户反馈的实体摘要 |
5.1 实体摘要的用户反馈场景 |
5.2 用户反馈场景建模 |
5.3 策略函数设计 |
5.3.1 三元组编码 |
5.3.2 状态编码 |
5.3.3 三元组打分 |
5.3.4 决策 |
5.4 模型训练 |
5.4.1 模型实现 |
5.4.2 模拟用户 |
5.5 评测实验 |
5.5.1 用户实验 |
5.5.2 模拟实验 |
5.6 本章小结 |
第六章 ESBM: 实体摘要方法的评测集 |
6.1 评测集的设计 |
6.2 评测集的构建 |
6.2.1 实体描述的收集 |
6.2.2 标准摘要的收集 |
6.3 评测集的分析 |
6.3.1 基本统计信息 |
6.3.2 实体描述的异构性 |
6.3.3 标准摘要的一致性 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 工作总结 |
7.2 研究展望 |
致谢 |
参考文献 |
攻读博士期间发表的论文和参与的项目 |
(5)基于神经网络的文本摘要及其评价方法的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
§1.1 研究背景及意义 |
§1.2 国内外研究现状与问题 |
§1.2.1 文本摘要 |
§1.2.2 摘要评价标准 |
§1.2.3 句子语义匹配 |
§1.2.4 神经网络 |
§1.3 文本数据库简介 |
§1.4 本文研究内容 |
§1.5 本文结构 |
§1.6 本章小结 |
第二章 基于定位注意力与竞争机制的摘要模型 |
§2.1 相关研究工作 |
§2.2 基于定位注意力与竞争机制的摘要模型设计 |
§2.2.1 基于定位注意力和倒叙结构的序列到序列网络 |
§2.2.2 基于选择编码器的摘要网络 |
§2.3 实验数据与结果分析 |
§2.3.1 实验设置与数据 |
§2.3.2 实验结果及分析 |
§2.4 本章小结 |
第三章 使用选择门和类内度量的语义匹配模型 |
§3.1 相关研究工作 |
§3.2 语义匹配模型设计 |
§3.2.1 基于选择门特征抽取网络 |
§3.2.2 基于融合损失函数的语义匹配网络 |
§3.3 实验结果与分析 |
§3.3.1 实验参数和实验数据设置 |
§3.3.2 实验结果及分析 |
§3.4 本章小结 |
第四章 使用语义相似的摘要评价模型 |
§4.1 相关研究工作 |
§4.2 模型设计 |
§4.2.1 语义相似网络 |
§4.2.2 特征得分融合算法 |
§4.3 实验结果与分析 |
§4.3.1 实验参数设置和数据集 |
§4.3.2 实验结果分析 |
§4.4 本章小结 |
第五章 自动文本摘要研究在机械设计用户设计要求解析中的应用 |
§5.1 机械设计中的自然语言处理 |
§5.2 自动文本摘要技术在机械设计中的具体应用 |
§5.3 本章小结 |
第六章 总结与展望 |
§6.1 本文总结 |
§6.2 展望 |
参考文献 |
致谢 |
(6)基于深度学习的自动生成文本摘要及其评估的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
§1.1 研究背景及意义 |
§1.2 国内外研究现状与问题 |
§1.2.1 自动生成摘要技术 |
§1.2.2 句子语义相似匹配技术 |
§1.2.3 摘要评估方法 |
§1.2.4 长短时记忆网络 |
§1.3 本文研究内容 |
§1.4 论文的结构安排 |
§1.5 本章小结 |
第二章 基于语义相似注意力机制的摘要模型 |
§2.1 门控循环单元神经网络 |
§2.2 相关研究工作 |
§2.3 模型设计 |
§2.3.1 语义相似注意力机制 |
§2.3.2 融合损失的设计 |
§2.4 实验结果与分析 |
§2.4.1 基准数据集实验 |
§2.5 本章小结 |
第三章 基于择优选择机制的语义匹配模型 |
§3.1 长短时记忆网路原理 |
§3.2 相关研究工作 |
§3.3 模型设计 |
§3.3.1 基于择优选择机制的特征提取网络 |
§3.3.2 最优特征匹配网络 |
§3.4 实验结果与分析 |
§3.4.1 实验数据及设置 |
§3.4.2 实验性能与结果分析 |
§3.5 本章小结 |
第四章 基于最优融合分数的摘要评估方法 |
§4.1 相关研究工作 |
§4.2 方法设计 |
§4.2.1 基于选择门的语义相似句子匹配模型 |
§4.2.2 Rouge评价方法 |
§4.2.3 总概率的最大值法 |
§4.2.4 cv变异系数 |
§4.3 实验分析 |
§4.3.1 实验数据及设置 |
§4.3.2 实验结果及分析 |
§4.4 本章小结 |
第五章 总结与展望 |
§5.1 本文总结 |
§5.2 未来工作及展望 |
参考文献 |
谢辞 |
作者在攻读硕士期间主要研究成果 |
(7)基于专利数据挖掘的关键共性技术识别及预测研究 ——以3D打印为例(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 论文研究的背景、目的及意义 |
1.1.1 论文研究的背景 |
1.1.2 论文研究的目的及意义 |
1.2 国内外研究动态 |
1.2.1 国外研究动态 |
1.2.2 国内研究动态 |
1.2.3 国内外研究动态综述 |
1.3 论文的总体思路、主要内容及研究方法 |
1.3.1 论文的总体思路 |
1.3.2 论文的研究内容 |
1.3.3 论文的研究方法 |
1.4 论文的创新之处 |
第2章 关键共性技术识别与预测的研究基础及框架 |
2.1 相关概念界定 |
2.1.1 专利文献的基本概念和内涵 |
2.1.2 数据挖掘的基本概念和内涵 |
2.1.3 关键共性技术的基本概念和内涵 |
2.2 关键共性技术识别与预测的理论基础 |
2.2.1 专利计量理论 |
2.2.2 共现理论 |
2.2.3 技术生命周期理论 |
2.3 关键共性技术识别与预测的框架构建及解析 |
2.3.1 关键共性技术识别与预测的框架构建 |
2.3.2 关键共性技术识别与预测框架的解析 |
2.4 本章小结 |
第3章 专利文献采集及聚类 |
3.1 专利文献采集及聚类方案设计 |
3.1.1 专利文献数据获取方案 |
3.1.2 专业术语识别方案 |
3.1.3 专利文献预处理方案 |
3.1.4 专利文献技术主题聚类方案 |
3.2 专利文献数据采集处理 |
3.2.1 案例产业选择 |
3.2.2 专利文献数据获取 |
3.2.3 专利文献预处理 |
3.3 专利文献数据技术主题聚类分析 |
3.3.1 LDA模型迭代次数确定 |
3.3.2 LDA模型主题数量确定 |
3.3.3 LDA模型结果及分析 |
3.3.4 技术主题分类准确性评价 |
3.4 本章小结 |
第4章 技术主题演化机理及关键共性技术特征分析 |
4.1 技术主题演化机理分析 |
4.1.1 技术主题演变的微观基础 |
4.1.2 技术主题演变的宏观表现 |
4.2 关键共性技术主题特征分析 |
4.2.1 技术主题共现主题词分布 |
4.2.2 技术主题混淆关系分析 |
4.2.3 技术主题转移关系分析 |
4.3 本章小结 |
第5章 基于专利文献挖掘的关键共性技术主题识别 |
5.1 关键共性技术识别模型构建 |
5.1.1 关键共性技术识别模型构建原则 |
5.1.2 关键技术识别模型构建 |
5.1.3 共性技术识别模型构建 |
5.1.4 关键共性技术识别模型构建 |
5.2 关键共性技术主题识别 |
5.2.1 关键技术主题识别 |
5.2.2 共性技术主题识别 |
5.2.3 关键共性技术主题识别 |
5.3 关键共性技术主题识别结果评估 |
5.3.1 关键共性技术识别评估数据来源 |
5.3.2 关键共性技术识别评估结果分析 |
5.4 本章小结 |
第6章 基于专利文献挖掘的关键共性技术主题预测 |
6.1 关键共性技术预测模型构建 |
6.1.1 关键共性技术预测模型假设条件 |
6.1.2 关键共性技术预测初始HMM建立 |
6.2 关键共性技术主题预测实证分析 |
6.2.1 技术主题研发趋势预测 |
6.2.2 技术主题研发结构预测 |
6.2.3 关键共性技术构成预测 |
6.3 关键共性技术主题预测准确性和稳健性评估 |
6.3.1 关键共性技术主题预测准确性评估 |
6.3.2 关键共性技术主题稳健性评估 |
6.4 本章小结 |
第7章 促进关键共性技术发展的对策建议 |
7.1 关键共性技术发展的国家制度层面对策 |
7.1.1 构建促进关键共性技术发展的制度体系 |
7.1.2 完善关键共性技术研发的配套服务工作 |
7.1.3 建立政企以及非盈利性组织的合作机制 |
7.2 关键共性技术发展的企业层面对策 |
7.2.1 企业应重视关键共性技术战略布局 |
7.2.2 以长期视角看待关键共性技术发展 |
7.2.3 促进企业间关键共性技术共研共享 |
7.3 关键共性技术发展的特定技术领域层面对策 |
7.3.1 攻克当前关键共性技术中的重点领域 |
7.3.2 布局未来关键共性技术中的新兴领域 |
7.3.3 增进关键共性技术的多样性和长期性 |
7.4 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文和取得的科研成果 |
致谢 |
图表目录 |
(8)中美博士论文摘要中元话语使用及其身份建构的对比研究(论文提纲范文)
摘要 |
Abstract |
缩略词、术语与人名英汉对照表 |
第一章 导论 |
1.1 研究缘起 |
1.2 研究内容 |
1.3 研究意义 |
1.4 创新之处 |
1.5 论文框架 |
第二章 文献综述 |
2.1 国外元话语研究回溯 |
2.2 国内元话语研究综述 |
2.3 国内外元话语研究述评 |
2.4 不足与启示 |
2.5 本章小结 |
第三章 本研究的理论背景 |
3.1 元话语理论 |
3.2 身份建构理论 |
3.3 本研究分析框架 |
3.4 小结 |
第四章 研究设计 |
4.1 研究问题 |
4.2 研究对象 |
4.3 研究工具 |
4.4 数据收集与分析 |
4.5 本章小结 |
第五章 结果与讨论 |
5.1 研究结果 |
5.1.1 国内教育学科博士论文摘要的数据分析 |
5.1.2 国内通信学科博士论文摘要的数据分析 |
5.1.3 美国教育学科博士论文摘要的数据分析 |
5.1.4 美国通信学科博士论文摘要的数据分析 |
5.1.5 中美教育学科博士论文摘要的对比分析 |
5.1.6 中美通信学科博士论文摘要的对比分析 |
5.1.7 国内教育学科与通信学科博士论文摘要的对比分析 |
5.1.8 美国教育学科与通信学科博士论文摘要的对比分析 |
5.2 讨论 |
5.2.1 元话语类型和身份类型的总体情况 |
5.2.2 元话语类型与身份类型在学科中及中美之间的差异 |
5.2.3 元话语类型与身份类型相同与差异的影响因素 |
5.3 本章小结 |
第六章 元话语视角下的英文摘要写作教学 |
6.1 对教学的指导作用 |
6.1.1 加强跨学科素养教育,提升理论知识 |
6.1.2 加强教师教学内容的针对性,提高学习系统性 |
6.1.3 开展跨文化知识教学,优化学习效果 |
6.1.4 丰富教学形式,促进师生互动 |
6.2 摘要写作的启示 |
6.2.1 拓宽文献阅读范围,关注语言组织 |
6.2.2 积极学习语言和文化知识,提升文字表达 |
6.2.3 分析作者特征,实现针对性练习 |
6.3 本章小结 |
第七章 结语 |
7.1 本研究的研究发现 |
7.2 本研究对摘要写作的启示 |
7.3 本研究的不足及对未来研究的展望 |
参考文献 |
附录Ⅰ 元话语类型和身份类型统计表 |
附录Ⅱ 攻读硕士学位期间撰写的论文 |
致谢 |
(9)基于话题模型和引文信息的相关工作自动生成(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状及成果 |
1.2.1 自动相关工作生成 |
1.2.2 科技文献摘要 |
1.3 论文主要研究工作 |
1.4 论文组织架构 |
第二章 相关技术研究与本文思路 |
2.1 相关工作生成任务 |
2.1.1 基于话题的摘要 |
2.1.2 对比性摘要 |
2.2 话题模型 |
2.2.1 LDA话题模型 |
2.2.2 LDA模型的衍生模型 |
2.3 引文分析及被引片段识别 |
2.3.1 引文分析 |
2.3.2 被引片段识别 |
2.4 ToC-RWG的基本框架 |
2.5 本章小结 |
第三章 基于话题模型的文献相关性建模 |
3.1 引言 |
3.2 Topic Sum:多文档摘要的话题模型 |
3.3 Query Topic Sum:建模文献相关性的话题模型 |
3.3.1 模型定义与描述 |
3.3.2 模型推断 |
3.4 本章小结 |
第四章 基于两层集成模型的被引片段识别 |
4.1 引言 |
4.2 两层集成模型RANSA+Hybrid框架 |
4.3 数据均衡化 |
4.3.1 欠采样算法对比 |
4.3.2 过采样算法和混合算法对比 |
4.4 RANSA:面向数据集成 |
4.5 Hybrid-Stacking:面向模型集成 |
4.6 实验分析 |
4.6.1 数据集和评价指标 |
4.6.2 实验设置 |
4.6.3 实验结果和分析 |
4.7 本章小结 |
第五章 结合话题模型和引文信息的相关工作生成 |
5.1 引言 |
5.2 数据集构建和话题模型训练 |
5.2.1 数据集构建 |
5.2.2 话题模型训练 |
5.3 生成相关工作章节 |
5.4 实验分析 |
5.4.1 数据集和评价指标 |
5.4.2 实验结果和分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 研究展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(10)建立知识驱动的迁移学习方法比较多物种的精子功能生物学特性(论文提纲范文)
摘要 |
abstract |
1 引言 |
1.1 研究背景及意义 |
1.2 精子生物学特性概述 |
1.2.1 精子结构 |
1.2.2 精子发生 |
1.2.3 受精 |
1.3 知识驱动的自动化学习方法 |
1.3.1 信息检索 |
1.3.2 生物医学命名实体的识别 |
1.3.3 命名实体之间关系的抽取 |
1.3.4 文本标准化分类 |
1.3.5 信号通路的功能分析 |
1.4 工具与数据库介绍 |
1.5 研究内容 |
1.6 论文组织结构 |
2 搭建知识驱动的自动化学习方法 |
2.1 引言 |
2.2 构建主题文献摘要数据库 |
2.3 主题文献摘要中特异性基因与实体的识别 |
2.3.1 特异性基因的识别 |
2.3.2 主题特异性实体的识别 |
2.3.3 主题实体的标准化分类 |
2.3.4 主题类别最显着相关的摘要集 |
2.3.5 基因与主题实体之间关系距离(relational distance,RD)的计算 |
2.3.6 “主题”实体类别与特异性基因的关系距离计算 |
2.3.7 “主题”实体类别的信号通路分析 |
3 构建“精子”生物学特性知识图谱 |
3.1 引言 |
3.2 “精子”生物学特性的实体识别 |
3.2.1 构建“精子”生物学特性的特片性基因库 |
3.2.2 构建“精子”生物学特性的特异性实体库 |
3.3 “精子”生物学特性的特异性实体的标准化分类 |
3.4 “精子”生物学特性相关的文献摘要集 |
3.5 “精子”生物学特性实体与基因之间关系距离的计算 |
3.6 “精子”生物学特性类别与特异性基因关联 |
3.7 “精子”生物学特性实体类别的信号通路分析 |
4 蒙古族“五畜”的精子生物学特性研究及迁移性评估 |
4.1 引言 |
4.1.1 迁移学习 |
4.1.2 直系同源基因 |
4.2 “五畜”精子生物学特性基因库的构建 |
4.3 5个物种精子生物学特性类别的信号通路构建方法 |
4.4 5个物种的精子生物学特性类别的信号通路分析 |
4.4.1 5个物种之间全局保守的信号通路分析 |
4.4.2 5个物种特异性高保守的信号通路分析 |
4.4.3 5个物种全局以及特异性保守信号通路的相关基因分析 |
4.5 讨论 |
5 近缘物种之间的精子生物学特性研究及迁移性评估 |
5.1 引言 |
5.2 马和驴的精子生物学特性的可迁移性研究 |
5.3 山羊和绵羊的精子生物学特性的可迁移性研究 |
5.4 讨论 |
6 骆驼科物种精子生物学特性及迁移性评估 |
6.1 引言 |
6.2 骆驼科物种的精子生物学特性基因库的构建 |
6.3 骆驼科物种的精子生物学特性类别信号通路的构建方法 |
6.4 骆驼科物种的精子生物学特性类别信号通路分析 |
6.4.1 4个物种之间全局保守的精子生物学特性类别信号通路 |
6.4.2 4个物种特异性高度保守且不可迁移的精子生物学特性类别信号通路 |
6.4.3 单个物种没有被显着激活的精子生物学特性类别信号通路 |
6.5 讨论 |
7 结论与创新性 |
7.1 结论 |
7.2 本研究的创新性 |
致谢 |
参考文献 |
四、文献与摘要(31)(论文参考文献)
- [1]Meta分析摘要和全文的信息完整性评价及其相关性分析 ——基于肿瘤免疫治疗文献的研究[D]. 王佳琳. 中国医科大学, 2021
- [2]融合信任度及不确定上下文质量修正模型的本体建模研究[D]. 刘洪飞. 齐鲁工业大学, 2021(10)
- [3]基于粗糙数据推理的文本关键词与摘要抽取算法[D]. 石雯茜. 兰州交通大学, 2021(02)
- [4]基于语义网的实体摘要方法研究[D]. 刘庆霞. 南京大学, 2020(09)
- [5]基于神经网络的文本摘要及其评价方法的研究[D]. 蒋鹏. 桂林电子科技大学, 2020(04)
- [6]基于深度学习的自动生成文本摘要及其评估的研究[D]. 秦菲. 桂林电子科技大学, 2020(02)
- [7]基于专利数据挖掘的关键共性技术识别及预测研究 ——以3D打印为例[D]. 林超然. 哈尔滨工程大学, 2020(04)
- [8]中美博士论文摘要中元话语使用及其身份建构的对比研究[D]. 徐燕燕. 南京邮电大学, 2019(02)
- [9]基于话题模型和引文信息的相关工作自动生成[D]. 王攀成. 国防科技大学, 2019(02)
- [10]建立知识驱动的迁移学习方法比较多物种的精子功能生物学特性[D]. 季小阳. 内蒙古农业大学, 2019(01)