词频统计论文_饶高琦,李宇明

导读:本文包含了词频统计论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:词频,中国,算法,孔子,科研,红楼梦,社会。

词频统计论文文献综述

饶高琦,李宇明[1](2019)在《基于词频逆文档频统计的词汇时间分布层次》一文中研究指出汉语演变过程中,词语使用受时间影响的程度差异很大。这体现为词汇时间分布的不同。该文基于70年跨度历时语料库,使用TF-IDF方法对词汇的时间分布进行了统计,并尝试对词汇系统的时间分布层次进行划分。通过对历时文本分类性能、词类分布、词长分布、覆盖率和词语生命力五方面的考察和分析,建立了由基干层、过渡层、时间敏感层(时敏层)和逸散层构成的词汇时间分布四分层体系。(本文来源于《中文信息学报》期刊2019年11期)

江文路,张小劲[2](2019)在《中国共产党人民观的演进逻辑与特征——基于历次党代会报告的词频统计和语料分析》一文中研究指出作为中国共产党政治话语体系中的一项核心概念,人民一词在党代会报告中经历了从无到有、由少到多、从曲折波动到持续稳定的发展过程。通过对历届党代会报告及相关政治文件的语料分析,本文揭示了中国共产党成立以来人民群体的动态变化过程,归纳了中国共产党人民观从初步创生到发生转折、从二元区分到复合建构、从审慎乐观到曲折发展、从封闭排他到开放包容的现代演进特征。党对人民群体的划分标准既有静态内容也有动态调整,它主要取决于社会主要矛盾的变化。新时代坚持"以人民为中心"的发展思想,将"以人民为本位"的政治原则贯彻到治国理政的各项事业中,是党领导人民不断取得胜利的必由之路。(本文来源于《社会主义研究》期刊2019年05期)

胡媛,虞佳玲,艾文华[3](2019)在《科研数据管理研究综述——基于词频分析和阶段分布统计》一文中研究指出运用文献统计与内容分析方法,对国内外科研数据管理领域的高频关键词与数据生命周期阶段分布进行多维分析,从科研数据生命周期、科研数据管理需求、科研数据管理计划、科研数据开放共享,和科研数据管理服务与实践等5个方面对该领域的研究现状及热点进行分析与阐述,并在此基础上指出未来的研究趋势。建议科研数据管理研究应结合本国国情,借助生命周期的关键作用,重视需求调研,探索并完善适合本土的管理模式,推进相关技术领域的发展,以此提高管理效率,提升其服务社会的能力。(本文来源于《科技管理研究》期刊2019年18期)

丁帆,赵普光[4](2019)在《历史的轨迹:中国现当代文学研究七十年的实证分析——以论题词词频的统计为中心》一文中研究指出1949年至今七十年间的中国现当代文学研究,曲曲折折,波澜壮阔。对如此复杂的历史过程和汗牛充栋的研究文献做全面宏观的回顾与反思,既极为必要,又布满陷阱。因此,以七个十年的论题词词频为观测对象,进行实证研究和轨迹勾勒,是有意义的尝试。论题词词频是衡量某一时段研究状态的重要指标。论题词的频率、分布、集中程度等数据,论题词的显隐、共时差异、历时变化等形态,客观、立体地显示出中国现当代文学研究七十年历程的若干侧面。论题词词频与当代中国历史共振,每个历史节点往往是文学研究的转折期,每次历史震荡总能在文学研究中激起回声。在这个意义上,数据的变化即历史的轨迹。(本文来源于《文艺研究》期刊2019年09期)

程慧玲[5](2019)在《基于python的文本挖掘应用——以米9用户评论的词频统计为例》一文中研究指出随着互联网发展,数据的产生与存储无处不在,基于用户的行为数据分析对商家及消费者都具有重要意义。文章主要通过八爪鱼实现京东商城小米9用户评论的抓取,利用python进行文本数据挖掘及分析。通过导入文本数据建立语料库、并进行中文分词、词频统计、生成词云过程实现小米9用户评价的词频统计分析,得出用户对手机评价的侧重点,为商城用户及商家提供一定的决策建议。(本文来源于《青年与社会》期刊2019年20期)

胡翠婷[6](2019)在《基于词频计量统计的林黛玉性格分析》一文中研究指出本文从计量语言学的角度,通过对林黛玉诗词词频和动词词频的统计分析,来解读和阐释林黛玉的性格特征,力图呈现出一个立体化和多样化的黛玉形象。结果表明:林黛玉的诗词中与"花"相关的词很多,并且多使用情感消极的词汇,这也印证了林黛玉多愁善感、敏感自卑的性格。考察林黛玉动作动词时,发现在林黛玉的性格中还具有男子化的一面,这和普通的贵族少女迥然不同,也是以往研究所忽略之处。(本文来源于《现代语文》期刊2019年02期)

朱超超[7](2018)在《基于词频统计的教材语言研究》一文中研究指出教材是课程的重要教学资源,人教版中小学语文教材作为我国语文课程最权威的教材之一,其使用范围最为广泛。目前许多学者从不同角度对该教材进行研究,但鲜有从定量上对教材进行词汇分析。因此本文从统计学和语言学角度出发,对中小学教材中的词汇进行研究,并将其与现代汉语高频词进行比较,希望对教材编写提供语言学上的数据和理论支撑。本文共分为六部分:第一章:绪论主要对中小学语文教材的研究综述进行梳理,进而提出研究问题、研究对象、研究方法与研究价值。第二章:基于词频统计的中小学语文教材分析通过建立语料库的方式对中小学语文教材的词汇进行整合切分,并对教材中的词汇进行分类研究,发现教材中词类分布呈现不均衡状态,实词占主要地位,虚词占比较少的结论。第叁章:名词词类里的观念世界指出语文教材所含名词反映的观念和观念结构,通过大学各学科的分类能间接反映其知识类型结构的基础上,提出了本文语文教材名词分析框架,得出中小学语文教材具有比较完善的观念结构、观念之间具有不均衡性和知识类型缺失等结论,并且通过人物类观念分析教材中的意识形态得出其意识形态比较僵化、刻板的结论。第四章:形容词中的人物性格与情感世界通过对中小学语文教材中人物性格特质词与情感词分析,研究中小学语文教材中的人物性格与情感特征,发现教材中的人格特质词多表现为积极性、正向性,体现了文化特质,同时也存在社会性别刻板现象突出等缺憾,其次中小学教材中情感类词汇分布不均匀,存在一定问题。第五章:从高频词看中小学语文教材词汇特征通过对九个年级高频词统计,分析每个年级之间高频词有何不同,并将高频词与现代汉语语料库词语频率表比较,发现教材中词汇复现率较高,且随着年级提升,教材词汇越来越接近现代汉语词汇频率表的结论。第六章:结语教材语言是近年研究热点之一,本文在前者的研究基础上,对教材中的各词类做了相关分析综合,较为全面、深入地探讨教材中各词类分布特点。(本文来源于《浙江财经大学》期刊2018-12-01)

蔡松成,牛耘[8](2019)在《基于词频统计的蛋白质交互关系识别》一文中研究指出目前,基于远监督的蛋白质交互关系抽取方法通过将知识库中的实体对与文本中的实体进行匹配来产生大规模的训练数据,有效地解决了标注数据不足的问题。在基于最大期望算法的蛋白质交互识别的基础上,提出了一种基于词频统计的蛋白质交互关系识别。该方法对每一个蛋白质对签名档进行处理,取出两个目标蛋白质中间的单词;然后对其进行词性标注,只保留名词和动词,同时进行词干提取;最终得到每个蛋白质对签名档下的词频统计。利用得到的词频信息设定阈值来获取签名档的高频词,改进最大期望算法的初始化过程。实验结果表明,通过加入高频词信息的干预来进一步获取句子的类别作为初始值较原始的基于最大期望算法的模型,取得了更高且均衡的精确度和召回率,对目前基于远监督的蛋白质交互关系识别方法进行了明显的改进。(本文来源于《计算机技术与发展》期刊2019年02期)

冯丽娜[9](2018)在《基于词频统计的孔子与颜之推教育思想比较研究》一文中研究指出颜氏一族既是儒学世家,也是佛门弟子。虽然《颜氏家训》的创作基于儒者本分,其与儒家思想存在一脉相承的必然联系,但究其内容本身来看,颜氏与孔子的教育思想在为学科目之选择、治学方法之形成、倾慕效仿之榜样、勤学苦读之目的上实则存在很大差别。运用图书情报学领域的词频统计方法以及知识图谱表示方法对《颜氏家训》与《论语》文本进行词频分布对比分析,揭示二者在教育思想上表现出来的相承(相同)与相异关系。(本文来源于《图书馆杂志》期刊2018年10期)

王丽培[10](2018)在《《中华人民共和国公共图书馆法》词频统计与分析》一文中研究指出《中华人民共和国公共图书馆法》是我国公共文化法律法规政策体系的重要组成部分,以立法形式明确了公共图书馆事业的发展方向。本文运用词频统计方法对该法进行了词频分布规律探究,利用社会网络分析软件对核心分词与单条法律的关联性进行了可视化分析,归纳并揭示公共图书馆在法定原则下的定义与宗旨、管理体制、文献信息资源建设、职能与服务、法律责任等5个方面的时代特征、发展趋势,探究了各方面的立法依据以及立法实施过程中需要的辅助性立法内容。(本文来源于《图书馆工作与研究》期刊2018年09期)

词频统计论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

作为中国共产党政治话语体系中的一项核心概念,人民一词在党代会报告中经历了从无到有、由少到多、从曲折波动到持续稳定的发展过程。通过对历届党代会报告及相关政治文件的语料分析,本文揭示了中国共产党成立以来人民群体的动态变化过程,归纳了中国共产党人民观从初步创生到发生转折、从二元区分到复合建构、从审慎乐观到曲折发展、从封闭排他到开放包容的现代演进特征。党对人民群体的划分标准既有静态内容也有动态调整,它主要取决于社会主要矛盾的变化。新时代坚持"以人民为中心"的发展思想,将"以人民为本位"的政治原则贯彻到治国理政的各项事业中,是党领导人民不断取得胜利的必由之路。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

词频统计论文参考文献

[1].饶高琦,李宇明.基于词频逆文档频统计的词汇时间分布层次[J].中文信息学报.2019

[2].江文路,张小劲.中国共产党人民观的演进逻辑与特征——基于历次党代会报告的词频统计和语料分析[J].社会主义研究.2019

[3].胡媛,虞佳玲,艾文华.科研数据管理研究综述——基于词频分析和阶段分布统计[J].科技管理研究.2019

[4].丁帆,赵普光.历史的轨迹:中国现当代文学研究七十年的实证分析——以论题词词频的统计为中心[J].文艺研究.2019

[5].程慧玲.基于python的文本挖掘应用——以米9用户评论的词频统计为例[J].青年与社会.2019

[6].胡翠婷.基于词频计量统计的林黛玉性格分析[J].现代语文.2019

[7].朱超超.基于词频统计的教材语言研究[D].浙江财经大学.2018

[8].蔡松成,牛耘.基于词频统计的蛋白质交互关系识别[J].计算机技术与发展.2019

[9].冯丽娜.基于词频统计的孔子与颜之推教育思想比较研究[J].图书馆杂志.2018

[10].王丽培.《中华人民共和国公共图书馆法》词频统计与分析[J].图书馆工作与研究.2018

论文知识图

细分网格内的光流幅度Fig.1.3Optical...共现词矩阵图一51未登录词过滤主界面已识别词界面“不辍”历年词频统计柱形图日韩驻华大使馆官方账号微博条文词

标签:;  ;  ;  ;  ;  ;  ;  

词频统计论文_饶高琦,李宇明
下载Doc文档

猜你喜欢