目 录
一、CiteSpace——基于文献计量法设计的数据可视化软件
(一)研究方法——文献计量法
二、以CNKI 为例进行案例分析
(一)数据处理
1. 获取数据
2. 转换数据
(二)建立项目/设置参数
(三)可视化结果
1. 关键词共现图谱的方法论基础、含义及分析
2. 聚类的功能
三、教师驻校培养模式研究的计量学分析结果
(一)教师驻校培养模式研究文献年度分布
(二)作者分布
四、教师驻校培养模式研究热点分析
(一)研究热点主题分析
(二)研究领域分析
五、教师驻校培养模式研究的演进路径
教师驻校培养模式研究发展及热点演进的文献计量学分析
——基于CitesSpace的可视化分析
本文旨在通过借助工具CiteSpace(可视化文献分析软件),来归纳和展望国内外对于教师驻校培养模式研究的发展历程、宏观趋势以及研究热点变化,达到论述文献计量法这一方法的目的。
一、CiteSpace——基于文献计量法设计的数据可视化软件
(一)研究方法——文献计量法
图1.CiteSpace支持数据库导出的文献题录及参考文献数据
图2.StartCiteSpace界面
图3.CiteSpace主界面
菜单栏是CiteSpace的功能与参数区,包括File(文件)、Projects(项目) 、Data(数据) Network(网络) 、Visualization(可视化) 、Geographical(地理化) 、OverlayMaps(叠加分析) Analytics(文献网络分析报告) 、Text(文本) 、Preferences(偏好设置) 、Tutorials(教程)、Resources(资源)、Community(社区)、Help(帮助)、Donate(捐献)。
工程区又叫操作区,该区域主要用于新建项目,点击New即可进入新工程的设置界面。运行进度区可以展示CiteSpace在运行过程中的数据操作。
功能选择区包括
1、Time slicing时间切片区,可以选择待分析文献的起止时间;
2、Text Processing文本处理区(包括Term source 选择聚类词来源和Term type聚类词类型);
3、Node types网络配置功能区,这部分可以选择节点类型,选择将直接决定会生成什么样的图谱(在其中,不同颜色的选项代表不同的含义:蓝色部分关于合作网络分析,对象可以是作者、机构或国家,如可以分析哪些作者、机构或文章的发文量比较多,哪些作者之间的合作比较多;绿色区是共性分析,其对象可以是主题、关键词、来源或WOS的分类,其中主题和关键词回答的问题是:哪些主题词或关键词出现的次数比较多,以及哪些词常常在同一篇文章中出现,反映了研究领域的热点词;红色部分是共被引分析,对象可以是参考文献、文献作者和期刊,回答的问题是哪些文献、作者和期刊被引用的次数最多,哪些常常被一起引用,这样的问题则反映了内容的相关性;灰色部分则是耦合分析);
4、Links连接强度计算(·Strength分析对象数据之间的连接强度 ·Scope范围);
5、Select criteria阈值选择标准;
6、Pruning 剪枝方式选择(优化结果);
7、Visualization可视化模式。
二、以CNKI 为例进行案例分析
本文以中国知网(CNKI)为例,以“教师驻校模式”为检索关键词用CiteSpace进行数据分析。分析过程包括以下几个部分:数据处理、建立项目/设置参数、可视化结果、结合图谱结果进行初步解读、分析结果并完成撰写报告。本文着重对前三个过程展开论述。
(一)数据处理
1.获取数据
(1)在桌面建立一个名为“data for citepace”(可任意命名)的数据库,用来专门存放citespace的数据。在其下以自己的研究主题再命名一个子文件夹(如图4,本文命名为“教师教育”),在子文件夹下新建四个文件夹:“input”、“output”、“project”和“data”。
图4.新建“data for citespace”的数据库
(2)进入中国知网(旧版)进行数据下载,在高级检索中限定主题或者关键词(本文在高级检索中输入“教师驻校模式”的关键词,选择中文文献)。
(3)点击“全选”之后有35篇文献,筛选并剔除无直接相关的文献两篇,分析剩余33份与研究主题直接相关的。若要导出大批量数据,可以在“每页显示”中选择50,再根据研究需要,如剔除报告、会议等相关文献。进入下一步,在“导出/参考文献”跳转的页面“请点击这里”中进行筛选。
图5.选择数据
(4)点击“导出/参考文献”选项,点击“文献导出格式”-“Refworks”-“导出”,将这份下载的txt文本格式的文件命名为download1,并放入“input”的文件夹中。
图6.文献输出
图7. 命名导出的参考文献
2.转换数据
(1)打开5.7.R2(64-bit),等待片刻后进入主界面(图3),点击Data(Import/Export)选择CNKI
——————————————————————————
(2)Data →Import→download1
(3)Input directory选择“input”文件夹,Output directory选择“output”文件夹
点击CNKI Format Conversion2.0,完成转换。可点击output文件夹检查数据转换与否。
(4)把output里的数据复制到“data”文件夹下
(二)建立项目/设置参数
1、新建项目。回到主界面,在控制面板菜单栏中点击File建立新项目,在“Title”中命名英文格式的项目,本文命名为Teacher Residency。
2、功能选择区进行参数选择。时间切片区From 2001 JAN To 2020 DEC,Node Types选择Keyword,Pruning在循进中选择Pruning sliced networks。点击”GO!”出现图8选项。
3、点击可视化操作”Visualize”
图8.可视化选项
(三)可视化结果
图9.菜单栏的工具功能简介
1.关键词共现图谱的方法论基础、含义及分析
共现分析的方法论基础是心理学的邻近联系法则和知识结构及映射原则。邻近联系法则是指曾经在一起感受过的对象往往在想象中也联系在一起,以致于想起它们中的某一个的时候,其他的对象也会以曾经同时出现时的顺序想起。关键词共现、作者共现、机构共现、国家共现、论文共现、期刊共现都是共现分析的一种。其中,作者共现分为作者合作网络分析、作者共被引分析[作者同被引];机构共现分为机构合作网络分析;国家共现又分为国家合作网络分析;论文共现分为文献共被引分析[文献同被引]和文献耦合。
参数中可以看见网络的节点数、边数和网络密度。图中所示标注的点即节点,一个节点代表一个关键词。边数是关键词之间的连线数,关键词之间的连线是指关键词在同一篇文献中出现过,因此二者会有一根连线。图中圆圈大小代表关键词,频数越大圆圈越大。线条代表关键词之间的联系,线条颜色与图中上方的年份相对应,用于标志每年都有哪些关键词。
关键词是对一篇文献的核心概况,分析关键词可以对文章主题进行窥探。一篇文献中的多个关键词必然存在着某种联系,那么这种联系可以用共现的频次来表示。一般认为,词汇对同一篇文献中出现的次数越多,则代表这两个主题之间的联系越紧密。频次是关键词出现的次数,年份代表某个关键词最早出现的年份是什么时候。其中阈值越小,显示的数量越多;阈值越大显示的关键词越少。
综上所述,共词分析法,即利用文献集中词汇或者名词短语共同出现的情况,来确定这篇文献集所代表学科中各主题之间的关系。统计一组文献的主题词两两间在同一篇文献出现的频率,便可形成一个由这些词对关联所组成的共词网络。
2.聚类的功能
共词分析法的原理是通过利用文献集中词汇对或名词短语共同出现的情况,来确定该文献集所代表学科中各主题之间的关系。掌握以上原理,是为了获得学科之间各主题之间的关系,由于主题通过使用关键词所表示,它的本质便是关键词之间的联系。同时,联系越紧密的关键词会形成一个小团体,进而能把小团体之间的关键词进行归纳总结,然后总结出一个主题,再对主题进行详细论述。以上操作步骤的本质是做聚类分析。点击”K”查看聚类,这一功能是当看不清或看不懂图谱时可以利用的方法。
图10.关键词显示
(聚类之间的间距可以在面板中调整)
需要补充的是,上图并没有显示全部聚类,原因是CiteSpace默认当关键词<10时,不显示一部分聚类。可以在”Filters”里取消”Show the Largest Connected Componet Only”这个选项,再重新聚类。也可以根据自己的需求设置确定数量的聚类,此时操作”Clusters”-”Show the Largest K Clusters”后输入自己需要的所含关键词最多的前几个聚类数;或者用序号来表示聚类。
图11.部分聚类显示
图12.全部聚类显示
三、教师驻校培养模式研究的计量学分析结果
(一)教师驻校培养模式研究文献年度分布
文献发表数量的变化能够在一定程度上反映某一研究领域的发展状况。研究对近二十年来我国教师驻校模式研究文献的年度分布情况进行统计,详见下图。
(二)作者分布
对文献作者情况进行计量学分析,不仅可以找出教师驻校培养模式研究领域的核心作者,也可以看出该领域学者之间的交流、合作情况。运行CitesSpace,设置时间跨度为“2000-2020年”,时间切片为1,节点类型中选择“作者”,阈值为Top=50,关键词引文数(C),关键词被引数(CC)、关键词共被引数(CCV)均设置为0、1、20,最终得到网络节点为42,连线数为14,密度为0.0163的作者共现知识图谱,详见下图。
四、教师驻校培养模式研究热点分析
(一)研究热点主题分析
关键词是一篇文章核心内容的凝练,且能反映这一领域的研究热点。[2]本文采用CitesSpace对教师驻校培养模式研究文献中出现的关键词进行分析,以了解近二十年来我国教师驻校培养模式的研究热点,绘制关键词知识图谱,详见图10。由图可以看出热点的词汇有“教师教育”“教师培养”“驻校培养”“薄弱学校”“城市教师驻校模式”,且这些热点词汇之间的联系也较为紧密。为进一步明确我国特殊教育教师研究热点主题,将主题词中介中心性及频次导出并制作成表格,详见表1。
表1 高频关键词频次、中心性关键词排序
序号 | 关键词 | 频次 | 序号 | 关键词 | 中心性 |
1 | 教师教育 | 13 | 1 | 教师教育 | 0.51 |
2 | 美国 | 12 | 2 | 美国 | 0.38 |
3 | 城市教师驻校模式 | 5 | 3 | 培养模式 | 0.25 |
4 | 培养模式 | 4 | 4 | 城市教师驻校模式 | 0.15 |
5 | 驻校模式 | 4 | 5 | 薄弱学校 | 0.15 |
6 | 教师培养 | 4 | 6 | 驻校教师 | 0.15 |
7 | 城市教师 | 3 | 7 | 教师培养模式 | 0.11 |
8 | 模式 | 3 | 8 | 教师培养 | 0.09 |
9 | 城市校区 | 3 | 9 | 教育硕士 | 0.09 |
10 | 薄弱学校 | 3 | 10 | 全日制教育硕士 | 0.08 |
中介中心性代表着以该关键词为主题的研究对网络图谱中其他关键词的中介效果,中介中心性越高,其影响越显著。[3]因此,该研究将频次与中介中心性共同作为研究热点的判断依据。频次排名较高且中介性大于0.1的关键词包括“教师教育”“美国”“培养模式”“城市教师驻校模式”“薄弱学校”“教师培养模式”等。这些关键词基本反应我国近二十年来教师驻校模式研究的热点及核心主题。
(二)研究领域分析
关键词聚类可将共现知识图谱中复杂的连线关系进行分析,以形成当前教师驻校模式主要研究领域。在调节关键词共现知识图谱的基础上,标识每个聚类,详见图11。第一个聚类为“城区教师驻校模式”。第二个聚类为“培养模式”。第三个聚类为“教师培养”。第四个聚类为“模式探析”。第五个聚类为“教师”。第六个聚类为“全日制教育硕士”。
五、教师驻校培养模式研究的演进路径
在聚类图的基础上,选择信息可视化中的时区视图选项统计并绘制关键词前沿时序图谱,详见图13。关键词突变用以显示研究的前沿是什么,在本文中由于文献数量太少无关键词突变,可以判断出在教师教育领域驻校模式的研究仍然较为分散,没有成体系的研究初步尝试期、巩固发展期及繁荣发展期等连续性的过渡阶段,因此想要通过预测该研究领域的演进路径还较为困难。
图13. 教师驻校培养模式关键词前沿时序图谱
参考文献:
[1] 陈悦.引文空间分析原理与应用[M].科学出版社,2014.
[2] 李杰,陈超美. citespace:科技文本挖掘及可视化[M].首都经济贸易大学出版社,2016.
[3] 冯永刚,彭兰香.近十五年我国德育研究热点及前沿趋势探微——基于文献计量学和科学知识图谱的可视化分析[J].山东师范大学学报(人文社会科学版),2018,63(05):70-82.
[4] Chaomei Chen. Science Mapping:A Systematic Review of the Literature[J]. Journal of Data and Information Science,2017,2(2):1-40.
[5] Chaomei Chen,Zhigang Hu,Shengbo Liu & Hung Tseng. Emerging trends in regenerative medicine:A scientometric analysis in CiteSpace [J]. Expert Opinionon Biological Therapy,2012, 12(5): 593-608.
信息计量学|CiteSpace使用教程(https://www.jianshu.com/p/49d41d0ccd7f)
联系客服