第一,2005 年为我国关于科学知识图谱文献的起始年,《科学学研究》发表推出了国内第一篇科学知识图谱论文《悄然兴起的科学知识图谱》(
被引229 次,检索时间: 2014 年8 月13 日)。
第二,从1352 篇论文中抽取出的555 篇应用CiteSpace 的论文,其应用目的和研究领域的分布非常广泛,但主要集中在管理学领域,其中图书情报与档案管理占42. 12%,管理科学与工程、公共管理和工商管理共占22. 72%,教育学、社会学、体育学共占17. 41%,其余大都为人文社科领域,自然科学领域仅基础医学和生物学只占4. 7%。
第三,图谱解读偏颇。大部分图谱对高频节点都进行了解读,一半左右的文章会对聚类解读,接近一半的文章对高中心性节点进行了解读,42% 的文章含有图例说明,时间趋势和burst 的应用较少。
第四,CiteSpace 软件对数据格式的要求是以Web of Science 数据库的文本数据格式为标准,并随着ISI数据库中数据格式的变化而不断更新。【因此,从WOS上下载的引文数据,在CiteSpace中不需要转换,可以直接使用】
第五,阈值选择提供了多种数据筛选的策略。首推最简单的Top N 选择,即在每个时区中选择前N 个高频出现的节点;次推Top N% 选择,即在每个时区中选择前N% 个高频出现的节点; 第三种比较复杂,通过前、中、后三
个时间段的( c,cc,ccv) ,即( 被引或出现的频次,共被引或共现频次,共被引率或共现率) 的设置来筛选数据的方式,具体运行过程中通过线性插值的方法对各个时间段进行阈值控制。( c,cc,ccv) 的前两项是绝对值控制,实现对点的控制,ccv 是相对值控制,实现对线的控制,经验值为15 或20,这意味着我们对出现频率较高的两点的共现频率的要求也相应提高; 第四种选择是要与上述三种选择策略配合使用,选择出现频率在某个区间的文献( 或词等) ,这使得我们可以根据研究的具体内容,方便地删除掉可能无太大意义的高频文献或低频文献。
第六,。如果可视化初期结果
第二,从1352 篇论文中抽取出的555 篇应用CiteSpace 的论文,其应用目的和研究领域的分布非常广泛,但主要集中在管理学领域,其中图书情报与档案管理占42. 12%,管理科学与工程、公共管理和工商管理共占22. 72%,教育学、社会学、体育学共占17. 41%,其余大都为人文社科领域,自然科学领域仅基础医学和生物学只占4. 7%。
第三,图谱解读偏颇。大部分图谱对高频节点都进行了解读,一半左右的文章会对聚类解读,接近一半的文章对高中心性节点进行了解读,42% 的文章含有图例说明,时间趋势和burst 的应用较少。
第四,CiteSpace 软件对数据格式的要求是以Web of Science 数据库的文本数据格式为标准,并随着ISI数据库中数据格式的变化而不断更新。【因此,从WOS上下载的引文数据,在CiteSpace中不需要转换,可以直接使用】
第五,阈值选择提供了多种数据筛选的策略。首推最简单的Top N 选择,即在每个时区中选择前N 个高频出现的节点;次推Top N% 选择,即在每个时区中选择前N% 个高频出现的节点; 第三种比较复杂,通过前、中、后三
个时间段的( c,cc,ccv) ,即( 被引或出现的频次,共被引或共现频次,共被引率或共现率) 的设置来筛选数据的方式,具体运行过程中通过线性插值的方法对各个时间段进行阈值控制。( c,cc,ccv) 的前两项是绝对值控制,实现对点的控制,ccv 是相对值控制,实现对线的控制,经验值为15 或20,这意味着我们对出现频率较高的两点的共现频率的要求也相应提高; 第四种选择是要与上述三种选择策略配合使用,选择出现频率在某个区间的文献( 或词等) ,这使得我们可以根据研究的具体内容,方便地删除掉可能无太大意义的高频文献或低频文献。
第六,。如果可视化初期结果
