“数据分析教程”版本间的差异
来自NoteExpress知识库
(以“ 按照一定检索式收集的文献,其元数据本身隐含了很多该研究方向的信息。 例如年份分布展示了研究的热度趋势;关键词分...”为内容创建页面) |
|||
| 第3行: | 第3行: | ||
例如年份分布展示了研究的热度趋势;关键词分布展示了研究切入点的情况;来源分布展示了哪些刊物更关注这类研究的进展;作者的频次分布展示了该研究领域的牛人;通过计算关键词的共现频次矩阵,可以得到相关系数矩阵,进一步进行聚类分析及可视化展示各要素之间的相关关系,这些都对明晰我们所关注的科学问题提供了帮助。 | 例如年份分布展示了研究的热度趋势;关键词分布展示了研究切入点的情况;来源分布展示了哪些刊物更关注这类研究的进展;作者的频次分布展示了该研究领域的牛人;通过计算关键词的共现频次矩阵,可以得到相关系数矩阵,进一步进行聚类分析及可视化展示各要素之间的相关关系,这些都对明晰我们所关注的科学问题提供了帮助。 | ||
| − | |||
---- | ---- | ||
| − | |||
'''针对单一元数据字段的频次分布可以使用文件夹信息统计功能。''' | '''针对单一元数据字段的频次分布可以使用文件夹信息统计功能。''' | ||
| − | 可见:[[文件夹信息统计教程]]。 | + | 可见:[[文件夹信息统计教程]]。 |
---- | ---- | ||
| − | |||
'''针对多值字段的共现频次矩阵、相关系数和相异系数矩阵计算,以及词云图和路径关系图的绘制可以使用数据分析功能。''' | '''针对多值字段的共现频次矩阵、相关系数和相异系数矩阵计算,以及词云图和路径关系图的绘制可以使用数据分析功能。''' | ||
| 第21行: | 第18行: | ||
2、点击工具栏里的【数据分析】 | 2、点击工具栏里的【数据分析】 | ||
| − | [[文件: | + | [[文件:05-2 数据分析教程a.png|1100px|center]] |
| − | + | 3、选择分析字段,可选择分析字段的所有值或者按出现频次倒序前**个的值进行分析 | |
| − | + | 4、展示左侧当前选中题录中题录的详细字段值可以双击进行编辑,标题分词可以通过“|”进行调整 | |
| − | + | 5、参与分析的题录可以单独储存为一个扩展名为xml的文件,下次可以通过【打开】,载入之前保存的xml文件,点击下一步 | |
| − | + | [[文件:05-2 数据分析教程b.png|800px|center]] | |
| − | + | 6、双击可以对同义词进行词规范化;左侧查看规范化后的词频统计结果;点击下一步 | |
| − | [[文件: | + | [[文件:05-2 数据分析教程c1.png|800px|center]] |
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| − | + | ||
| + | 7、选择分析方法,点击下一步 | ||
| + | [[文件:05-2 数据分析教程c.png|600px|center]] | ||
'''词云图''' | '''词云图''' | ||
| − | [[文件: | + | [[文件:05-2 数据分析教程e.png|800px|center]] |
| − | + | ||
| − | + | ||
'''词共现关系图''' | '''词共现关系图''' | ||
| − | [[文件: | + | [[文件:05-2 数据分析教程f.png|800px|center]] |
| − | + | ||
| − | + | ||
'''共现次数矩阵、相关系数矩阵、相异系数矩阵图''' | '''共现次数矩阵、相关系数矩阵、相异系数矩阵图''' | ||
| − | [[文件: | + | [[文件:05-2 数据分析教程g.png|1500px|center]] |
| − | + | ||
| − | + | ||
'''所有的统计图表都支持导出,以供进一步使用。''' | '''所有的统计图表都支持导出,以供进一步使用。''' | ||
2026年5月12日 (二) 10:46的最后版本
按照一定检索式收集的文献,其元数据本身隐含了很多该研究方向的信息。
例如年份分布展示了研究的热度趋势;关键词分布展示了研究切入点的情况;来源分布展示了哪些刊物更关注这类研究的进展;作者的频次分布展示了该研究领域的牛人;通过计算关键词的共现频次矩阵,可以得到相关系数矩阵,进一步进行聚类分析及可视化展示各要素之间的相关关系,这些都对明晰我们所关注的科学问题提供了帮助。
针对单一元数据字段的频次分布可以使用文件夹信息统计功能。
可见:文件夹信息统计教程。
针对多值字段的共现频次矩阵、相关系数和相异系数矩阵计算,以及词云图和路径关系图的绘制可以使用数据分析功能。
1、在题录列表中选中需要分析的题录
2、点击工具栏里的【数据分析】
3、选择分析字段,可选择分析字段的所有值或者按出现频次倒序前**个的值进行分析
4、展示左侧当前选中题录中题录的详细字段值可以双击进行编辑,标题分词可以通过“|”进行调整
5、参与分析的题录可以单独储存为一个扩展名为xml的文件,下次可以通过【打开】,载入之前保存的xml文件,点击下一步
6、双击可以对同义词进行词规范化;左侧查看规范化后的词频统计结果;点击下一步
7、选择分析方法,点击下一步
词云图
词共现关系图
共现次数矩阵、相关系数矩阵、相异系数矩阵图
所有的统计图表都支持导出,以供进一步使用。






