Gephi是一款可以进行可视化和分析大型网络图的开源软件,可用作探索性数据分析,链接分析,社交网络分析,生物网络分析等,功能非常强大,支持Windows, Mac OS X等多个平台。有需要的用户可以下载试试哦。
1、【实时可视化】
从最快的图形可视化引擎中获益,以加速大图中的理解和模式发现。在其特殊的OpenGL引擎的支持下,Gephi正在推动交互式高效网络探索的发展方向。
网络最多100,000个节点和1,000,000个边缘
使用动态过滤迭代可视化
丰富的图形处理工具
2、【布局】
布局算法为图形赋予形状。Gephi提供最先进的算法布局算法,以提高效率和质量。布局调色板允许用户在运行时更改布局设置,从而显着增加用户反馈和体验。
基于力的算法
优化图形可读性
3、【度量】
统计和度量框架为社交网络分析(SNA)和无标度网络提供了最常用的指标。
中介中心性,贴近度,直径,聚类系数,PageRank
社区检测(模块化)
随机发生器
最短路径
4、【创建制图】
使用排名或分区数据使网络表示有意义。自定义颜色,大小或标签,以便为网络表示带来意义。矢量预览模块允许您在使用SVG或PDF进行探索之前进行最后的触摸和关注美学。
可定制的PDF,SVG和PNG导出
保存预设
5、【动态过滤】
过滤网络以根据网络结构或数据选择节点和/或边缘。使用交互式用户界面实时过滤网络。
无需脚本即可创建复杂的筛选查询
根据过滤结果构建新网络
保存您最喜欢的查询
导入CSV数据
启动导入CSV向导和第一步
如图所示,首先在Data Laboratory中单击“导入CSV”按钮
然后,导入向导将打开,并向您提供一些与表无关的常规选项。
在此步骤中,您将指示CSV文件的格式,并可以预览结果表。
首先指定一个不为空的CSV文件
然后从一些常用选项中选择值分隔符以及文件的编码/字符集
最后,选择表以导入文件的行和列。Edges表文件至少需要标记为“源”和“目标”的列(可以区分大小写)
最后一步-选择列详细信息和表特定选项
最后一步为节点表或边表提供了一些常用选项和行为描述:
您可以标记要使用的列,并在尚不存在时选择其类型
如果未提供节点/边缘ID列或某行为空,则将分配一个自动ID
导入到节点表
导入节点表时,您还可以指示是否要更新节点的数据,而不是在具有该ID的节点已经存在时创建新节点。
导入到边表
在导入到edges表的情况下,行为有些不同:
所有行都必须使用“源”和“目标”节点ID
边缘类型是可选的,其默认值为“定向”
导入动态数据
纵向(也称为动态)网络只是按时间顺序演化的网络。如果您想像一下朋友的网络,则节点,连接和属性值的数量会随着时间的流逝而增长和变化。我们称这些动态属性为因为它们具有与特定时刻相关联的值。
纵向网络
有两种方法可以对纵向网络进行建模,一种是每个网络都是特定时间点(一天,一个月,...)的网络集合,或者是每个元素都有一个存在间隔的切片网络。这也可以描述为时间的离散与连续表示。Gephi使用后者,也称为Intervals,因为它更灵活。
例如:
想象一下一个由三个节点组成的网络,它们分别是2007年,2008年和2009年。这些节点存在的年份可以用不同的时间点或时间间隔来表示(分别如下面箭头左侧和右侧所示) 。
第二个节点“ n2”在所有三年中都存在,并用括起来的第一年和最后一年的括号表示[2007,2009]。Gephi会自动在此范围内包含任何日期,例如2008。但是,第一个节点“ n1”用圆括号而不是括号封闭。这意味着该节点在2008年存在,但在2009年不存在。
从技术上讲,方括号用于封闭(也称为“包含”)间隔,而括号表示开放间隔。换句话说,括在两个括号内的日期包括起点和终点,而括在两个括号内的日期则在起点之后开始,并在终点之前结束。像上面的[2007,2009)例子一样,将两者结合起来的半封闭间隔也是可能的。
检查数据实验室,以了解如何为每个节点或边创建间隔。当网络是纵向的时,会出现一个“时间间隔”列,该列显示图表中的时间间隔。您可以通过在“数据实验室”的“配置”选项卡中单击“作为图形的时间间隔”旁边的复选框将其可视化。启用时间轴后,请确保调整时间轴的滑动过滤器窗口的大小,否则您将收到一条错误消息,指出Gephi“无法在没有动画间隔的情况下为时间轴设置动画”。
从GEXF文件导入
所述GEXF格式包括表示带有间隔纵向网络所需要的一切。您定义一个网络,但添加“开始”和“结束”属性以设置节点/边缘出现或消失的时间。
基本例子
以下是我们先前的示例,其中包含从2007年到2009年的三个节点,但是我们添加了一些边来完成示例图。
请注意以下要点:
我们将mode =“ dynamic”设置为图形元素,因为GEXF也可以表示静态图形
将start和end用于封闭间隔(例如:[2007,2009]),将startopen和endopen用于开放(例如:(2008,2009))
每个元素的开始和结束日期是可选的。将这些留空将创建一个[-infinity,+ infinity]间隔。如果像第二条边那样仅定义一个边界,则它变为[2009,+ infinity]。
GEXF入门手册中提供了GEXF规范,包括动态信息。
动态属性
上面的示例描述了如何随时间表示网络拓扑,其中添加或删除了节点和边缘。现在,让我们看看如何表示随时间变化的值,例如“价格”。以下是具有价格属性的同一网络。中的属性定义 元素与静态GEXF相同,但是值的写入方式已更改。
请注意以下几点
为了表示一段时间内的多个值,我们的想法是每个周期重复相同的attvalue,相同的for,但具有不同的值和开始/结束
不必在任何地方设置值,以防丢失默认值
对于节点“ n2”,值“ 12”始于2008年,并且未指定结束时间。给出间隔[2008,+ infinity],这意味着该值在2009年及之后保持为“ 12”。
GEXF规范(包括动力学属性)在GEXF Primer中可用。
动态重量
通常,边缘的权重直接在边缘元素中定义为特定值。定义动态权重属性将覆盖此值并提供动态权重支持。
规则是使用weight关键字定义标识符来定义edge属性。然后,使用如上所述的多个“ attvalue”来随时间设置不同的值。
转换时间间隔中的现有列
想象一下一个社交网络,其中每个节点代表您的一个朋友,而属性列之一就是您认识的日期。为了将此列转换为动态间隔,请执行以下步骤:
第1步:在数据实验室中单击“合并列”操纵器。
步骤2:从左侧的可用列中,添加要用于创建时间间隔的一列或多列(如果您同时具有开始和结束时间)。然后从可用的合并策略中选择“创建时间间隔”。
步骤3:选择哪一列是起点,哪一列是终点(如果不存在终点,则将此空白留空)。如果该列为数字列(整数,浮点数,双精度数),请选择解析数字。如果数据是日期字符串,则也可以将其解析并转换为时间间隔。我们的“初次见面”专栏只是一年中的某一天,只是一个数字。
对多个静态文件使用时间框架导入
此方法可以从一组静态“ snaphsots”文件创建纵向网络。如果您在不同的时间点都有完整的网络,并且想查看网络及其属性随时间如何变化,那么这是正确的方法。
请注意,此方法的实现仍处于试验阶段,可能无法在所有情况下都起作用。确保验证以下几点:
文件之间的节点标识符完全相同。如果不是,至少标签是(您可以在向导中选择)。
如果是GEXF,则您的网络模式设置为静态
开始导入时间范围时,工作空间中没有先前的图形
所有文件中的属性列均相同
数据集
例如,我们可以使用三个GEXF文件,并说每个文件都针对特定的年份,即2007年,2008年和2009年的网络。
在2007年的静态网络中,注意价格属性:
在2008年的静态网络中,节点“ 3”消失了,节点“ 4”出现了。价格和边缘的权重也发生了变化。
在2009年的静态网络中,节点“ 3”又回来了,节点“ 2”不见了,价格又改变了。
导入Gephi
在一个清晰的项目上执行以下步骤以导入您的数据集:
步骤1:导入第一个文件,然后在导入报告中选择“时间范围”,然后单击“确定”。这将显示一个设置对话框。
步骤2:选择日期或实数作为时间格式。实数是默认选择,此处我们输入的年份为2007。单击“确定”,文件被导入。
步骤3:您现在可以按时间顺序对所有其他文件执行相同的操作。对于第二个文件,请选择2008,然后选择2009等。
结果是在Gephi中创建了一个纵向网络,其中节点和边的时间间隔取决于它们在不同文件中的显示方式。同样,所有属性都是动态属性。数据集的DYNAMIC_INTEGER列中的“价格”属性,每个值都与其间隔相关联。此外,边缘的权重本身是动态的。
同类推荐
2022-09-30
立即下载2022-10-02
立即下载2022-09-19
立即下载2022-09-19
立即下载2022-09-19
立即下载2022-09-20
立即下载相关文章
Office永久激活_Office 2021各版本激活密钥
2022-12-1896微信编辑器如何使用收藏模板?
2022-12-18Canva如何设置背景?Canva设置背景的方法
2022-12-04Xmanager如何更改默认编辑器?
2022-05-20ACDSee如何使用魔术棒抠图?
2022-12-11Altium Designer恢复左边工具栏的方法
2022-05-27腾讯电脑管家使用扫一扫的方法
2022-12-04Powerpoint(PPT)如何做狙击枪瞄准射击特效动画?
2022-12-11MathType如何激活?MathType最新注册码下载
2022-11-12Windows movie make下载安装图文教程
2022-12-18