当前位置: 首页 > news >正文

个人建设网站流程/大数据营销专业

个人建设网站流程,大数据营销专业,为什么建设银行网站打不开,大方网站制作个人博客主页:Marigold 代码仓库:A-Unified-Framework-for-Deep-Attribute-Graph-Clustering Github主页:Marigoldwu 原文链接: 深度属性图聚类的统一代码框架 目录 概述快速上手目前支持的模型 近年来,属性图聚类得…

个人博客主页:Marigold
代码仓库:A-Unified-Framework-for-Deep-Attribute-Graph-Clustering
Github主页:Marigoldwu

原文链接: 深度属性图聚类的统一代码框架

目录

    • 概述
    • 快速上手
    • 目前支持的模型

近年来,属性图聚类得到迅速发展,各种深度属性图聚类方法不断被提出。虽然大部分方法都是开源的,但遗憾的是这些代码并没有一个统一的框架,这使得研究人员不得不花费大量的时间修改代码来达到复现的目的。幸运的是,Liu等人 [Github主页: yueliu1999]将深度图聚类方法整理成开源代码仓库—— Awesome-Deep-Graph-Clustering(ADGC)。他们提供了20多个数据集,并统一了数据集的格式。此外,他们列出了与深度图聚类相关的论文,并提供了源代码链接。值得一提的是,他们将深度图聚类的代码组织成rand-augmentation-model-clustering-visualization-utils结构,极大方便了初学者和研究者。在此,我谨代表我自己,向Liu等人的工作表示衷心的感谢和崇高的敬意。❤️

感谢以下作者的提供的开源代码(排名不分先后):

[ yueliu1999 | bdy9527| Tiger101010 | ZhihaoPENG-CityU]

概述

我在ADGC的基础上重构了代码,让深度聚类的代码实现了更高的统一。具体来说,我重新设计了代码的架构,让你可以在我的框架中轻松运行不同模型的代码,并且提升了可扩展性。此外,我定义了一些工具类和函数来简化代码并使一些配置更加清晰。

该项目的框架如下:

  • main.py: 该框架的程序入口文件。
  • requirements.txt: 需要被安装的第三方库环境。
  • dataset: 该目录包含你所需要的数据集,其中子目录用数据集名称命名,存放的文件为特征文件、标签文件和邻接矩阵文件,分别命名为 {数据集名}_feat.npy{数据集名}_label.npy{数据集名}_adj.npy, 例如 acm_feat.npyacm_label.npyacm_adj.npy。此外,该目录还包含一个dataset_info.py文件,其中存放了数据集的相关信息。
  • module: 该目录包含了模型最常用的基础模块, 例如自动编码器(AE.py)、图卷积层(GCN.py)、图注意力层(GAT.py)等。
  • model: 该目录包含你想要运行的模型。目录格式为:子目录是以模型名称的大写字母命名的,其中包含两个文件,分别是model.py用于存储模型类,train.py用于训练模型。我们的框架会根据输出模型的名称,自动导入模型对应的训练模块。此外,预训练模型也存放在这里,并且目录格式为: pretrain_{模块名}_for_{模型名},该目录是完全小写的,其中存放一个train.py文件。例如,如果你想要预训练SDCN中的AE模块,你可以将其命名为pretrain_ae_for_ sdcn,存放在model中,其中只有一个train.py文件即可。
  • utils: 该目录包括一些工具类和函数。
    • load_data.py: 它包含加载用于训练的数据集的相关函数。
    • data_processor.py: 它包含数据存储类型转换以及其他变换的函数,例如numpy转torch、对称归一化等。
    • calculator.py: 它包含计算均值和标准差的函数。
    • evalution.py: 它包含计算聚类指标的函数,例如ACC、NMI、ARI和F1_score。
    • formatter.py: 它包含对输入变量进行格式化输出的函数。
    • logger.py: 它包含一个用于输出日志信息的日志类。
    • parameter_counter.py: 它包含统计模型参数量的函数。
    • path_manager.py: 它包含根据需要将相对路径转化为绝对路径的函数。当然,如果不需要转换,也需要调用这个函数,因为该函数可以配置一些文件存储路径,例如日志存储路径、预训练参数文件存储路径、聚类可视化图像存储路径等。
    • plot.py: 它包含一个绘制聚类TSNE可视化以及保存图像的函数。稍后也会开发特征热图的图像绘制函数。
    • time_manager.py: 它包含一个用于记录模型耗时的时间类以及一个格式化时间的函数。
  • logs: 该目录用于存储日志输出文件,它的子目录用模型名称命名,日志文件用模型启动时间命名。
  • pretrain: 该目录用于存储预训练参数文件,它的子目录用pretrain_{模块名}命名,用数据集命名的参数文件存放在以模型名命名的目录下。
  • img: 该目录用于存储输出的图像,其子目录为clustering和heatmap。

快速上手

在将该项目克隆到本地后,可以根据以下步骤进行运行:

步骤1:检查环境或者直接运行requirements.txt安装第三方库。

pip install -r requirements.txt

步骤2:准备数据集。如果你没有我们代码所需要的格式的数据集,可以在Liu的仓库中下载。 [yueliu1999 | Google Drive | Nutstore] 。然后将其解压放到dataset目录中。

步骤3:在命令行中进入main.py所在目录,并用python运行main.py文件。如果是在集成开发环境中可以直接运行main.py文件。

以训练DAEGC为例:

我们需要先预训练GAT模块:

python main.py --is_pretrain True --model_name pretrain_gat_for_daegc --dataset_name acm

然后训练DAEGC:

python main.py --model_name DAEGC --dataset_name cora

以训练SDCN为例:

我们需要先预训练AE模块:

python main.py --is_pretrain True --model_name pretrain_ae_for_sdcn --dataset_name acm

然后训练SDCN:

python main.py --model_name SDCN --dataset_name acm

以下是argparse中可以修改的参数:

参数描述类型默认值
--is_pretrain本次训练是否是预训练boolFalse
--model_name所训练模型的名称,注意要与model目录中的对应。strDAEGC
--dataset_name所训练的数据集的名称,注意要与dataset目录中的对应。stracm
--k非图数据集构造KNN时的k值。intNone
--t如果模型需要矩阵M,比如DAEGC,可以指定t的值。int2
--update_interval更新间隔int1
--loops训练次数。如果需要训练10次取均值,可以设置为10.int1
--is_change_root_path如果需要将相对路径设置为绝对路径,可以设置为True。
注意这只是个标志,根路径需要在main.py中手动指定 。
然后程序会自动将相对路径更换为绝对路径。
boolFalse
--plot_clustering_tsne如果想要绘制聚类可视化结果,设置为True.
注意要同时设置loops为1,否则只会保留最后一次训练结果。
boolFalse
--plot_embedding_heatmap如果想要绘制模型学到的嵌入表示热图,设置为True。
注意要同时设置loops为1,否则只会保留最后一次训练结果。
boolFalse

步骤4:如果你成功运行代码,并且觉得该项目不错,给个star鼓励一下!😉

目前支持的模型

No.ModelPaperAnalysisSource Code
1DAEGC《Attributed Graph Clustering:
A Deep Attentional Embedding Approach》
论文阅读02link
2SDCN《Structural Deep Clustering Network》论文阅读03link
3AGCN《Attention-driven Graph Clustering Network》论文阅读04link

之后我会陆续更新其他模型代码。如果你很喜欢我的框架并希望让它更强大,可随时提交你的代码。

http://www.jmfq.cn/news/5158999.html

相关文章:

  • dw做高逼格的网站/网站推广怎么弄
  • wordpress模板博客/济南公司网站推广优化最大的
  • 怎么建自己公司网站/站长工具平台
  • 枣强网站建设/优化大师兑换码
  • logo素材网站有哪些/seo建站营销
  • 网站备案与域名备案/代运营公司排行榜
  • 广州海珠建网站/神秘网站
  • 石河子网站建设公司/天津的网络优化公司排名
  • 微信微网站开发教程/网络推广外包
  • 新疆建设厅网站/凡科官网免费制作小程序
  • wordpress主题古风/seo优化网络推广
  • pc网站做app京东/河南做网站优化
  • 合肥学习做网站/手机网站模板
  • 网站建设中主页源码/郑州全域静态管理
  • 青岛城乡建筑设计院有限公司/济南seo优化外包服务公司
  • 风格网站建设/电商平台的营销方式
  • 青岛网站互联网公司/产品优化是什么意思
  • 网站公司优势/app推广是什么工作
  • 新手学做网站电子版/网站优化网站优化
  • 苹果做安卓游戏下载网站/宁波网站推广找哪家公司
  • 北京环评在那个网站上做/竞价培训班
  • 手机网站建设开发/深圳搜索排名优化
  • wordpress浏览器版本/seo关键字排名优化
  • 怎么自己给自己的网站做推广/seo包年优化费用
  • 企业微网站与手机微信/深圳企业黄页网
  • js网站禁止复制/网站关键词优化外包
  • 购物商城网站功能设计/seo网络推广排名
  • 网站架构设计师月薪多少/公司域名注册查询
  • 哈什么网一个网站做ppt/百度官网网站首页
  • 网站 搜索怎么实现/seo网站优化网站编辑招聘