1. cora dataset介紹
cora有2708個數據點,每個數據點代表一篇科學論文,論文可以分成7個類別,個別為
(a) 規則學習 (Rule Learning)
(b) 強化學習 (Reinforcement Learning)
(c) 機率方法 (Probabilistic Methods)
(d) 理論 (Theory)
(e) 神經網路 (Neural Networks)
(f) 基因演算法(Genetic Algorithms)
(g) 案例式 (Case Based)
core有兩個檔案cora.cites和cora.content
cora.content總共有2708行,每一行分別是論文編號、論文的詞向量,一個有1433位的二進制和論文的類別
論文編號 論文詞向量(1433位二進制) 論文類別
210XX 0 0..... 0 0 1 0 0 0 0 0 0 0 0 0 Neural_Networks
10723XX 0 0..... 0 0 0 0 0 1 0 0 0 0 0 0 Rule_Learning
11537XX 0 0..... 0 0 0 0 0 0 0 0 1 0 0 Reinforcement_Learning
cora.cites總共有5429行, 每一行有兩個論文編號,第一個編號的論文先發表,第二個編號的論文引用第一個編號的論文
第一篇論文編號 第二篇論文編號
35 1033
35 103482
35 103515
參考
https://blog.csdn.net/u010159842/article/details/103234942
https://github.com/tkipf/keras-gcn
https://blog.csdn.net/Eric_1993/article/details/102907104
https://luweikxy.gitbooks.io/machine-learning-notes/content/content/deep-learning/graph-neural-networks/graph-convolutional-networks/gcn-preliminary-understand.html
https://www.zhihu.com/question/54504471
沒有留言:
張貼留言