05 2018

Linked Scientific DataLei Xu


论文信息:徐雷,潘珺.科学出版物语义数据及其应用研究[J].中国科技期刊研究,2018,29(07):704-710.

Semantic Datasets of Scientific Publications and their Applications

You could call it Scientific Knowledge Graph or Linked Scientific Data. Find more Semantic Publishing Datasets at Google Dataset Search
数据集名称 类型 发布机构或人员 数据集简介
DBLP[1]typical LOD publication data 出版物关联数据 目前由南安普顿大学维护 2010年创建,是Linked Open Data(LOD)中比较典型的一个出版物关联数据集。它是一个计算机领域的书目数据集。
OpenCitations[2] 出版物引文数据 牛津大学、博洛尼亚大学 2010年首次发布,最初数据来源于PubMed开放获取论文数据。在2017年I4OC开放引文运动后,相关组织开始呼吁全领域都开放其论文的引文数据。在http://opencitations.net可以查阅该数据集最新的更新状态。遵循CC0协议。
Semantic Lancet[3] 出版物引文数据 爱思唯尔出版集团 2014发布,作为爱思唯尔出版集团的一个语义出版项目而产生的一个数据集,该数据集使用SPAR、CiTO本体对《Journal of Web Semantics》期刊的引文数据进行了语义关联,并提供了SPARQL、REST等方式的数据访问手段。遵循CC BY-NC 4.0协议。
CEUR-WS[4] 会议论文关联数据 CEUR-WS.org 目前CEUR-WS.org主要处理计算机领域的研讨会论文集的结构化信息。
WikiCite[5] Wikidata引用数据 Wikimedia基金会 WikiCite 于2011年被提议。Wikidata是一个结构化的知识库,包含了大量的数据条目,这些条目之间有丰富的引用关系,WikiCite就是这样一个关于条目之间的引用关系的数据集。
SciGraph[6] 出版物相关的关联数据 斯普林格 SciGraph 是斯普林格自然集团2017年发布的语义出版数据集,包含了科学基金、科研项目、会议、隶属机构以及出版物等信息。与SciGraph类似,Springer LOD Conference[21]专注于会议,如会议的相关元数据信息,如会议名缩写、召开城市和时间等,目前提供了对这些信息的检索接口。遵循CC BY-NC 4.0协议。
OpenAIRE[7] 出版物以及链接科学数据 欧盟委员会 作为一个项目于2009年启动,其间经历过OpenAIRE PLUS项目。目前的项目是OpenAIRE2020,始于2015年,包含出版物以及各种科学数据集。
Nanopublication[8] 纳米出版物 Tobias Kuhn and Juan Banda 遵循纳米出版物原则,目前该纳米出版物主要来源于生物医学相关领域,比如药物交互数据(Drug-Drug Interactions)、基因交互数据(neXtProt protein data)、生化过程数据(WikiPathways)等。
SciKG[9] 学术社交数据 清华大学 2017年发布,SciKG目前包括计算机科学领域的主要概念、专家和论文等知识图谱数据。2019年又发布了新版本OAG v2,包括MAG和AMiner,详见https://www.openacademic.ai/oag/
AceKG[10] 出版物相关的关联数据 上海交通大学 2018年发布,AceKG包括了大部分领域的论文、作者、期刊、机构、会议、隶属单位等链接数据。
ScholarlyData.org[11]* 学术会议链接数据 Andrea Giovanni Nuzzolese et al. 2016年发布于LOD中,包含一个改进的conference-ontology,提供SPARQL endpoint。
PeerRead[12]* 同行评议数据集 Dongyeop Kang et al. 2018年发布,包括了ACL, NIPS and ICLR大约14K投稿数据以及相应的接收/被拒情况,具体的评论内容等。
TechKG[13]* 面向中文学术领域的知识图谱 东北大学 2018年发布的中文学术知识图谱
CiteSeerX-2018[14]* CiteSeerX数据集 Pennsylvania State University CiteSeerX数据集,并和WoS、DBLP等进行了映射
SKS[15]* SKS数据集 中科院 2019
EVENTSKG[16]* EVENTSKG数据集 -- 2019发布的近50年来8个计算机领域的科学事件知识图谱,如学术会议、研讨会等
propnet[17]* 材料科学知识图谱 David Mrdjenovich, etc. 2019
unarXive[18]* unarXive Institute AIFB 对arXiv数据集中的文本引用信息进行解析,并和MAG映射
SoftwareKG [19]* 科学软件提及知识图谱 Germany 社会科学论文中软件提及知识图谱,并和已有知识图谱匹配
AIDA [20]* 科学及专利知识图谱 Italy 来自MAG以及Dimensions的文献及专利,并给出了该数据集的主题信息
AI-KG: [21]* AI领域科学知识图谱 Germany AI科学文献知识图谱,包含tasks, methods, metrics, materials, others五种类型

--This table was updated at 20/11/2019.* for NEW ADDED
[1] DBLP. http://dblp.rkbexplorer.com/.
[2] OpenCitations. http://opencitations.net/.
[3] Semantic Lancet Project. http://www.semanticlancet.eu.
[4] Ronzano F, Fisas B, del Bosque G C, et al. On the automated generation of scholarly publishing linked datasets: the case of CEUR-WS proceedings[C]//Semantic Web Evaluation Challenge. Springer International Publishing, 2015: 177-188.
[5] WikiCite. https://meta.wikimedia.org/wiki/WikiCite. [6] Springer Nature SciGraph. https://www.springernature.com/cn/researchers/scigraph.
[7] OpenAIRE.https://www.openaire.eu/.
[8] Nanopublications.https://old.datahub.io/organization/nanopublications.
[9] Tang J, Zhang J, Yao L, et al. Arnetminer: extraction and mining of academic social networks[C]//Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2008: 990-998.
[10] Acemap Knowledge Graph.http://acemap.sjtu.edu.cn/app/AceKG/.
[11] http://www.scholarlydata.org/
[12] NAACL 2018's paper titled:A Dataset of Peer Reviews (PeerRead): Collection, Insights and NLP Applications
[13] http://www.techkg.cn
[14] J. Wu, B. Kandimalla, S. Rohatgi, A. Sefid, J. Mao and C. L. Giles, "CiteSeerX-2018: A Cleansed Multidisciplinary Scholarly Big Dataset," 2018 IEEE International Conference on Big Data (Big Data), Seattle, WA, USA, 2018, pp. 5465-5467.
[15] SKS:一种科技领域大数据知识图谱平台. 数据与计算发展前沿[J], 2019, 1(1): 8- doi
[16] EVENTSKG: A 5-Star Dataset of Top-ranked Events in Eight Computer Science Communities
[17] propnet: A Knowledge Graph for Materials Science
[18] unarXive: a large scholarly data set with publications’ full‑text, annotated in‑text citations, and links to metadata 2020 Scientometrics
[19] Investigating Software Usage in the Social Sciences: A Knowledge Graph Approach2020
[20] AIDA: a Knowledge Graph about Research Dynamics in Academia and Industry2020
[21] AI-KG: an Automatically Generated Knowledge Graph of Artificial Intelligence 2020
Back to Posts