中国机构自主创建的全球科技文献数据平台上线
7 月 2 日,在北京举行的 2025 全球数字经济大会上,联合国工业发展组织投资和技术促进办公室与东壁科技数据有限公司联合发布了由东壁科技数据自主创建的具有完全自主知识产权的全球科技文献数据平台 dbdata.com。东壁全球科技文献数据平台共收录了全世界范围内近 9000 万条高质量科技文献元数据,并引入 AI 功能,助力开展高质量科学技术研究。据了解,这一数据平台的基础功能将对全球用户免费开放,提供高效的文献检索、引文分析和数据追踪等服务。
在 2025 全球数字经济大会上,东壁科技数据创始人、深圳大学特聘教授吴登生表示:「科学技术研究的全过程,包括问题提出、背景调研、实验设计、数据收集与分析、结果验证、成果推广等各个环节都离不开科技文献数据平台的支撑。但长期以来,全世界科技工作者使用的科技文献数据库产品均由西方少数国家的科技出版企业垄断,存在陆续对我国关闭的风险。充分发挥市场力量,建设自主可控的科技文献数据平台,补足我国科技基础设施短板,刻不容缓。此次上线的东壁全球科技文献数据平台是依据中国机构自主提出的评价指标体系,自主采集、加工、建设的科技文献数据平台,具有完全自主知识产权,安全可控,将在一定程度上打破西方在该领域的垄断地位。」
突破传统「引文认可理论」 建高质量数据库
东壁科技数据由长期专注于科技大数据研究的青年科学家团队创办。本次发布的数据平台,基于该团队自主系统创立的「中国视角的 SCI 评价标准」——东壁指数(Dongbi Index)全球全学科顶级期刊列表而建立。今年 1 月发布的这个列表是第一个中国视角的全球学术期刊评价体系。
作为科研人员开展科研活动的重要工具,科技文献数据平台所收录论文的质量,直接影响科研工作的效率。目前,全球科技界应用最广泛的科技文献数据库,是美国科睿唯安公司旗下的 Web of Science。该数据库以美国情报学家和科学计量学家尤金·加菲尔德 1955 年提出的「引文认可理论」和「影响因子」期刊评价指标为标准,收录了 1 亿多条科技文献数据。由于该评价指标体系存在易被人为操纵等缺陷,影响了科研评价的客观性和准确性,容易造成科研资源错配,破坏科研生态。70 年来,该评价指标理论一直未有实质性完善和突破,其历史局限性和显著弊端一直困扰着学术界。基于该评价指标体系建立的科技文献数据库,收录了大量学术水平较低的论文,降低了数据库的学术参考价值。
东壁科技数据依据全新的「种子期刊引文追溯+引文网络层级结构分级」理论方法研发的东壁指数(Dongbi Index),增加了质量分级,突破了传统评价指标单纯依赖引用数量的局限,可以更加客观、真实、准确地反映期刊在学术界的权威性与影响力。吴登生表示,基于这一新标准,东壁全球科技文献数据平台可以遴选出更能代表学术界公认的高质量科技文献。东壁指数(Dongbi Index)发布以来,引发了国际学术界的广泛关注,得到了很多学术机构的认可。今年 3 月 31 日,中国科学技术协会以「钟柯平」的名义在中国科协之声上发表评论员文章指出:「东壁指数」(Dongbi Index)这一由我国机构自主构建的全球学术期刊评价指标体系,提出了「种子期刊引文追溯+引文网络层级结构分级」模型,不同于当前流行的欧美评价标准。这被视作中国争取学术话语权的标志性事件,也引发国内科技期刊界的自我检视。
除收录标准的优势外,东壁全球科技文献数据平台还根据中国科技界与教育界的习惯,对所收录期刊进行了学科分类。「我国学者常用的是国家自然科学基金委的学科分类(代码分类)和教育部的学科分类,但这两个分类在 Web of Science 上并没有映射关系,东壁全球科技文献数据平台依据我国科研人员的使用习惯,重新构建了分类体系。」吴登生补充解释说,「这一方面能够使科研工作者更加了解自身的学科边界,另一方面,可以更加精准地为管理部门提供决策支撑。」
AI 赋能 打造科研「综述神器」
人工智能正加速赋能千行百业,东壁科技数据团队在开发东壁全球科技文献数据平台时,率先引入了 AI 大模型的功能。
据介绍,此次上线的东壁全球科技文献数据平台先期引入了两个 AI 功能,分别是「学者成果解读」和「综述自动生成」功能。
「大部分学术论文的阅读、理解壁垒很高,要求读者具有深厚的科学素养和学科基础。非本学科的研究人员想通过学者主页中的文章,了解该学者的研究方向是非常困难的。」吴登生介绍道,东壁全球科技文献数据平台利用大模型的能力,相当于给每个用户都配备了「AI 助手」,「用户可以用通俗的语言向这个助手询问每一个学者的研究方向、研究特色、突出贡献,甚至是不同学者之间的对比。」
「如果用户想要在短时间了解某个研究领域的总体情况,则可以使用另一个 AI 功能:『综述自动生成』。」
根据吴登生在发布现场进行的 AI 功能演示,用户可以在东壁全球科技文献数据平台上建立「知识库」,只要把需要阅读和整理的论文添加到相应的「知识库」中,作为 AI 分析的基础,平台内置的大模型就会根据这些论文,提炼出大纲供用户修改。修改确定后,AI 会基于这个大纲和「知识库」中的论文自动生成一篇综述报告,帮助用户快速了解一个学科领域。
吴登生称,「因为论文全部来源于东壁数据平台中的高质量论文,所以它的语料是高质量的,保证了生成的综述报告的高价值,同时,还能克服一般大模型的『AI 幻觉』瓶颈。」
开源、免费 让科研基础工具更加便捷普惠
东壁全球科技文献数据平台的基础功能,将对于所有用户免费。吴登生表示,东壁科技数据希望通过 AI 的能力,让更多人参与到科研事业中,以高质量科学数据助力科学研究、技术发展和产业升级。「我们希望向广大科研工作者提供更加便利和普惠的工具,共同推动我国科技期刊事业的发展。」
吴登生还透露,本次发布的东壁全球科技文献数据平台是初期版本,未来将快速迭代,不断提升为全球用户提供高质量科技文献数据服务的能力。
武汉大学数据智能研究院院长李纲教授指出,科技文献数据平台是科研工作的「数据底座」,也属于国家重大科技基础设施。建设中国自主可控的科技文献数据平台迫在眉睫,将在提高科研工作效率、保障科技安全方面发挥重要作用。
《中国科学》杂志社学术总监任胜利表示,具有自主知识产权的科技文献数据平台,对我国建设世界一流科技期刊将发挥重要作用,它是科技期刊评价的基石,也是科技期刊国际化的重要渠道。