国外OA资源使用现状
目前国内高校图书馆搜集、整理的OA资源,以国外数据库居多,且部分OA资源在国内高校使用率非常高。面对众多OA资源,用户在使用时或多或少存在一定困难,主要体现在以下四个方面:
(1)需登录多个网站进行搜索,效率低下。
(2)需注册,操作繁杂。
(3)只有文摘或索引,不能看全文。
(4)访问速度慢。
Worldlib国外文献整合平台介绍
Worldlib国外文献整合平台(以下简称Worldlib)团队通过参考国内500余所重点本科高校OA资源使用情况,整理出采集的目标网站,涵盖了国外优秀大学及科研机构的OA资源,如Elsevier、Springer、Taylor & Francis Group、DOAJ、EBSCO、IOP、Wiley等免费开放期刊资源,OATD收集了世界各地1100多所高校发布的3,559,281篇开放获取研究生论文和论文等。
采集原则上以目标网站的发布字段为主,以其它公开信息为辅。依托强大的技术支撑,将多种不同类型的数字文献进行整合,平台本身具有极高的安全性,且检索速度快、检准率高。
平台的特点:
(1)所整合文献均遵守国际通用知识共享CC协议,严格尊重知识版权。平台上的所有文献数据都能获取全文且由第三方提供下载。
(2)平台搜索引擎基于海纳仓储平台,该引擎创建于2006年,在军事院校中广泛使用,具有极高的安全性,检索速度快、检准率高。
(3)整合DOAJ、OATD、OAPEN、ArXiv、IOP、ProQuest、GoOA等国外知名学术网站的资源,内容涉及20多个语种,1万余种期刊,上百万种电子图书,以及全球1000余所知名大学数百万篇博硕士学位论文,数据量为千万级。
(4)数据更新及时,数据量持续增加。提供千万级的数据量,每年更新量可达数百万条。
(5)为学校定制整合指定的文献资源。
(6)“一站式检索”服务平台运用云计算技术,实现了云服务。
(7)在持续更新文献数据量的同时,不断丰富文献资源类型,如国际名校公开课、流失海外的古籍文献等,会陆续发布到平台上。平台的WEB3.0搜索引擎也在开发中,届时将会为广大学术研究者提供更好的服务。
平台检索结构及功能:
平台搜索引擎基于海纳仓储平台,该引擎创建于2006年,在军事院校中广泛使用,具有极高的安全性,检索速度快、检准率高。在海量级数字资源管理方面具有不可比拟的优势和卓越的表现。支持海量级数据,包括文字、文档、图片、视频文件等的仓储化存储与管理,单库数据及索引所占物理空间可达256TB级,并可自动跨盘存储,实测数据量达到一亿五千万条文献元数据时,数据及索引存储容量为15TB,100用户并发搜索测试,平均90%以上的搜索响应时间小于0.5秒;独特的可视化建站技术,实现数据库内容及静态内容的快速发布、统一搜索、多维度导航等。
(1)异构资源智能语义分析
本系统实现了对异构资源的语义分析,便于资源重组整合,为读者提供精确、快捷的访问。
(2)动态索引和静态索引机制
设计了一个优化的索引模型,在保证检索效率的前提下,提供了实时索引的功能;提出了一种分代的动态索引构建方法,以减少索引合并代价,同时可以调节索引和检索的性能平衡
(3)跨库统一检索
利用整合工具对异构数据进行重新整合后实现不同结构类型数据库的数据同时进行检索呈现。
(6)系统词表管理
系统提供4800万词表对精确定位信息保驾,不断与时俱进自动更新词表数据库。
(7)数据碎片化合并工具
对大文本记录文件进行合并去重处理的工具,节省空间提高检索效率。
(1)会议课题镜像服务
为学术研究会议建立的镜像平台,携带方便,安装简单,即时服务。
(2)聚合索引技术
聚合索引技术对于那些经常要搜索的范围值的列特别有效。使用聚合索引找到包含第一个值的行后,便可以确保包含后续索引值的行在物理相邻。
(3)特征聚类技术
聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析法是一种探索性分析方法,能够分析事物的内在特点和规律,并根据相似性原则对事物进行分组,是数据挖掘中常用的一种技术。
(4)网络资源采集系统
网络资讯采集系统能够有效实现对列表式资讯类页面的定期自动监视和采集,采集结果统一进入仓储数据库。对入库数据可以即时发布,也可以利用数据采编工具可以进行编辑后再发布。
平台展示:
(1)学术新闻
学术新闻区收集来自不同研究机构、知名大学、政府机构和非营利组织在EurekAlert上发布的各类学科新闻。
(2)统一检索
统一检索区提供一站式检索云服务,可以实现不同数据库之间的跨库检索。检索列表页为访问者提供了按文献资源的主题分类、出版日期和语种等多种途径的导航方式,并可以进行二次检索,以及实现不同数据库类型的跨库检索。
(3)详情页
(4)关联文件