经产观察
IT资讯
IT产业动态
业界
网站运营
站长资讯
互联网
国际互联网新闻
国内互联网新闻
通信行业
通信设备
通信运营商
消费电子
数码
家电
数码

关于计算机数据库技术的论文开题报告

作者:habao 来源: 日期:2017-10-17 16:32:38 人气:

  数据库技术作为计算机发展的重要基础和核心。下面是学习啦小编为大家整理的关于计算机数据库技术的

  根据被调研图书馆网站上公开发布的信息,2001年至2011年,因用户违规使用而被暂停访问权的数据库类型至少有33种,其中,引进的外文数据库有28种,分别为:ACS,AIP,APS,ASME,ASCE,BlackWell,Ebrary,EPS,ESA,HeinOnline,IEL,JSTOR,KARGER,Kluwer、MAIK,Mathsci,Nature,OSA,PQDD、SAE,Sari,ScienceDirect,SciFinderScholar,Scitation,SPE,SPIE,SpringerLink;购置的中文数据库有5种,分别为:瀚堂典藏、中国期刊网CNKI、中宏教研支持系统与中宏产业数据库、万方数字化期刊和月旦知识库等。涉及的图书馆至少有77个,占全部119个图书馆的64.7%,即超过半数的图书馆都有过被数据库商关闭IP的经历。据统计,被暂停使用最多的数据库是美国化学学会出品的全文期刊库ACS,其次是美国物理联合会出品的全文期刊库AIP和美国物理学会出品的全文期刊库APS,数据库商皆为学会或协会。如,2001年至2011年,统计的119个图书馆中有75个购买了ACS,最少有55个图书馆都经历过被美国化学学会关闭IP的情况,比例超过73.3%;被封次数至少有214次。其中2010年最多,至少有65次。IP被封超过10次以上的数据库还有AIP、APS、JSTOR、ScienceDirect、OSA、等。

  目前图书馆颁布的有关用户使用行为管理的政策称呼不一,使用最多的是“(电子资源)版权公告”(注:“关于数字资源版权的公告”、“关于数字资源知识产权公告”、“关于版权的公告”、“文献版权公告”等也归入此类),其次是“(电子资源)版权声明”(注:“电子资源使用版权声明”也归入此类),其他的还有“使用电子数据库公告”、“电子资源(数据库)使用说明”、“关于电子资源使用的相关说明和要求”、“数据库使用注意事项”、“电子资源使用”、“关于规范读者使用电子文献的通告”、“电子资源使用管理办法”、“资源使用公告”、“电子资源使用规则”等。

  本文所研究的使用管理内容,不仅涉及版权内容,也涉及数据库使用许可协议中的约束以及学校纪律等,因此,本文统一用“数据库使用管理政策”称之。考察本文所统计的119个211大学图书馆网站信息,各学校图书馆设置“数据库使用管理政策”的总体情况如下表所示。上表数据显示,设置了面向所有数据库的使用管理政策的图书馆为78个,超过了半数,但比例还不是很高。我们曾经在2010年对211大学图书馆数据库使用管理政策进行过网站调研,当时不足半数。

  比较两段时期的数据,可看出越来越多的图书馆开始重视发布数据库使用管理政策。截止到2011年12月底,74个购买数据库ACS的211大学图书馆中有56个发布了正式的使用管理政策,有4个图书馆仅针对ACS发布了使用管理政策,有2个在新闻中针对ACS发布了“ACS下载注意事项”,合计约占购买ACS数据库的74个图书馆的83.8%。这个比值比较高,显示出美国化学学会强硬的使用管理态度对图书馆界的影响。表1第4列的数据显示,数据库使用管理政策的出台与图书馆出现过IP地址被封情况有很大关系。上述78个图书馆网站上发布的共78份“数据库使用管理政策”中,有7个是由图书馆所在学校(如大学、大学医学部、师范大学、华中科技大学、浙江大学、东北师范大学和武汉理工大学等)颁布的,其余的都是由图书馆自行制定。以学校正式文件的形式颁布“数据库使用管理政策”,说明这些学校对数据库使用的规范化、合理化的高度重视,同时其影响力更大。

  约有24个图书馆发布的数据库使用管理政策非常简单,通常只有100至200字,简要说明“用户要遵守版权法,不能批量下载,不能代理服务器,不能用于营利目的等”,绝大多数图书馆都较为全面地提出了具体要求。发布简单政策内容的24个图书馆,14个有过被封IP的经历,比例为58.3%;发布比较正式政策的54个图书馆,44个有过被封IP的经历,比例为81.5%。分析这两个比值,被封IP情况很有可能更加促使图书馆重视“数据库使用管理政策”的出台和执行。

  同时也表明,简单的政策内容也能产生明显的效果。“数据库使用管理政策”发布的,对用户了解和遵守这些政策有一定的影响,在一定程度上,可以体现出图书馆的执行力度。上述78个发布了“用户使用规范管理政策”的图书馆中,有12个将政策内容纳入到图书馆的规章制度,表明政策制度建设比较规范。其他的基本上都是在数据库页面上设置政策内容链接和简单内容,容易引起用户的注意。有的图书馆如大学图书馆、大学图书馆、中国农业大学图书馆等同时在规章制度和数据库入口处发布数据库使用管理政策内容,综合了上述提到的两种方式的优势。

  有的图书馆如苏州大学图书馆、中国科学技术大学图书馆、暨南大学图书馆、广西大学图书馆、华中师范大学图书馆等不仅在数据库页面有相关的政策内容链接,还特别在ACS入口处发布了版权使用说明的内容,对一些读者使用量大,又容易违规使用的数据库,增加了“提醒”功能。

  本文所统计的数据库使用管理政策,内容相似度很高,这里不一一列出,主要分析一下有关过量下载的界定和违反数据库使用管理政策的处罚措施。从我们所统计的数据库违规案例来看,用户违规的行为主要是短时期内大量下载某一数据库的论文。对此行为,数据库商多称之为“”或“恶意下载”。在所统计的数据库使用管理政策中,近半数政策表明:“由于各数据库商对的界定并不一致,因此图书馆无法制订统一标准。一般数据库商认为,如果超出正常阅读速度下载文献就视为,通常正常阅读一篇文献的速度至少需要几分钟”。

  有的图书馆自行确定了一些下载上限,如大学图书馆和复旦大学图书馆等表示对每个数据库每小时下载不能超过100篇;工业大学图书馆表示对每个数据库每天下载次数不能超过60次;交通大学图书馆对每个数据库不能集中下载50篇;上海交通大学、大学和浙江大学的图书馆都对每个数据库每次下载不能超过30篇等。这些差异较大,显示出各图书馆对数据库商要求的不同领会和对策。

  各图书馆处理违规用户的方式和力度不尽相同。目前处理的措施主要包括法律处罚、经济处罚、纪律处罚和服务处罚等方面。纪律处罚又包括纪律处分、书面检查、通报等。服务处罚包括让违规用户删除违规下载的资源、对使用图书馆服务进行一定程度的等。法律处罚、经济处罚和纪律处分,威慑力较强,对学生今后的人生有很大影响。目前收集的公开案例中还未见到上述几种处罚案例。图书馆目前主要采用通报的方式,有的点名,有的仅点出违规IP地址,前者威慑力强但也容易到用户。服务性处罚,主要是图书馆从自身管理和能力角度采取的处罚措施,行政威慑力较弱,但对常用图书馆服务的用户来讲有不小影响。

  目前我国已有部分研究者提出图书馆应对电子资源违规使用行为的措施,如制定有关规章制度并进行读者教育、重视授权许可协议并告知授权用户其中的重要内容、采用校外访问技术\严肃处理违规使用行为[1]-[2]以及建立图书馆用户信用体系[3]等。本文在此基础上着重从服务用户角度提出改进。

  数据库使用许可协议是图书馆与数据库商共同签订的,其中包括了数据库商对用户使用权限和责任的具体。用户遵守这些是以知晓、了解和认识这些为前提。图书馆和数据库商积极行使“告知”义务,可以更有效地规避和防范违规使用行为的出现,我国高校的声誉和更多用户的使用权益,同时也平衡了图书馆、用户和数据库商的利益。据调研,有些图书馆员认为“使用权限和责任”的告知是数据库商的责任。这个观点有一定道理但不全面。作为数据库用户使用权限的者,数据库商有义务向用户清楚地表达他们的使用要求,而图书馆作为服务用户的信息管理者,也有义务教育和引导用户正确和有效使用图书馆信息资源。从便利角度讲,用户使用数据库的径是:进入图书馆网站再进入数据库网站,这两个网站分别由图书馆和数据库商管理,因此图书馆和数据库商在这两个网站发布有关使用权限的告知,可谓是举手之劳,同时也便于用户获知。

  近年来,有些用户尤其是学生对数据库使用管理工作有一定抵触。如,在一些学校的论坛上,有学生抱怨:“那东西(数据库中的内容)不就是要下下来才能看的吗”,“没标准谁能自己以后不触线”(安青在线);“没阿,做个镜像把”(诺贝尔学术资源网水上乐园)等。用迅雷、ENDNOTE等下载软件下载文献速度快,有利于用户;短时间内系统大量下载便于用户事后集中使用甚至进行数据挖掘,有利于用户。

  为什么这两种有利于用户的使用方式被数据库商呢?深究其原因:一是容易被误认为是为了商业牟利;二是容易导致数据库数据被转给非授权用户;三是在现有网络和技术下容易导致系统瘫痪。对于前两点,数据库商并不愿为区别用户大量下载文献是用于个人学习研究,还是用于诸如商业牟利等非授权行为的成本买单。对于第三点,虽然在技术不断先进、成本不断降低的发展趋势下,该问题将不再成为问题,但目前,短时间内过量下载行为还是会给数据库服务器带来不必要的负荷。有研究者也从图书馆工作角度分析了用户违规使用行为带来的问题。如文献指出,用户的违规下载,有时会造成多线下载占用并发用户名额,有时造成的下载量虚高现象,或增加当年数据库价格,或给有些数据库商机会在下个合同期抬高价格等。将上述种种原因向用户说明,可消除不必要的抵触。

  多年来尽管许多图书馆一再询问下载的上限值,但数据库商一直未能给予明确答复。2010年5月在广州召开的CALIS引进数字资源培训会议中,又有图书馆工作人员向CALIS几位负责人询问此问题,后者依然表示无法从数据库商那里获得答案。我们曾与一名数据库销售人员咨询过此问题,该销售人员表示:数据库商不愿的原因,可能是担心有用户钻下载上限值的,即一次下载数量临近上限值。这种担心不能说没有道理,但不给出一个具体的上限值对用户并不公平。

  如果用户在出现违规下载前被提醒,甚至被系统自动,不仅可有效防止违规下载事故的发生,而且可让用户无负担地使用数据库。据人民网报道,ACS首席信息官JohnSullivan曾表示:“我们确实有自动化系统来监测使用模式,检查是否有不适当地使用我们版权内容的情形为了确保信息安全,我们必须依靠以上监测系统。

  但我们期望客户能够根据信息技术的最佳做法来配置和管理他们的系统。”[4]大学图书馆联合其学校网络中心研制相关的“电子资源访问控制系统,对在授权范围内的电子资源进行管理和控制,对有可能被数据资源提供商视为违规下载的用户行为给予提醒和及时。”[5]大学图书馆信息技术部门负责人张成昱研究馆员表示,他们与学校网络中心合作,将大学图书馆的访问控制模式与网络接入模式结合,有很大成效。但因成本高,技术复杂,还没广泛推广。

  另外还有运行问题,如控制设备临时当机时,还会出现一些过量下载现象,大学图书馆称之为“漏球”。目前,师范大学图书馆、上海交通大学图书馆也采用了这样的软件系统,对过量、违规下载全文事件进行监测、预警和控制。这里存在一个问题,即图书馆自行设计的上限值是否合理。

  2007年工业大学图书馆曾采取技术措施控制用户下载行为,即如果下载速度超过50M/小时,系统自动中断用户的访问,6个小时之后再自动恢复访问。[6]但到2009年,该图书馆表示鉴于部分师生要求最大限度方便读者的使用,图书馆决定取消电子资源访问流量。[7]上述情况反映了技术措施面临许多复杂问题,需要图书馆联合数据库商提出更好的技术解决方案。

  每个数据库许可协议中的用户使用权限不尽相同。这些不同之处应当在图书馆和数据库商各自的网站给予。具体来讲,数据库商可以针对特定图书馆显示个性化的使用权限告知界面,既有面向所有用户的共性,也有面向特定图书馆用户的特殊。从可行性来讲,日前的技术已经可以使数据库检索因用户的不同而提供个性化的显示界面。对图书馆来讲,可以在电子资源门户首页显示使用权限共性内容,在特定数据库检索入口处显示共性内容和特性内容。

  通常来讲,告知用户的内容越全面完整,越能够保障用户的知情权并促进用户的使用。“简明扼要”的方式可以提供用户非常方便的知情方式,容易达到“告知”和“提醒”作用。因此,图书馆可在规章制度或用户使用手册中提供详细的数据库使用管理,而在数据库入口处发布简明扼要的内容。目前,有的图书馆在用户进入每个数据库之前都先弹出一个使用权限告知界面,虽了用户对有关的获知,但对经常使用数据库的用户来讲,可谓不胜烦恼。

  所以这种方法最好仅用于个别要求比较严厉的数据库产品。另外,应改进对违规下载的“称呼”。有些数据库商对用户违反数据库使用许可合同的下载的行为,用“恶意下载”表述。“恶意”一词的含义是指不良的、坏的用意,带有强烈的贬义感彩。而实际上,用户违规下载的意图,除了可能的商业牟利或外,还有其客观原因。如据人民网报道,大学一副馆长表示:“我们能发现的、的都故意性造成过量下载的出现过量下载情况比较集中的大多是在考试前期或放假前,因为时间紧。”[8]很多老师和学生在住所撰写论文,为此,会利用在图书馆、教学楼、办公室、实验室等IP地址范围内下载大量资源以备拿回住所详读。

  有的学校虽然网络非常好,但尚未提供校外访问服务,很多老师和学生会在学校提前下载大量资料,以备放假回家阅读,甚至没有时间仔细分析哪篇是真正需要的,而是按照专题等方式集中下载。上述情形下的过量下载行为,只能说是违反了数据库使用许可合同,但很难定性为不良。考察目前我们收集的78份图书馆发布的数据库使用管理政策,用“恶意下载”的有21份,不足三分之一但也不少。有的图书馆用“恶意、批量下载”的说法有一定借鉴意义,即涵盖了真正有恶意的下载行为,也涵盖了上述所讲的并非恶意的违规下载行为。

  从目前收集的资料来看,被封IP实例主要集中在一些学会协会发行的数据库产品,如ACS、AIP等。这是因为学会协会发行的数据库收录的研究的专业性强,内容质量具有严格的控制,在该学科领域程度比较高。这些数据库中收录的研究,通常仅由学会协会自己发行,并不转交给其他数据库商进行打包发行,从而导致用户集中下载的。

  国家对学会协会发行的数据库产品进行采购补贴或采取国家引进,让更多的学术机构有能力负担得起长期这些数据库的费用,或是享受到由国家引进带来的长期使用的实惠,以减少用户由于担心长期使用不能得以而引发的违规下载大量数据的事实。当然,这也可能会产生一个副作用,即某些数据库商可能认为在国家补贴情况下,无论如何都会有较多图书馆采购其数据库产品,因此不担心过严的处罚会失去客户。所以,还希望国家补贴机构如NSTL向数据库商一定压力,避免数据库商不切实际的要求。

  民族高校图书馆数据库以文字为主,声音、图片和视频内容较少,只有中央民族大学图书馆的《馆藏民族音像资料库》和西南民族大学图书馆的《羌族图片子库》,全文比例较高。数据库均为汉文数据库,没有少数民族文字或语言数据库。各数据库重复性或相似性较低,主要有《西部大开发》《西部开发信息资源数据库》《民族相关文献信息特色库》《民族史研究文献数据库》和《古籍文献特色数据库》等。

  民族高校图书馆数据库建库途径主要是本馆馆藏文献数字化和馆外资料收集加工。一方面,馆藏特色文献数字化是特色数据库建立的基础。如北方民族大学图书馆《回族学》《西夏学》《地方文献》是在收集整理本馆馆藏中回族、伊斯兰、西夏、等地方相关文献的基础上建成,中央民族大学图书馆《馆藏民族音像资料库》是将珍贵的馆藏民族音像资料进行数字化加工建设;另一方面,馆外广泛收集是特色数据库得以充实和不断完善的重要途径。

  如西北民族大学图书馆《甘肃特有民族研究数据库》相当部分内容来源于网络,《民族研究文献题录数据库》收集了我国少数民族研究及综合性期刊的大部分涉猎文献。值得一提的是,针对民族特色文献民间分布广和急待发掘的特殊性,深入民族地区成为了一种重要的资料收集方式。西南民族大学图书馆《羌族文献数据库》课题组曾赴阿坝州,采集了大量与羌族相关的图书文献、图片、电子文献资料,拍摄、了大量照片和音频视频。

  民族高校图书馆自建特色数据库是一项长期的系统工程,需要在财力、物力、人力等方面大量持续投入。依靠科研项目支持建成的特色数据库建设快、质量高。如中央民族大学图书馆《民族相关文献特色库》获得中国高等教育文献保障系统(英文简称CALIS)“十五”全国高校专题特色库立项,西南民族大学图书馆《羌族文献数据库》获得CALIS三期建设项目全国高校专题特色数据库立项、《康区藏族文献数据库》和《彝族文献数据库》获得四川省高等学校图书馆、情报与文献学规划项目立项等。

  民族高校图书馆数据库存在的主要问题:(1)数据库数据量有待进一步充实和完善。多数特色数据库数据量在几百到几千条不等,数据量达1万条以上的仅有4个,即中央民族大学图书馆《馆藏电子图书》(18061条),中南民族大学图书馆《古籍文献特色数据库》(3万余条),西南民族大学图书馆《羌族文献数据库》(7万余条),《彝族文献数据库》(12451条);数据量在300条以下的多达6个,即北方民族大学图书馆《西夏学》(229条),大连民院图书馆《中国八十一件大事》(81条),《中国名著导读》(88条),《中国少数民族辞书研究》(268条),《红山诸文化研究》(230条),《大学生素质教育必读书目》(225条)。(2)以校内自用为主,访问控制严格,主要是IP范围和用户认证。仅有14个对外完全,所占比例为43%。西南民族大学和中南民族大学图书馆均对校外读者访问实行完全的严格措施。

  (3)均为自建,没有发现共建的合作案例,即使是CALIS管理下的各个特色数据库项目建设,也都是在其“分散建设”的原则要求下进行。在共享方面,仅有中央民族大学图书馆《民族相关文献特色库》在CALIS全国高校专题特色数据库门户网站上发布共享,各馆之间没有建立任何直接共享渠道。

  (4)建库技术标准不统一,检索方式差异大。西北民族大学图书馆、西南民族大学图书馆、大连民院图书馆主要利用同方TPI技术进行建库,而中央民族大学图书馆是利用杭州麦达数字图书加工系统进行建库。(5)特色数据库在各馆主页上的栏目名称不统一,未能很好地“自建”和“特色”特征。栏目名称主要有“自建特色数据库”“特色资源库”“自建数据库”“本馆特色资源”和“本地资源”。此外,只有北方民族大学和中南民族大学图书馆在网站首页上给出了特色数据库详细列表,可直接点击访问,其他则需点击进入网站二级页面后才可访问到。(6)缺少宣传推广。通过对各馆主页上的图书馆简介进行分析发现,只有大连民院图书馆对其特色数据库进行了专门介绍。由于访问严格控制和共享不足,各馆特色数据库的认识极其有限。

  基于以上调查分析,民族高校图书馆自建特色数据库正处于关键发展阶段,需要适时调整思和创新途径,以健康、可持续发展的正确道。

  首先,实现馆藏优化,使粗放型的馆藏特色文献资源通过数字化和网络技术手段得以精细化配置、系统化整合、有序化整理和深层次加工。立足于有限办馆条件,以自建特色数据库为突破口,对馆藏特色资源采取优先和重点开发的灵活策略,跨越式地提升民族高校图书馆的资源建设和服务水平。其次,加强资源共建共享,以信息传递网络化为优势,提高馆藏特色资源的利用率,使传统低层次服务转变为主动的知识增值服务,更好地为民族高校教学科研、学科建设提供强有力的信息资源支撑和保障。再次,扩大信息受众范围和社会影响力。

  通过广泛宣传,发挥服务社会化功能,向人们展示绚丽的各民族文化魅力,不断满足人们的文化需求,为民族地区经济和社会发展提供有效支持的知识服务,实现民族高校与民族地方建设的双赢。最后,积极和发扬优秀民族文化,促进中华多元文化的繁荣发展。借助特色数据库可以实现保存的安全性和长期性,加工处理的有序性和高效性,存取共享的便捷性和稳定性等独特优势,有效实施优秀民族文化遗产的抢救性发掘和,使民族文化源泉生生不息,增加民族文化的认同、自信和自豪感。

  科学性原则。尊重客观规律,反对凭借主观意识、不切实际地盲目建库。科学制定特色数据库建设战略规划和项目管理制度,项目实施的合理化、标准化和规范化,讲究建库目标的现实性和措施的可操作性。善于吸取教训、总结和借鉴经验。数据的准确、真实和权威。

  实用性原则。充分考虑特色数据库存在的现实价值,是否能够很好地服务读者,是否对民族高校的教学科研、学科建设有用,是否对民族地区发展产生良好的社会效益和经济效益。不一味追求数据量上的高度和访问外观形式上的美感,全面、深刻、安全、可靠、方便、快捷才是我们获得满意的决定元素。

  完善性原则。在内容上,以读者需求为出发点,广泛收集与主题相关的各类信息资源,不断充实数据。在形式上,针对民族文化的多样化特征,注意加强图片库、音乐库、视频库等多特色库的建设,努力填补民族文字和语言特色数据库的空白。

  共建共享原则。民族高校图书馆在民族文献收集、民族文化展示、民族文字处理、民族问题研究、民族教育职能上具有密切合作的基础,在特色数据库建设上既可以分享经验,又可以直接建立共建关系。通过统筹规划、分工协调、分享的形式,增进共识、发挥优势、互通有无、降低成本,使各馆特色数据库建设产生集约化的良好效益。

  尊重原则。尊重读者,满足读者需求,实行有效。特别要注意解决文献资源数字化过程中的版权归属问题以及数据库发布后的知识产权问题。

  科学制定项目规划,执行严格的质量控制,从管理、监督、检验等方面下足工夫,确保顺利实现建库目标。(1)确定主题:在充分调研基础上,选择与民族高校办学特点、学科设置、科研情况以及民族地区经济社会发展热点密切关联的主题,突出专业性、独特性、针对性和实用性。(2)基础准备:确定建库人员分工和职责,在设备、资金、时间上给予足够支持;选择合适的合作对象、建库标准、软件技术与平台。(3)资源收集:在馆藏特色资源选择、合作单位补缺和网络信息动态追踪等传统方式基础上,积极深入民族地区开展现场收集。(4)加工建库:遵行资源描述、资源组织、资源互操作、数据加密等技术标准和规范,数据录入要求准确、及时和安全。(5)发布设计:建立高效的发布平台,在主页显著标志特色数据库主题,检索设置要考虑用户使用习惯,满足用户访问的直观、便捷和可操作性要求。此外,通过图书馆简介、信息检索课程、网络搜索引擎链接等方式,对特色数据库这一自主品牌进行宣传推广。(6)评价反馈:重视建库质量评价和使用效果评价,与读者建立互动机制,虚心采纳合理与意见。通过数据库系统的数据统计分析功能,了解数据库使用动态,包括读者的访问习惯和常用的信息类型。综合分析评价反馈内容,作为数据库建设和升级的决策依据。(7)调整完善:特色库数据的不断修正、更新、充实与完善,推动文摘库向全文库,单一库向多子库精细化,以及文字库向图、文、声、像库多样化,尤其是要突破纸质文献扫描、拍照、录入的传统简单模式,加强对数据进行深层次加工。

  数字化是图书馆变革的必然趋势,民族高校图书馆应适时抓住机遇,响应国家建设文化强国号召,依托“高等教育文献保障系统(CALIS)”“中国数字图书馆工程”“全国文化信息资源共享工程”等高效管理与共享平台,努力打造特色数据库文化精品名片,发挥其应有的特殊功能和社会价值。

  自从上世纪六十年代国际上开展对信息检索的研究以来,科技用户的信息检索行为一直备受关注,信息检索的相关研究从最初的信息系统角度研究信息检索,到关注用户需求,再到将管理学、心理学等理论运用到研究中,到目前提出信息活动还受到科技用户自身知识背景、出现的问题、要解决的任务等因素影响的相关理论,同时在情景中强调认知、情感、语言、组织、社会、文化等诸多因素的相互作用[2-8]。本文分析科技用户在检索过程中的一系列基本问题,通过研究提出科技用户如何更好的对检索资源进行学习以达到提高检索效率的方法。

  根据文献,我们提出关于科技用户信息检索模型(见图1),此模型描述的是科技用户信息检索的全过程,主要分为以下四个阶段。

  1产生需求阶段。信息需求是科技用户在科研课题的研究过程中产生的。信息检索是任何课题研究开展的第一步,因为科技用户首先应全方位了解本课题领域的研究现状及进展,从而准确定位研究的切入口;在课题研究中遇到技术难点时应及时请教其他技术人员对于这类问题的解决方法,从而积累和解决问题的思。由此就产生了检索需求。

  2确定检索策略阶段。主要可以分为三个步骤:首先是选择信息源,在信息化、数字化的今天,科技用户查找信息大多通过网络数据库来进行,一般利用搜索引擎获取网络上一些免费的信息资源或者更多利用本单位图书馆、高校图书馆及其他公共图书馆已经购买的数据库资源;其次是选择检索途径,由于很多数据库提供简单检索、高级检索、专业检索等多种检索途径,因此科技用户可以根据自身需求选择检索方式;最后是选择检索词和检索式,在充分理解课题主题的基础上,科技用户应找到与主题吻合的检索词,准确表达主题的内涵及外延,选取适合的逻辑组配,目前比较多会选择单个关键词或者是几个关键词之间的组配,不常使用高级检索和专业检索,而这恰恰是能否检索到满意结果的关键环节。

  3浏览检索结果阶段。很多科技文献数据库根据用户输入目标文献的题名、摘要及正文等不同形式的内容向具有权限的科技用户提供相应的检索结果,而在检索结果输出后,科技用户一般会先浏览文章题名,再选择合适的文章浏览摘要,然后进一步浏览全文,最后选择将合适的全文进行下载保存。

  4结果评价阶段。检索过程能否继续进行的主要因素是结果评价,当科技用户对之前检索的文章题名、摘要或正文不满意时,就会重新选择或返回到前面阶段,循环反复,当所有检索结果都不满意时,科技用户会重新界定需要,从而返回到产生需求的第一阶段。很多科技用户在得到比较满意的检索结果后,也还有可能返回之前的操作,因为他希望得到更确切更全面的结果。因此他可能会换一个数据库、换一个检索词或检索式重新进行检索。同时,随着课题研究的深入,科技用户还会源源不断的发现新的问题,也会对课题进行新的认知和发现,或者按照课题研究的逻辑发展会产生新的思,当他发现已经获取的信息不足以解决这些问题时,会重新发生新一轮信息检索过程。

  根据以上所述,在进行课题研究和信息检索的过程中,科技用户会面临一系列待解决的问题,而这些问题的解决伴随着一系列不确定性和需要不断调整的决策过程。很多因素制约最终的检索结果是否成功,其中包括数据库使用权限、网络以及用户个人能力等。其中个人因素显得尤为重要。例如,在同样的数据库系统中,拥有专业、熟练检索技能的“专家”就能胸有成竹、游刃有余,全面准确得到所需的信息资源;而那些刚刚接触到网络数据库的“新手”,在面对浩如烟海的信息资源时却可能感到无从下手,处处碰壁,屡遭失败,这就需要“新手”不断学习检索知识和技能,使自己尽快成为“专家”。

  检索资源决策是科技用户信息检索基本模型中的关键环节,也是科技用户在海量信息中获取满意结果的重要过程。解决检索问题的关键在于如何选择与需求相吻合的检索资源,具体包括:数据库选择、检索策略选择、检索式和检索词输入方式选择。具体分析如下:

  1数据库选择。目前,国内大学、科研机构等图书馆引进和自建的数据库多达数百种,按文献类型可分为期刊数据库库(如Elsevier、Springer、CNKI、维普、万方)、会议文献数据库(如IEL、SPIE等)、学位论文数据库(如PQDD、万方学位论文、知网学位论文)、电子图书数据库(如方正、超星等)。每种类型的数据库所提供的服务方式和资源内容都不同,因此科技用户要结合自身需求,善于收集检索资源信息,而这些资源信息一方面来自于交互过程中获得的信息,另一方面来自于用户自身的知识积累。所以,科技用户对数据库的选择属于一种战略决策。

  2检索策略选择。科技用户根据自身习惯及数据库提供的检索方式可以选择快速检索、高级检索和专业检索,也可以选择在结果中检索、调整检索和重新检索。首先,科技用户根据数据库特点,对检索策略进行评估,选择适合检索任务的方法,例如简单检索词检索适合粗放型的检索任务,而检索词多框检索比较适合需要多个检索词共同描述的复杂任务。在选择检索策略时,科技用户自身对检索策略的偏好及整体认知水平会影响到最终的选择结果,对检索策略的最终选择也可以认为是战略决策。

  3检索词及检索式的选择。科技用户依据自身的偏好与认知,根据不同数据库的使用方法及资源,选择恰当的检索词完成整个检索过程,这是是否能够正确使用检索资源的重要决策环节,科技用户对检索词的选择属于战术决策。

  本文主要探讨的学习问题是指科技用户在不断摸索和实践中,学习和掌握的检索知识与方法,并由此不断调整、完善检索策略的行为过程。依据科技用户在信息检索模型中描述的文献检索过程,将文献检索抽象为以下三阶段:需求理解(检索词描述)检索决策(数据库选择/检索策略选择/检索词及检索式选择)结果评价。因此,在文献检索的过程中学习问题主要包括以下几个方面:

  1学习准确理解需求。科技用户自身的知识背景很大程度影响其对检索需求的理解,从而决定对需求的认知及检索式的确定。需求是科技用户产生学习的最大驱动力,当原先的经验、知识水平不能顺利解决问题时,就会产生学习的需求。此时,学习的内容包含对需求内容的界定、检索词的选择及检索式的确定等。然而,科技用户在实际检索中,输入的检索词大多是对检索目标的模糊认识,是根据自身知识背景做出的推测,因此,很难获取全面而准确的信息。

  而这种“模糊认识”有两方面构成:①显性,科技用户所输入的检索词包含明确的知识概念,与检索目标间存在语义关联关系;②隐性,科技用户输入检索词的知识定位并不一定准确,这种认识是不全面的、模糊的,尤其是部分需求可能因为无法准确表达而被隐藏或忽略。因此,这就需要我们做多方面的努力,从数据库的结构设计上来说,要注重深入挖掘科技用户的真实需求,引导用户把隐性需求显性化;从用科技户的角度来说,要认真分析和界定信息需求,明确检索目的和检索课题内容,以及所涉及的主要学科范围和相关概念,尽可能掌握课题研究背景、学科领域、发展过程和现状,在与检索的反复交互中提高并准确把握对需求的理解,提出适合的检索方案。

  2学习制定检索策略。不同的数据库系统为科技用户提供不同的检索策略,不同的检索策略在检索功能、效率及难易程度等方面各有差异,科技用户应根据自身需求,结合任务类型及对检索策略的掌握程度等条件进行选择。在选择好检索数据库后,下一步需要选择正确的检索策略来提高信息检索的查准率、查全率。而有很多因素决定查准率、查全率,如选择的检索词是否正确;检索词之间的配组关系是否恰当;主题的分析是否全面、到位;检索表达式是否编制得当等都是影响查准率、查全率的重要因素。提高信息检索的查准率、查全率的方法很多,例如:增加同义词、近义词及相关词;降低检索词的专指度(指除了选择合适的关键词外,还可以选择比关键词内容范围更广的尚未词);对于已确定的检索词表达的主题概念间存在逻辑关系,可以通过使用布尔逻辑算符和算符对检索词进行组配,编制成检索表达式等等。

  3学习评价检索结果。科技用户的主观满意度对检索结果的评价产生很大影响,因此,科技用户对检索策略的调整主要是基于对检索结果做出的主观评价。但是,在实际的检索过程中,往往会发生检索结果与用户满意度不相符的情况,例如:检索结果并不理想,但是用户很满意;检索结果很不错,但是用户不满意。因此,在科技用户与检索平台的交互过程中,要减少主观性在评价过程中的影响,要不断学习提高对结果评价标准的把握[10]。

  推荐:

  

推荐文章