几年前,当我第一次为搜索初学者做一份书目指南之前,我不得不静下心去想,到底什么是我能教给他们的最简单、最重要的东西?什么是我们职业搜索者知道的,而这些学生不懂的?什么课程是导致找到和找不到区别产生的原因以及是他们需要学习的?我的脑海中逐渐浮现四句话,我在办公室中把它们写在一张纸上:我的四条搜索准则。在逝去的这几年中,我已在这基础上加了一些内容。但是,我和我的同行们仍然清楚的了解并在实践它们,在我看来,这就是我们职业搜索者和普通用户之所以区别的地方。
我没有发明这些准则,我只是使它们条理化文字化。条理化文字化--当职业搜索者收到人们的问题时做的另一件事。
准则一: 去信息应该在的地方
普通人或许以为,象我们这样擅长搜索的人,一定是因为知道一些使用搜索引擎的秘籍。其实,我们真正知道的,恰恰是这个事实:对于很多问题,是无法用搜索引擎解决的,因为互联网上并不存在所需信息。也许答案藏在一本书中,或者藏在一段未发表的论文中,或者藏在一份调查中。
当任何人向我们提出一个问题时,无论是否熟悉该领域,我们做的第一件事,是搜寻我们脑海中积累的信息地理图。当我们说出"让我们试一下联机医学文献分析和检索系统(MEDLINE)"时,我们已经评估过用户的需求(关于某种医药环境下的特殊疗法)和知识水平(医学教授或学生),并确定了哪里最可能找得到符合他们需求的信息(医疗文献中的文章)。
无论那问题是什么,我们都会经历同样的信息地理图搜寻和确认过程:被问及艺术品的复制时,我们会去搜寻艺术百科全书或者互联网;不同的工具可以找回不同的信息,而图书馆员们的技巧正是了解哪一种工具可以最好的完成哪一种任务。
图书馆员们也明白,不同信息源的风格是互相不可代替的。杂志和报纸会用读者简明易懂的语言解释复杂晦涩的主题,而学术和专业杂志则发表原始的研究文章(仅仅是普通用户问题中的"研究"可能自动把我们送向一个杂志全文检索库)。但是因为"研究"必然被限制在一个主题的很小的、可掌控的领域,它就象一个难题的小块。当我们想看这一个小块的风格时,或者当我们想知道一个主题的广泛背景时,我们会去找书,书会概括和让你理解一个最初的研究。政府文件则会提供统计、法律、金融信息,甚至会有关于"我们是谁?"、"我们拥有什么?"、"我们已经到了哪一步?"等公开资料。
我们了解每一种信息源风格的长处和短处。互联网长于图片和示范,对于政府文件,对于FAQ文档,对于讨论组,对于传输全文数据库;但是我们也知道,互联网对于1995年前的杂志和政府文件,几乎是没什么用的。对于这些资料,我们仍然需要使用我们的旧索引和期刊备份。我们也比仅仅信任互联网权威和准确性知道得更多,你也许会在互联网上找到一段引证 -- 甚至它的好几个版本-- 但是不要指望找到它的正确起源。我们对于互联网信息源的态度是冷战式的怀疑:信任它,但是只有在确证以后。
我们知道谁最可能制造不同类别的信息。
我们知道,有时最好的信息源正是普通的人,作为个体的或作为群体之一的,对某主题有热情的人。
当我们想知道一种崭新科技或策略是否有效时,我们会去找互联网上的相关讨论组。而当一个主题非常偏僻晦涩时,我们会直接上网,因为互联网是那些拥有古怪偏好(如风笛、中世纪地图、劣质的涂鸦作品)的人们分享他们热情的最佳场所。
我们职业搜索者,完全可以被描述成信息世界中旅行者的向导: 我们之所以能帮助我们的旅行者快速到达目的地 ,是因为我们知道目的地在哪里,是因为我们知道最佳的路线是什么,因为我们知道应该坐飞机,火车,还是汽车。
准则二: 你得到什么答案,取决于你怎么提问 推论:问题决定答案,如果你不喜欢答案,那么换问题吧 普通人或许以为,图书馆员们一定知道所有的答案。其实,我们真正知道的,是如何问出好问题。我们知道如何在宽泛和特殊之间自如滑动调节搜索范围,直到我们找到那任务最关键的影响因素。我们用来滑动调节搜索范围的方法之一,是语言。如果我们用一个特殊关键词没有发现足够的信息,我们就会转向概念更宽泛的一个层面;如果我们发现了太多信息,我们就会尝试更特殊的关键词。
举例来说,当我们被要求寻找这方面的研究资料:肥胖者与身材标准者做相同的工作,是否肥胖者挣的钱更少? 一些我们会尝试的关键词,可能是"肥胖"或"体重","薪水"或"工资"或"收入","歧视"或"区别")。我们也有可能使用更宽泛的陈述:肥胖和雇用歧视,这或许会找回各种关于歧视的研究资料:面试,薪水,评估,提升,等等。不管我们用哪种关键词组合,我们都知道,我们会得到不同的搜索结果,因此,我们当然会使用所有想得到的合理关键词。而且,当我们点击到有价值的新发现时,我们还会使用我们从连续的搜索过程中遇到的网页中发现的任何新关键词。
此外,我们还使用其它方法来滑动调节搜索范围。当我们决定搜索主题标题时,我们会从最特殊的关键词开始,以保证我们找回的文件和主题完全相关。当我们对找到什么相关内容几乎不存指望,-- 当我们需要的只是, -- 我们会从最宽泛的关键词开始搜索。一旦我们找到了什么资料,我们就会用尽技巧利用它,顺藤摸瓜连本带利找出更多相关资料。
当我们从概念最宽泛的关键词开始搜索时,我们会使用"OR"组织关键词,就象用一个拖网捕捉到四分之一英里内半径内的每一条鱼;并使用"AND"组织关键词,用这个方法来滑动调节到最狭窄的搜索范围,就象扔掉不合格的鱼。
狭窄搜索的风险是:某些相关信息中并不含有我们使用的关键词,或者我们选择的特殊搜索引擎或数据库中并没有索引某些相关信息,因此我们可能错过这些相关信息。而当我们从最宽泛概念开始搜索时,也要冒只找到无效结果的风险,比如当我测遍搜索引擎寻找一个名叫"E."的歌手信息时。
通过在宽泛和狭窄的概念之间滑动调节;组合不同的关键词、不同的搜索方法、不同的搜索资源;总是想着还能找到其它什么内容;我们大幅度提高了这种可能性:不是为顾客发现一个答案,而是为顾客发现一个最佳答案。
准则三: 答案必须迎合需求
图书馆员们需要理解的,不仅是问题,还需要理解:哪一种答案会使顾客满意。如果我们给他们的答案不是他们想要的那一种,那我们能算是回答了他们吗:有人要一篇百科全书文章,你给他一摞书,虽然那摞书中有答案?有人要一个特定问题的口头答案,你给他一个网站,虽然那网站中有答案?有位病人要了解他刚被诊断患上的一种疾病的信息,你给他一本专业医学学术杂志上的晦涩文章,虽然那文章中有答案?有人仅仅想打印几篇文章好带回家去看,你给他一打文摘?
接受这个假设:图书馆员是一群迷失在猎获的战栗中的好学者。我们总是能更顽强的追溯蛛丝马迹,跟那些在某方面有需求或感兴趣的顾客相比,我们总是能找到更多的信息。除非我们是在帮一个学者做研究,我们面临的问题通常不是找到信息,而是知道什么时候该停下来。-- 给一个礼貌的建议,当然,存在其它用户可采用的途径,他们应该要求更多。
准则四: 搜索是一个多步骤的过程
如果有人真的想寻找某个主题所有最细枝末节的信息,这会激活我们侦探犬般灵敏的本能,引发我们拥有的每一丝技巧。首先,我们会去每一个我们认为可能有所找信息的地方,搜索不止一个数据库,而是每一个似乎可能的数据库。我们会搜寻期刊数据库,论文摘要,OCLC联机联合编目目录(WorldCat),会议论文索引,等等。我们会急速走遍整个互联网,既使用普通搜索引擎,也使用特殊搜索引擎、专业网站和看不见的数据库。 每当我们发现什么的时候,我们都会从中观察发掘更多线索。跟随书目中的每一条信息,搜寻这些作者的更多作品,找到那些作者的e-mail,进行引用搜索,查找谁在引用他们的作品。每当我们发现有用的新关键词时,我们都会回到我们已搜索过的地方,使用新关键词再次搜索。当我们找到一些正是我们的顾客脑海中所想信息时,我们会极尽利用数据库或搜索引擎提供的任何功能-- 可点击的主题或者一个"more like this"的功能-- 寻找更多的类似条目。
|