幾年前,當(dāng)我第一次為搜索初學(xué)者做一份書目指南之前,我不得不靜下心去想,到底什么是我能教給他們的最簡單、最重要的東西?什么是我們職業(yè)搜索者知道的,而這些學(xué)生不懂的?什么課程是導(dǎo)致找到和找不到區(qū)別產(chǎn)生的原因以及是他們需要學(xué)習(xí)的?我的腦海中逐漸浮現(xiàn)四句話,我在辦公室中把它們寫在一張紙上:我的四條搜索準(zhǔn)則。在逝去的這幾年中,我已在這基礎(chǔ)上加了一些內(nèi)容。但是,我和我的同行們?nèi)匀磺宄牧私獠⒃趯?shí)踐它們,在我看來,這就是我們職業(yè)搜索者和普通用戶之所以區(qū)別的地方。
我沒有發(fā)明這些準(zhǔn)則,我只是使它們條理化文字化。條理化文字化--當(dāng)職業(yè)搜索者收到人們的問題時做的另一件事。
準(zhǔn)則一: 去信息應(yīng)該在的地方
(Rule One:Go Where It Is )
普通人或許以為,象我們這樣擅長搜索的人,一定是因?yàn)橹酪恍┦褂盟阉饕娴拿丶。其?shí),我們真正知道的,恰恰是這個事實(shí):對于很多問題,是無法用搜索引擎解決的,因?yàn)榛ヂ?lián)網(wǎng)上并不存在所需信息。也許答案藏在1935年出版的一本《哈潑的》中(Harper's),或者藏在1865年出版的一張《紐約時報(bào)》中,或者藏在一本對比不同歐洲國家醫(yī)療保險(xiǎn)管理政策的書中,或者藏在一段未發(fā)表的論文中,或者藏在一份寶時潔(P&G)做的產(chǎn)權(quán)市場調(diào)查中,或者藏在1965年的一場參議院聽證會記錄中。
當(dāng)任何人向我們提出一個問題時,無論是否熟悉該領(lǐng)域,我們做的第一件事,是搜尋我們腦海中積累的信息地理圖。當(dāng)我們說出"讓我們試一下聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)(MEDLINE)"時,我們已經(jīng)評估過用戶的需求(關(guān)于某種醫(yī)藥環(huán)境下的特殊療法)和知識水平(醫(yī)學(xué)教授或?qū)W生),并確定了哪里最可能找得到符合他們需求的信息(醫(yī)療文獻(xiàn)中的文章)。
無論那問題是什么,我們都會經(jīng)歷同樣的信息地理圖搜尋和確認(rèn)過程:被問及藝術(shù)品的復(fù)制時,我們會去搜尋藝術(shù)百科全書或者互聯(lián)網(wǎng);被問及1966年1美元可以買到什么時,我們會去搜尋《美國歷史統(tǒng)計(jì)》(Historical Statistics)或《美國統(tǒng)計(jì)摘要》(Statistical Abstracts)或者1966年的本地報(bào)紙廣告。不同的工具可以找回不同的信息,而圖書館員們的技巧正是了解哪一種工具可以最好的完成哪一種任務(wù)。
當(dāng)一個圖書館員問我特拉華流域(Delaware watershed)的原始信息時,我的第一個反應(yīng)是:
· 美國陸軍工程軍團(tuán)(Army Corps of Engineers).
· 美國漁業(yè)及野生動物服務(wù)(U.S. Fish and Wildlife Service).
· 美國環(huán)保局(Environmental Protection Agency).
· 特拉華州的同類部門(equivalent agencies for the state of Delaware).
明確了這個主題,我就在searchgov.com作了一次搜索,果然,從聯(lián)邦政府的這幾個部門和其它部門發(fā)現(xiàn)了一大堆相關(guān)文件。但是聯(lián)想到大多數(shù)關(guān)心流域問題的人都是科學(xué)家,我也用了SciSeek.com去搜索互聯(lián)網(wǎng)上的科學(xué)網(wǎng)站,那使我找到了大量其它與這個流域的環(huán)境、化學(xué)、工程相關(guān)的信息。
然后,我通過EBSCOhost 搜索多個全文數(shù)據(jù)庫,那使我找到了從包括科學(xué)雜志、旅行雜志和體育雜志上的相關(guān)文章。
圖書館員們也明白,不同信息源的風(fēng)格是互相不可代替的。雜志和報(bào)紙會用讀者簡明易懂的語言解釋復(fù)雜晦澀的主題,而學(xué)術(shù)和專業(yè)雜志則發(fā)表原始的研究文章(僅僅是普通用戶問題中的"研究"可能自動把我們送向一個雜志全文檢索庫)。但是因?yàn)?quot;研究"必然被限制在一個主題的很小的、可掌控的領(lǐng)域,它就象一個難題的小塊。當(dāng)我們想看這一個小塊的風(fēng)格時,或者當(dāng)我們想知道一個主題的廣泛背景時,我們會去找書,書會概括和讓你理解一個最初的研究。政府文件則會提供統(tǒng)計(jì)、法律、金融信息,甚至?xí)嘘P(guān)于"我們是誰?"、"我們擁有什么?"、"我們已經(jīng)到了哪一步?"等公開資料。
我們了解每一種信息源風(fēng)格的長處和短處;ヂ(lián)網(wǎng)長于圖片和示范,對于政府文件,對于FAQ文檔,對于討論組,對于傳輸全文數(shù)據(jù)庫;但是我們也知道,互聯(lián)網(wǎng)對于1995年前的雜志和政府文件,幾乎是沒什么用的。對于這些資料,我們?nèi)匀恍枰褂梦覀兊呐f索引和期刊備份。我們也比僅僅信任互聯(lián)網(wǎng)權(quán)威和準(zhǔn)確性知道得更多,你也許會在互聯(lián)網(wǎng)上找到一段引證 -- 甚至它的好幾個版本-- 但是不要指望找到它的正確起源。我們對于互聯(lián)網(wǎng)信息源的態(tài)度是冷戰(zhàn)式的懷疑:信任它,但是只有在確證以后。
我們知道誰最可能制造不同類別的信息。對于大多數(shù)嚴(yán)肅的統(tǒng)計(jì)數(shù)據(jù),我們會從《美國統(tǒng)計(jì)摘要》開始,但是對于生活類統(tǒng)計(jì)數(shù)據(jù),我們會去搜尋那些為需要推廣產(chǎn)品的廣告主們做的專業(yè)的市場調(diào)研報(bào)告。被問及美國男孩洗澡的頻度時,我查詢了一個全文商業(yè)期刊數(shù)據(jù)庫,查找會在諸如《美國人口統(tǒng)計(jì)數(shù)據(jù)》(American Demographics)等雜志上發(fā)表的市場調(diào)研報(bào)告。(順便提一下那問題的答案,答案有違我們的直覺:超過三分之一的男孩,每天至少洗澡兩次。)
我們知道,有時最好的信息源正是普通的人,作為個體的或作為群體之一的,對某主題有熱情的人。當(dāng)我們的用戶需要關(guān)于糖尿病的可靠的、權(quán)威的信息時,我們會帶他們?nèi)ッ绹悄虿f(xié)會(American Diabetes Association)的網(wǎng)站;當(dāng)我們的用戶想和有相同疾病經(jīng)驗(yàn)的人交流,想了解糖尿病患者如何生活時,我們會帶他們?nèi)ハ嚓P(guān)的支持團(tuán)體。
當(dāng)我們想知道一種嶄新科技或策略是否有效時,我們會去找互聯(lián)網(wǎng)上的相關(guān)討論組。而當(dāng)一個主題非常偏僻晦澀時,我們會直接上網(wǎng),因?yàn)榛ヂ?lián)網(wǎng)是那些擁有古怪偏好(如風(fēng)笛、中世紀(jì)地圖、劣質(zhì)的涂鴉作品)的人們分享他們熱情的最佳場所。
我們職業(yè)搜索者,完全可以被描述成信息世界中旅行者的向?qū)? 我們之所以能幫助我們的旅行者快速到達(dá)目的地 ,是因?yàn)槲覀冎滥康牡卦谀睦,是因(yàn)槲覀冎雷罴训穆肪是什么,因?yàn)槲覀冎缿?yīng)該坐飛機(jī),火車,還是汽車。
準(zhǔn)則二: 你得到什么答案,取決于你怎么提問
(Rule Two:The Answer You Get Depends on the Questions You Ask)
推論:問題決定答案,如果你不喜歡答案,那么換問題吧
普通人或許以為,圖書館員們一定知道所有的答案。其實(shí),我們真正知道的,是如何問出好問題。我們知道如何在寬泛和特殊之間自如滑動調(diào)節(jié)搜索范圍,直到我們找到那任務(wù)最關(guān)鍵的影響因素。
我們用來滑動調(diào)節(jié)搜索范圍的方法之一,是語言。如果我們用一個特殊關(guān)鍵詞沒有發(fā)現(xiàn)足夠的信息,我們就會轉(zhuǎn)向概念更寬泛的一個層面;如果我們發(fā)現(xiàn)了太多信息,我們就會嘗試更特殊的關(guān)鍵詞。
舉例來說,當(dāng)我們被要求尋找這方面的研究資料:肥胖者與身材標(biāo)準(zhǔn)者做相同的工作,是否肥胖者掙的錢更少? 一些我們會嘗試的關(guān)鍵詞,可能是"肥胖"或"體重"(obesity or weight),"薪水"或"工資"或"收入"(salary or wages or pay),"歧視"或"區(qū)別"(discrimination or differential)。我們也有可能使用更寬泛的陳述:肥胖和雇用歧視(Obesity and employment discrimination),這或許會找回各種關(guān)于歧視的研究資料:面試,薪水,評估,提升,等等。不管我們用哪種關(guān)鍵詞組合,我們都知道,我們會得到不同的搜索結(jié)果,因此,我們當(dāng)然會使用所有想得到的合理關(guān)鍵詞。而且,當(dāng)我們點(diǎn)擊到有價(jià)值的新發(fā)現(xiàn)時,我們還會使用我們從連續(xù)的搜索過程中遇到的網(wǎng)頁中發(fā)現(xiàn)的任何新關(guān)鍵詞。
此外,我們還使用其它方法來滑動調(diào)節(jié)搜索范圍。當(dāng)我們決定搜索主題標(biāo)題時,我們會從最特殊的關(guān)鍵詞開始,以保證我們找回的文件和主題完全相關(guān)。當(dāng)我們對找到什么相關(guān)內(nèi)容幾乎不存指望,-- 當(dāng)我們需要的只是damn fool luck, -- 我們會從最寬泛的關(guān)鍵詞開始搜索。一旦我們找到了什么資料,我們就會用盡技巧利用它,順藤摸瓜連本帶利找出更多相關(guān)資料。
當(dāng)我們從概念最寬泛的關(guān)鍵詞開始搜索時,我們會使用"OR"組織關(guān)鍵詞,就象用一個拖網(wǎng)捕捉到四分之一英里內(nèi)半徑內(nèi)的每一條魚;并使用"AND"組織關(guān)鍵詞,用這個方法來滑動調(diào)節(jié)到最狹窄的搜索范圍,就象扔掉不合格的魚。
當(dāng)我們想搜索無限信息宇宙中的一小塊時,-- 一個卡片目錄,或者《聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)》,或者一個特殊搜索引擎如searchgov.com -- 我們也是在搜索一個統(tǒng)一體的狹窄概念領(lǐng)域。
狹窄搜索的風(fēng)險(xiǎn)是:某些相關(guān)信息中并不含有我們使用的關(guān)鍵詞,或者我們選擇的特殊搜索引擎或數(shù)據(jù)庫中并沒有索引某些相關(guān)信息,因此我們可能錯過這些相關(guān)信息。而當(dāng)我們從最寬泛概念開始搜索時,也要冒只找到無效結(jié)果的風(fēng)險(xiǎn),比如當(dāng)我測遍搜索引擎尋找一個名叫"E."的歌手信息時。
通過在寬泛和狹窄的概念之間滑動調(diào)節(jié);組合不同的關(guān)鍵詞、不同的搜索方法、不同的搜索資源;總是想著還能找到其它什么內(nèi)容;我們大幅度提高了這種可能性:不是為顧客發(fā)現(xiàn)一個答案,而是為顧客發(fā)現(xiàn)一個最佳答案。
準(zhǔn)則三: 答案必須迎合需求
(Rule Three:The Answer Should Match the Information Need)
圖書館員們需要理解的,不僅是問題,還需要理解:哪一種答案會使顧客滿意。如果我們給他們的答案不是他們想要的那一種,那我們能算是回答了他們嗎:有人要一篇百科全書文章,你給他一摞書,雖然那摞書中有答案?有人要一個特定問題的口頭答案,你給他一個網(wǎng)站,雖然那網(wǎng)站中有答案?有位病人要了解他剛被診斷患上的一種疾病的信息,你給他一本專業(yè)醫(yī)學(xué)學(xué)術(shù)雜志上的晦澀文章,雖然那文章中有答案?有人僅僅想打印幾篇文章好帶回家去看,你給他一打文摘?
接受這個假設(shè):圖書館員是一群迷失在獵獲的戰(zhàn)栗中的好學(xué)者。我們總是能更頑強(qiáng)的追溯蛛絲馬跡,跟那些在某方面有需求或感興趣的顧客相比,我們總是能找到更多的信息。除非我們是在幫一個學(xué)者做研究,我們面臨的問題通常不是找到信息,而是知道什么時候該停下來。-- 給一個禮貌的建議,當(dāng)然,存在其它用戶可采用的途徑,他們應(yīng)該要求更多。
準(zhǔn)則四: 搜索是一個多步驟的過程
(Rule four:Research Is a Multi-Stage Process)
有時,獵獲過程只能是迂回曲折的。為了尋找歌手"E."的信息,我需要從一本搖滾百科全書或搖滾網(wǎng)站開始,我去了"終極樂隊(duì)名單"(UBL.com),在那里找到了"E."的一個傳記,一個音樂唱片分類目錄,他現(xiàn)在的樂隊(duì)The Eels的信息,他們的官方網(wǎng)站,以及巡回演出信息。
如果有人真的想尋找某個主題所有最細(xì)枝末節(jié)的信息,這會激活我們偵探犬般靈敏的本能,引發(fā)我們擁有的每一絲技巧。首先,我們會去每一個我們認(rèn)為可能有所找信息的地方,搜索不止一個數(shù)據(jù)庫,而是每一個似乎可能的數(shù)據(jù)庫。我們會搜尋期刊數(shù)據(jù)庫,論文摘要,OCLC聯(lián)機(jī)聯(lián)合編目目錄(WorldCat),會議論文索引,等等。我們會急速走遍整個互聯(lián)網(wǎng),既使用普通搜索引擎,也使用特殊搜索引擎、專業(yè)網(wǎng)站和看不見的數(shù)據(jù)庫。
每當(dāng)我們發(fā)現(xiàn)什么的時候,我們都會從中觀察發(fā)掘更多線索。跟隨書目中的每一條信息,搜尋這些作者的更多作品,找到那些作者的e-mail,進(jìn)行引用搜索,查找誰在引用他們的作品。每當(dāng)我們發(fā)現(xiàn)有用的新關(guān)鍵詞時,我們都會回到我們已搜索過的地方,使用新關(guān)鍵詞再次搜索。當(dāng)我們找到一些正是我們的顧客腦海中所想信息時,我們會極盡利用數(shù)據(jù)庫或搜索引擎提供的任何功能-- 可點(diǎn)擊的主題或者一個"more like this"的功能-- 尋找更多的類似條目。
準(zhǔn)則五: 信息本身是無意義的,只有人提問之后才有價(jià)值
(Rule Five:信息 Is Meaningless Until Queried by Human Intelligence)
數(shù)據(jù):瑞典是最大的烹調(diào)醬用戶。
數(shù)據(jù):51%的圣路易士居民說他們從未去過圣路易士拱門。
數(shù)據(jù):根據(jù)NEC研究院的資料,1.5% 的網(wǎng)站是色情網(wǎng)站。
現(xiàn)在你知道這些數(shù)據(jù)了,你更聰明了還是更happy了?事實(shí)上,你能有什么理由關(guān)心這些呢?沒有上下文,這些數(shù)據(jù)只是數(shù)據(jù),不是信息。只有在我們象這樣提問時,它們才成為有價(jià)值的信息:
· 如果我計(jì)劃在瑞典做銷售莎莎醬,會面臨什么樣的競爭?
· 圣路易士是否應(yīng)該面向本地居民做旅行宣傳廣告?
· 互聯(lián)網(wǎng)上的色情問題到底有多嚴(yán)重? (注意:解答這個問題需要遠(yuǎn)超過以上數(shù)據(jù)的信息)
這個世界充滿了無窮無盡的內(nèi)容:箭頭,陶器碎片,軟體動物化石,古老的文字和日記,五十年代的菜譜,壘高拼裝玩具,芭比娃娃。
所有這些數(shù)據(jù)都是無意義的,直到有人做一些事-- 提一個問題,把它們與其它數(shù)據(jù)放在一起,思考它們的意義,直到有人歸并這些碎片并發(fā)現(xiàn)一個過去的文明,或者在破爛文字中發(fā)現(xiàn)政治陰謀的痕跡,或者從這些舊菜譜中得知罐裝湯和袋裝食品是什么時候開始滲入我們生活的。
除非你知道自己要用它們做什么,隨便的數(shù)據(jù)堆積是無意義的。你必須從一個問題開始,或者一個主題,最好有一個明確的陳述不僅讓你明白什么信息是你需要的,而且讓你明白什么信息對你是無用的。如果你說你想找到專利權(quán)的經(jīng)濟(jì)效果,你完全可以只聚焦于成功者和失敗者。
這意味著你可以忽略保護(hù)專利權(quán)的爭論以及什么發(fā)明可以授予專利的辯論。你的數(shù)據(jù)應(yīng)該聚焦于股價(jià)、資產(chǎn)平衡表、和價(jià)格目錄。
準(zhǔn)則六: 向你的答案提問 ―― 信息可能是真的,但仍然是錯的
(Rule Six:Question Your Answers - Information May Be True But Still Wrong)
我住在愛荷華州的達(dá)芬波特市。2001年5月,我們招待了天知道多少網(wǎng)絡(luò)新聞記者,他們都把他們的相機(jī)指向我們的,被密西西比河包圍和淹沒的,棒球館。那些相機(jī)顯示了我們的河流對這國家的驅(qū)動-- 淹沒-- 小隊(duì)志愿者在填充沙袋。令人小小驚訝的是每一個我打過電話的親戚都提出送浮袋給我,但我不需要它。
這些記者一直在報(bào)道著事實(shí),直到我們離開。他們忽略的是告訴剩余的故事,把相機(jī)鏡頭移向四周,或者移向旁邊。如果他們有那么做,那么這個國家就會認(rèn)識到:達(dá)芬波特市建在一座驚人高大的山上,99%的城區(qū)都沒有收到洪水的影響,只要不遇到更糟的情況。
洪峰到來的那一天,太陽高照,而我正在監(jiān)督一隊(duì)建筑工人為我的房子蓋一個日光浴室。
這是一個令我們警醒的故事。這些記者無疑是誠實(shí)的,他們不會故意歪曲事實(shí),但是某種程度上他們又確實(shí)這么做了。必須記住,某些我們利用的信息源,比如任何一方的政客在談到2000大選期間發(fā)生在佛羅里達(dá)的戲劇性變化時,都使數(shù)據(jù)顯得支持他們那個版本的真實(shí)。我們必須明白,所有我們的知識都是不完整的的臨時的,會隨著新的證據(jù)和理論的出現(xiàn)而變化。三十年以前,恐龍還被認(rèn)為是冷血動物,但現(xiàn)在它們不是了?铸堊约簭膩頉]變過,是人,是新的證據(jù)和解釋使之變化。所以我們總是傾向于不完全肯定我們給別人的答案。
我們對如何向數(shù)據(jù)提問有足夠的了解。當(dāng)我們確信一個不可能為零的搜索結(jié)果為零時,我們會重新審視我們的搜索策略--我們是否拼錯單詞或姓名了?我們是否找錯地方了?我們向統(tǒng)計(jì)數(shù)據(jù)提問,問"這是誰說的?",問"他們是怎么知道的?quot;,問"他們的方法是什么?",如果有人給我們成年美國人挖鼻孔的精確比例,我們足夠清楚必須懷疑有多少人會誠實(shí)的回答這個問題。我們不會滿足于獲得的第一個答案。我們不斷地求證,求證,再求證。
準(zhǔn)則七: 問圖書館員
(Rule Seven:Ask a Lbrarian)
我們會……,廢話,我們當(dāng)然會問圖書館員。
· 因?yàn)槲覀兝潇o的了解我們的收藏。
· 因?yàn)橛袝r人們?nèi)绻陬A(yù)期地點(diǎn)沒有找到預(yù)期答案,就會放棄。(有多少次真實(shí)的問題被隱蔽在表面問題的背后:"讀者指南在哪兒?")
· 因?yàn)槲覀兣Πl(fā)現(xiàn)人們真正需求的信息,并且把它轉(zhuǎn)化成我們的系統(tǒng)能理解的問題。
· 因?yàn)槲覀兏瞄L于面面俱到的考慮一個事物的前前后后-- 如果我們沒有關(guān)于暹羅貓的書,我們還有關(guān)于貓類繁殖和飼養(yǎng)的書;我們還有雜志索引和數(shù)據(jù)庫可能幫我們找到關(guān)于暹羅貓的文章;我們甚至可能在顧客不屑一顧的兒童書籍中找到一本合適的書。
· 因?yàn)槲覀兞私馊绾蚊罡鞣N數(shù)據(jù)庫起立、打滾、舔我們的臉。我們的用戶沒有找到答案的事實(shí),并不意味著答案不存在。(誠然,事實(shí)可能是我們也找不到答案。)
· 因?yàn),跟我們的用戶不同,我們在去開始搜尋的時候,是帶著太平洋底的深信,深信答案存在,而以上帝的名義,憑作為圖書館員的榮譽(yù),我們會把它找出來。
問題是,為什么會只有我們,幾乎沒有別人再懂這些?
這些準(zhǔn)則真被當(dāng)做準(zhǔn)則受到重視嗎?它們應(yīng)該是的,因?yàn)槲宜赖拿恳粋優(yōu)秀圖書館員,所有時間都在實(shí)踐它們。這可以用來解釋,為什么我們能夠如此一致的、輕易的,制造一些超越我們的目錄和計(jì)算機(jī)的神秘,找到使外行吃驚的答案。
我常常暗示我的學(xué)生,信息就象匹薩餅,-- 你越餓,你就吃得越多。你的搜索需求越徹底,你越需要徹底搜索所有可利用資源。這是我的猜測,關(guān)于什么格式的信息分別占據(jù)了在過去3個世紀(jì)中累計(jì)總信息的多少百分比。我相信由地區(qū)、國家、國際政府創(chuàng)造的文件是這幾個世紀(jì)中最大的獨(dú)立信息源;然后是書和期刊;即使已有著超過10億網(wǎng)頁,而且在以每天幾百萬的速度增加,互聯(lián)網(wǎng)在能有競爭力之前,還有很多需要迎頭趕上的地方;剩下的小塊還包括諸如論文、會議文獻(xiàn)、錄像、電影、圖片、地圖、數(shù)據(jù)庫,等等。
這個信息匹薩餅的每一個小碎片,都還能被分割得最小,甚至一個如雜志或期刊這樣的小碎片,也還能被細(xì)分成索引不同內(nèi)容的不同數(shù)據(jù)庫--聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)(Medline), 科教資源信息中心(ERIC),生物學(xué)文摘(Biological Abstracts),美國國立農(nóng)業(yè)圖書館館藏檢索(Agricola)。如果你真的想進(jìn)行完整的搜索,檢查支離破碎的每一個可能小片。
下邊這些是最初的信息準(zhǔn)則,比我當(dāng)初寫下時和謄寫時已漂亮點(diǎn)了。從那以后它們已有所成長:
1. Go where it is.
2. The answer you get depends on the question you ask.
3. Research is a multi-stage process.
4. Ask a librarian.
我沒有發(fā)明這些準(zhǔn)則,我只是使它們條理化文字化。條理化文字化--當(dāng)職業(yè)搜索者收到人們的問題時做的另一件事。
準(zhǔn)則一: 去信息應(yīng)該在的地方
(Rule One:Go Where It Is )
普通人或許以為,象我們這樣擅長搜索的人,一定是因?yàn)橹酪恍┦褂盟阉饕娴拿丶。其?shí),我們真正知道的,恰恰是這個事實(shí):對于很多問題,是無法用搜索引擎解決的,因?yàn)榛ヂ?lián)網(wǎng)上并不存在所需信息。也許答案藏在1935年出版的一本《哈潑的》中(Harper's),或者藏在1865年出版的一張《紐約時報(bào)》中,或者藏在一本對比不同歐洲國家醫(yī)療保險(xiǎn)管理政策的書中,或者藏在一段未發(fā)表的論文中,或者藏在一份寶時潔(P&G)做的產(chǎn)權(quán)市場調(diào)查中,或者藏在1965年的一場參議院聽證會記錄中。
當(dāng)任何人向我們提出一個問題時,無論是否熟悉該領(lǐng)域,我們做的第一件事,是搜尋我們腦海中積累的信息地理圖。當(dāng)我們說出"讓我們試一下聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)(MEDLINE)"時,我們已經(jīng)評估過用戶的需求(關(guān)于某種醫(yī)藥環(huán)境下的特殊療法)和知識水平(醫(yī)學(xué)教授或?qū)W生),并確定了哪里最可能找得到符合他們需求的信息(醫(yī)療文獻(xiàn)中的文章)。
無論那問題是什么,我們都會經(jīng)歷同樣的信息地理圖搜尋和確認(rèn)過程:被問及藝術(shù)品的復(fù)制時,我們會去搜尋藝術(shù)百科全書或者互聯(lián)網(wǎng);被問及1966年1美元可以買到什么時,我們會去搜尋《美國歷史統(tǒng)計(jì)》(Historical Statistics)或《美國統(tǒng)計(jì)摘要》(Statistical Abstracts)或者1966年的本地報(bào)紙廣告。不同的工具可以找回不同的信息,而圖書館員們的技巧正是了解哪一種工具可以最好的完成哪一種任務(wù)。
當(dāng)一個圖書館員問我特拉華流域(Delaware watershed)的原始信息時,我的第一個反應(yīng)是:
· 美國陸軍工程軍團(tuán)(Army Corps of Engineers).
· 美國漁業(yè)及野生動物服務(wù)(U.S. Fish and Wildlife Service).
· 美國環(huán)保局(Environmental Protection Agency).
· 特拉華州的同類部門(equivalent agencies for the state of Delaware).
明確了這個主題,我就在searchgov.com作了一次搜索,果然,從聯(lián)邦政府的這幾個部門和其它部門發(fā)現(xiàn)了一大堆相關(guān)文件。但是聯(lián)想到大多數(shù)關(guān)心流域問題的人都是科學(xué)家,我也用了SciSeek.com去搜索互聯(lián)網(wǎng)上的科學(xué)網(wǎng)站,那使我找到了大量其它與這個流域的環(huán)境、化學(xué)、工程相關(guān)的信息。
然后,我通過EBSCOhost 搜索多個全文數(shù)據(jù)庫,那使我找到了從包括科學(xué)雜志、旅行雜志和體育雜志上的相關(guān)文章。
圖書館員們也明白,不同信息源的風(fēng)格是互相不可代替的。雜志和報(bào)紙會用讀者簡明易懂的語言解釋復(fù)雜晦澀的主題,而學(xué)術(shù)和專業(yè)雜志則發(fā)表原始的研究文章(僅僅是普通用戶問題中的"研究"可能自動把我們送向一個雜志全文檢索庫)。但是因?yàn)?quot;研究"必然被限制在一個主題的很小的、可掌控的領(lǐng)域,它就象一個難題的小塊。當(dāng)我們想看這一個小塊的風(fēng)格時,或者當(dāng)我們想知道一個主題的廣泛背景時,我們會去找書,書會概括和讓你理解一個最初的研究。政府文件則會提供統(tǒng)計(jì)、法律、金融信息,甚至?xí)嘘P(guān)于"我們是誰?"、"我們擁有什么?"、"我們已經(jīng)到了哪一步?"等公開資料。
我們了解每一種信息源風(fēng)格的長處和短處;ヂ(lián)網(wǎng)長于圖片和示范,對于政府文件,對于FAQ文檔,對于討論組,對于傳輸全文數(shù)據(jù)庫;但是我們也知道,互聯(lián)網(wǎng)對于1995年前的雜志和政府文件,幾乎是沒什么用的。對于這些資料,我們?nèi)匀恍枰褂梦覀兊呐f索引和期刊備份。我們也比僅僅信任互聯(lián)網(wǎng)權(quán)威和準(zhǔn)確性知道得更多,你也許會在互聯(lián)網(wǎng)上找到一段引證 -- 甚至它的好幾個版本-- 但是不要指望找到它的正確起源。我們對于互聯(lián)網(wǎng)信息源的態(tài)度是冷戰(zhàn)式的懷疑:信任它,但是只有在確證以后。
我們知道誰最可能制造不同類別的信息。對于大多數(shù)嚴(yán)肅的統(tǒng)計(jì)數(shù)據(jù),我們會從《美國統(tǒng)計(jì)摘要》開始,但是對于生活類統(tǒng)計(jì)數(shù)據(jù),我們會去搜尋那些為需要推廣產(chǎn)品的廣告主們做的專業(yè)的市場調(diào)研報(bào)告。被問及美國男孩洗澡的頻度時,我查詢了一個全文商業(yè)期刊數(shù)據(jù)庫,查找會在諸如《美國人口統(tǒng)計(jì)數(shù)據(jù)》(American Demographics)等雜志上發(fā)表的市場調(diào)研報(bào)告。(順便提一下那問題的答案,答案有違我們的直覺:超過三分之一的男孩,每天至少洗澡兩次。)
我們知道,有時最好的信息源正是普通的人,作為個體的或作為群體之一的,對某主題有熱情的人。當(dāng)我們的用戶需要關(guān)于糖尿病的可靠的、權(quán)威的信息時,我們會帶他們?nèi)ッ绹悄虿f(xié)會(American Diabetes Association)的網(wǎng)站;當(dāng)我們的用戶想和有相同疾病經(jīng)驗(yàn)的人交流,想了解糖尿病患者如何生活時,我們會帶他們?nèi)ハ嚓P(guān)的支持團(tuán)體。
當(dāng)我們想知道一種嶄新科技或策略是否有效時,我們會去找互聯(lián)網(wǎng)上的相關(guān)討論組。而當(dāng)一個主題非常偏僻晦澀時,我們會直接上網(wǎng),因?yàn)榛ヂ?lián)網(wǎng)是那些擁有古怪偏好(如風(fēng)笛、中世紀(jì)地圖、劣質(zhì)的涂鴉作品)的人們分享他們熱情的最佳場所。
我們職業(yè)搜索者,完全可以被描述成信息世界中旅行者的向?qū)? 我們之所以能幫助我們的旅行者快速到達(dá)目的地 ,是因?yàn)槲覀冎滥康牡卦谀睦,是因(yàn)槲覀冎雷罴训穆肪是什么,因?yàn)槲覀冎缿?yīng)該坐飛機(jī),火車,還是汽車。
準(zhǔn)則二: 你得到什么答案,取決于你怎么提問
(Rule Two:The Answer You Get Depends on the Questions You Ask)
推論:問題決定答案,如果你不喜歡答案,那么換問題吧
普通人或許以為,圖書館員們一定知道所有的答案。其實(shí),我們真正知道的,是如何問出好問題。我們知道如何在寬泛和特殊之間自如滑動調(diào)節(jié)搜索范圍,直到我們找到那任務(wù)最關(guān)鍵的影響因素。
我們用來滑動調(diào)節(jié)搜索范圍的方法之一,是語言。如果我們用一個特殊關(guān)鍵詞沒有發(fā)現(xiàn)足夠的信息,我們就會轉(zhuǎn)向概念更寬泛的一個層面;如果我們發(fā)現(xiàn)了太多信息,我們就會嘗試更特殊的關(guān)鍵詞。
舉例來說,當(dāng)我們被要求尋找這方面的研究資料:肥胖者與身材標(biāo)準(zhǔn)者做相同的工作,是否肥胖者掙的錢更少? 一些我們會嘗試的關(guān)鍵詞,可能是"肥胖"或"體重"(obesity or weight),"薪水"或"工資"或"收入"(salary or wages or pay),"歧視"或"區(qū)別"(discrimination or differential)。我們也有可能使用更寬泛的陳述:肥胖和雇用歧視(Obesity and employment discrimination),這或許會找回各種關(guān)于歧視的研究資料:面試,薪水,評估,提升,等等。不管我們用哪種關(guān)鍵詞組合,我們都知道,我們會得到不同的搜索結(jié)果,因此,我們當(dāng)然會使用所有想得到的合理關(guān)鍵詞。而且,當(dāng)我們點(diǎn)擊到有價(jià)值的新發(fā)現(xiàn)時,我們還會使用我們從連續(xù)的搜索過程中遇到的網(wǎng)頁中發(fā)現(xiàn)的任何新關(guān)鍵詞。
此外,我們還使用其它方法來滑動調(diào)節(jié)搜索范圍。當(dāng)我們決定搜索主題標(biāo)題時,我們會從最特殊的關(guān)鍵詞開始,以保證我們找回的文件和主題完全相關(guān)。當(dāng)我們對找到什么相關(guān)內(nèi)容幾乎不存指望,-- 當(dāng)我們需要的只是damn fool luck, -- 我們會從最寬泛的關(guān)鍵詞開始搜索。一旦我們找到了什么資料,我們就會用盡技巧利用它,順藤摸瓜連本帶利找出更多相關(guān)資料。
當(dāng)我們從概念最寬泛的關(guān)鍵詞開始搜索時,我們會使用"OR"組織關(guān)鍵詞,就象用一個拖網(wǎng)捕捉到四分之一英里內(nèi)半徑內(nèi)的每一條魚;并使用"AND"組織關(guān)鍵詞,用這個方法來滑動調(diào)節(jié)到最狹窄的搜索范圍,就象扔掉不合格的魚。
當(dāng)我們想搜索無限信息宇宙中的一小塊時,-- 一個卡片目錄,或者《聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)》,或者一個特殊搜索引擎如searchgov.com -- 我們也是在搜索一個統(tǒng)一體的狹窄概念領(lǐng)域。
狹窄搜索的風(fēng)險(xiǎn)是:某些相關(guān)信息中并不含有我們使用的關(guān)鍵詞,或者我們選擇的特殊搜索引擎或數(shù)據(jù)庫中并沒有索引某些相關(guān)信息,因此我們可能錯過這些相關(guān)信息。而當(dāng)我們從最寬泛概念開始搜索時,也要冒只找到無效結(jié)果的風(fēng)險(xiǎn),比如當(dāng)我測遍搜索引擎尋找一個名叫"E."的歌手信息時。
通過在寬泛和狹窄的概念之間滑動調(diào)節(jié);組合不同的關(guān)鍵詞、不同的搜索方法、不同的搜索資源;總是想著還能找到其它什么內(nèi)容;我們大幅度提高了這種可能性:不是為顧客發(fā)現(xiàn)一個答案,而是為顧客發(fā)現(xiàn)一個最佳答案。
準(zhǔn)則三: 答案必須迎合需求
(Rule Three:The Answer Should Match the Information Need)
圖書館員們需要理解的,不僅是問題,還需要理解:哪一種答案會使顧客滿意。如果我們給他們的答案不是他們想要的那一種,那我們能算是回答了他們嗎:有人要一篇百科全書文章,你給他一摞書,雖然那摞書中有答案?有人要一個特定問題的口頭答案,你給他一個網(wǎng)站,雖然那網(wǎng)站中有答案?有位病人要了解他剛被診斷患上的一種疾病的信息,你給他一本專業(yè)醫(yī)學(xué)學(xué)術(shù)雜志上的晦澀文章,雖然那文章中有答案?有人僅僅想打印幾篇文章好帶回家去看,你給他一打文摘?
接受這個假設(shè):圖書館員是一群迷失在獵獲的戰(zhàn)栗中的好學(xué)者。我們總是能更頑強(qiáng)的追溯蛛絲馬跡,跟那些在某方面有需求或感興趣的顧客相比,我們總是能找到更多的信息。除非我們是在幫一個學(xué)者做研究,我們面臨的問題通常不是找到信息,而是知道什么時候該停下來。-- 給一個禮貌的建議,當(dāng)然,存在其它用戶可采用的途徑,他們應(yīng)該要求更多。
準(zhǔn)則四: 搜索是一個多步驟的過程
(Rule four:Research Is a Multi-Stage Process)
有時,獵獲過程只能是迂回曲折的。為了尋找歌手"E."的信息,我需要從一本搖滾百科全書或搖滾網(wǎng)站開始,我去了"終極樂隊(duì)名單"(UBL.com),在那里找到了"E."的一個傳記,一個音樂唱片分類目錄,他現(xiàn)在的樂隊(duì)The Eels的信息,他們的官方網(wǎng)站,以及巡回演出信息。
如果有人真的想尋找某個主題所有最細(xì)枝末節(jié)的信息,這會激活我們偵探犬般靈敏的本能,引發(fā)我們擁有的每一絲技巧。首先,我們會去每一個我們認(rèn)為可能有所找信息的地方,搜索不止一個數(shù)據(jù)庫,而是每一個似乎可能的數(shù)據(jù)庫。我們會搜尋期刊數(shù)據(jù)庫,論文摘要,OCLC聯(lián)機(jī)聯(lián)合編目目錄(WorldCat),會議論文索引,等等。我們會急速走遍整個互聯(lián)網(wǎng),既使用普通搜索引擎,也使用特殊搜索引擎、專業(yè)網(wǎng)站和看不見的數(shù)據(jù)庫。
每當(dāng)我們發(fā)現(xiàn)什么的時候,我們都會從中觀察發(fā)掘更多線索。跟隨書目中的每一條信息,搜尋這些作者的更多作品,找到那些作者的e-mail,進(jìn)行引用搜索,查找誰在引用他們的作品。每當(dāng)我們發(fā)現(xiàn)有用的新關(guān)鍵詞時,我們都會回到我們已搜索過的地方,使用新關(guān)鍵詞再次搜索。當(dāng)我們找到一些正是我們的顧客腦海中所想信息時,我們會極盡利用數(shù)據(jù)庫或搜索引擎提供的任何功能-- 可點(diǎn)擊的主題或者一個"more like this"的功能-- 尋找更多的類似條目。
準(zhǔn)則五: 信息本身是無意義的,只有人提問之后才有價(jià)值
(Rule Five:信息 Is Meaningless Until Queried by Human Intelligence)
數(shù)據(jù):瑞典是最大的烹調(diào)醬用戶。
數(shù)據(jù):51%的圣路易士居民說他們從未去過圣路易士拱門。
數(shù)據(jù):根據(jù)NEC研究院的資料,1.5% 的網(wǎng)站是色情網(wǎng)站。
現(xiàn)在你知道這些數(shù)據(jù)了,你更聰明了還是更happy了?事實(shí)上,你能有什么理由關(guān)心這些呢?沒有上下文,這些數(shù)據(jù)只是數(shù)據(jù),不是信息。只有在我們象這樣提問時,它們才成為有價(jià)值的信息:
· 如果我計(jì)劃在瑞典做銷售莎莎醬,會面臨什么樣的競爭?
· 圣路易士是否應(yīng)該面向本地居民做旅行宣傳廣告?
· 互聯(lián)網(wǎng)上的色情問題到底有多嚴(yán)重? (注意:解答這個問題需要遠(yuǎn)超過以上數(shù)據(jù)的信息)
這個世界充滿了無窮無盡的內(nèi)容:箭頭,陶器碎片,軟體動物化石,古老的文字和日記,五十年代的菜譜,壘高拼裝玩具,芭比娃娃。
所有這些數(shù)據(jù)都是無意義的,直到有人做一些事-- 提一個問題,把它們與其它數(shù)據(jù)放在一起,思考它們的意義,直到有人歸并這些碎片并發(fā)現(xiàn)一個過去的文明,或者在破爛文字中發(fā)現(xiàn)政治陰謀的痕跡,或者從這些舊菜譜中得知罐裝湯和袋裝食品是什么時候開始滲入我們生活的。
除非你知道自己要用它們做什么,隨便的數(shù)據(jù)堆積是無意義的。你必須從一個問題開始,或者一個主題,最好有一個明確的陳述不僅讓你明白什么信息是你需要的,而且讓你明白什么信息對你是無用的。如果你說你想找到專利權(quán)的經(jīng)濟(jì)效果,你完全可以只聚焦于成功者和失敗者。
這意味著你可以忽略保護(hù)專利權(quán)的爭論以及什么發(fā)明可以授予專利的辯論。你的數(shù)據(jù)應(yīng)該聚焦于股價(jià)、資產(chǎn)平衡表、和價(jià)格目錄。
準(zhǔn)則六: 向你的答案提問 ―― 信息可能是真的,但仍然是錯的
(Rule Six:Question Your Answers - Information May Be True But Still Wrong)
我住在愛荷華州的達(dá)芬波特市。2001年5月,我們招待了天知道多少網(wǎng)絡(luò)新聞記者,他們都把他們的相機(jī)指向我們的,被密西西比河包圍和淹沒的,棒球館。那些相機(jī)顯示了我們的河流對這國家的驅(qū)動-- 淹沒-- 小隊(duì)志愿者在填充沙袋。令人小小驚訝的是每一個我打過電話的親戚都提出送浮袋給我,但我不需要它。
這些記者一直在報(bào)道著事實(shí),直到我們離開。他們忽略的是告訴剩余的故事,把相機(jī)鏡頭移向四周,或者移向旁邊。如果他們有那么做,那么這個國家就會認(rèn)識到:達(dá)芬波特市建在一座驚人高大的山上,99%的城區(qū)都沒有收到洪水的影響,只要不遇到更糟的情況。
洪峰到來的那一天,太陽高照,而我正在監(jiān)督一隊(duì)建筑工人為我的房子蓋一個日光浴室。
這是一個令我們警醒的故事。這些記者無疑是誠實(shí)的,他們不會故意歪曲事實(shí),但是某種程度上他們又確實(shí)這么做了。必須記住,某些我們利用的信息源,比如任何一方的政客在談到2000大選期間發(fā)生在佛羅里達(dá)的戲劇性變化時,都使數(shù)據(jù)顯得支持他們那個版本的真實(shí)。我們必須明白,所有我們的知識都是不完整的的臨時的,會隨著新的證據(jù)和理論的出現(xiàn)而變化。三十年以前,恐龍還被認(rèn)為是冷血動物,但現(xiàn)在它們不是了?铸堊约簭膩頉]變過,是人,是新的證據(jù)和解釋使之變化。所以我們總是傾向于不完全肯定我們給別人的答案。
我們對如何向數(shù)據(jù)提問有足夠的了解。當(dāng)我們確信一個不可能為零的搜索結(jié)果為零時,我們會重新審視我們的搜索策略--我們是否拼錯單詞或姓名了?我們是否找錯地方了?我們向統(tǒng)計(jì)數(shù)據(jù)提問,問"這是誰說的?",問"他們是怎么知道的?quot;,問"他們的方法是什么?",如果有人給我們成年美國人挖鼻孔的精確比例,我們足夠清楚必須懷疑有多少人會誠實(shí)的回答這個問題。我們不會滿足于獲得的第一個答案。我們不斷地求證,求證,再求證。
準(zhǔn)則七: 問圖書館員
(Rule Seven:Ask a Lbrarian)
我們會……,廢話,我們當(dāng)然會問圖書館員。
· 因?yàn)槲覀兝潇o的了解我們的收藏。
· 因?yàn)橛袝r人們?nèi)绻陬A(yù)期地點(diǎn)沒有找到預(yù)期答案,就會放棄。(有多少次真實(shí)的問題被隱蔽在表面問題的背后:"讀者指南在哪兒?")
· 因?yàn)槲覀兣Πl(fā)現(xiàn)人們真正需求的信息,并且把它轉(zhuǎn)化成我們的系統(tǒng)能理解的問題。
· 因?yàn)槲覀兏瞄L于面面俱到的考慮一個事物的前前后后-- 如果我們沒有關(guān)于暹羅貓的書,我們還有關(guān)于貓類繁殖和飼養(yǎng)的書;我們還有雜志索引和數(shù)據(jù)庫可能幫我們找到關(guān)于暹羅貓的文章;我們甚至可能在顧客不屑一顧的兒童書籍中找到一本合適的書。
· 因?yàn)槲覀兞私馊绾蚊罡鞣N數(shù)據(jù)庫起立、打滾、舔我們的臉。我們的用戶沒有找到答案的事實(shí),并不意味著答案不存在。(誠然,事實(shí)可能是我們也找不到答案。)
· 因?yàn),跟我們的用戶不同,我們在去開始搜尋的時候,是帶著太平洋底的深信,深信答案存在,而以上帝的名義,憑作為圖書館員的榮譽(yù),我們會把它找出來。
問題是,為什么會只有我們,幾乎沒有別人再懂這些?
這些準(zhǔn)則真被當(dāng)做準(zhǔn)則受到重視嗎?它們應(yīng)該是的,因?yàn)槲宜赖拿恳粋優(yōu)秀圖書館員,所有時間都在實(shí)踐它們。這可以用來解釋,為什么我們能夠如此一致的、輕易的,制造一些超越我們的目錄和計(jì)算機(jī)的神秘,找到使外行吃驚的答案。
我常常暗示我的學(xué)生,信息就象匹薩餅,-- 你越餓,你就吃得越多。你的搜索需求越徹底,你越需要徹底搜索所有可利用資源。這是我的猜測,關(guān)于什么格式的信息分別占據(jù)了在過去3個世紀(jì)中累計(jì)總信息的多少百分比。我相信由地區(qū)、國家、國際政府創(chuàng)造的文件是這幾個世紀(jì)中最大的獨(dú)立信息源;然后是書和期刊;即使已有著超過10億網(wǎng)頁,而且在以每天幾百萬的速度增加,互聯(lián)網(wǎng)在能有競爭力之前,還有很多需要迎頭趕上的地方;剩下的小塊還包括諸如論文、會議文獻(xiàn)、錄像、電影、圖片、地圖、數(shù)據(jù)庫,等等。
這個信息匹薩餅的每一個小碎片,都還能被分割得最小,甚至一個如雜志或期刊這樣的小碎片,也還能被細(xì)分成索引不同內(nèi)容的不同數(shù)據(jù)庫--聯(lián)機(jī)醫(yī)學(xué)文獻(xiàn)分析和檢索系統(tǒng)(Medline), 科教資源信息中心(ERIC),生物學(xué)文摘(Biological Abstracts),美國國立農(nóng)業(yè)圖書館館藏檢索(Agricola)。如果你真的想進(jìn)行完整的搜索,檢查支離破碎的每一個可能小片。
下邊這些是最初的信息準(zhǔn)則,比我當(dāng)初寫下時和謄寫時已漂亮點(diǎn)了。從那以后它們已有所成長:
1. Go where it is.
2. The answer you get depends on the question you ask.
3. Research is a multi-stage process.
4. Ask a librarian.