通過論述在專題數(shù)據(jù)庫建設(shè)工作中的幾點體會,結(jié)合分析我國數(shù)據(jù)庫建設(shè)現(xiàn)狀,總結(jié)介紹了數(shù)據(jù)庫建設(shè)必需的技術(shù)要素并提出了在數(shù)據(jù)庫建設(shè)中對圖書館文獻資源利用新的認識和看法?! 娟P(guān)鍵詞】數(shù)據(jù)庫建設(shè);圖書館文獻資源;利用 當今時代是飛速發(fā)展的信息時代,各行各業(yè)都離不開信息處理,這正是計算機被廣泛應(yīng)用于信息管理系統(tǒng)的大環(huán)境。計算機的最大好處在于利用它能夠進行信息管理,使用計算機進行信息控制,不僅提高了工作效率,而且大大的提高了其安全性。尤其對于復雜的信息管理,計算機能夠充分發(fā)揮它的優(yōu)越性。基于這一優(yōu)勢,電子數(shù)據(jù)庫的重要性得到了迅速的提升,數(shù)據(jù)庫的功能隨著互聯(lián)網(wǎng)技術(shù)推廣得到了前所未有的最大限度利用。計算機技術(shù)引入文獻工作之后,由于手段的先進和檢索的便利,數(shù)據(jù)庫的制作逐步繁榮起來,出現(xiàn)一些大型的數(shù)據(jù)庫,例如美國的《CA》。網(wǎng)絡(luò)技術(shù)的出現(xiàn),使人們感受到了使用數(shù)據(jù)庫的便利。到現(xiàn)在,各種數(shù)據(jù)庫層出不窮,在文獻工作中,數(shù)據(jù)庫的制作也成為了尋常的事情?! ?005年至今,筆者一直負責組織實施河北文化信息資源共享中心網(wǎng)站的的數(shù)據(jù)庫建設(shè),其中包括了《數(shù)字期刊庫》、《燕趙名人數(shù)據(jù)庫》、《河北梆子原始資料庫》、《燕趙十三梅數(shù)據(jù)庫》幾個大型數(shù)據(jù)庫的建設(shè)工作,并參與了《紀念抗日戰(zhàn)爭勝利60周年》和《河北紅色旅游》兩個專題數(shù)據(jù)庫的制作。其中《燕趙名人數(shù)據(jù)庫》收錄了燕趙古今名人信息,共計8646條,文字240萬字?!堆嘹w十三梅數(shù)據(jù)庫》完整的呈現(xiàn)了河北十三位榮獲全國戲曲最高獎“梅花獎”演員的生平、藝術(shù)創(chuàng)作、生活趣事等,共計1220條,圖片200幅,文字150萬字。《河北梆子原始資料庫》完成了包括《中國京劇音配像精粹》、《河北梆子經(jīng)典》、《河北梆子名家名段》、《中國評劇大全》及《中國評劇薈萃》等共計662部VCD的數(shù)字化轉(zhuǎn)換工作?!稊?shù)字期刊庫》更是以每年5000千篇期刊,150萬字的,1000多幅圖片的工作量提交文化部全國文化信息資源共享工程數(shù)據(jù)庫,至今以有五年時間。《紅色旅游數(shù)據(jù)庫》包括河北省著名紅色旅游景點、英雄人物、歷史事件、紅色視頻等欄目,共計3000條,視頻5部,圖片100幅。《紀念抗日戰(zhàn)爭勝利60周年》專題數(shù)據(jù)庫配合紀念抗戰(zhàn)勝利活動的舉辦取得了良好的社會效應(yīng),并亦已提交文化部全國文化信息資源共享工程數(shù)據(jù)庫。這幾個數(shù)據(jù)庫的建立是依托河北省圖書館現(xiàn)有資源,經(jīng)過重新加工整合,以生動活潑的網(wǎng)絡(luò)形式展現(xiàn)給讀者。這些特色數(shù)據(jù)庫從一個側(cè)面展示了河北文化的獨有魅力。 在工作中,本人對數(shù)據(jù)庫、數(shù)據(jù)庫技術(shù)和數(shù)據(jù)庫制作有了一些新的認識和看法,寫成本文,以供大家以后工作時借鑒。1.數(shù)據(jù)庫制作的兩大技術(shù)要素 在技術(shù)上,制作專題數(shù)據(jù)庫主要有兩大方面的基本要求:計算機技術(shù)和網(wǎng)絡(luò)技術(shù)、文獻資源處理技術(shù)?! ?.1計算機技術(shù)和網(wǎng)絡(luò)技術(shù)。 1.1.1計算機技術(shù)為數(shù)據(jù)庫制作提供了先進的、強大的技術(shù)手段。在信息資源采集存儲,加工整理和檢索三個方面,利用計算機技術(shù)制作數(shù)據(jù)庫的工作效率是手工工作所不能比擬的。 1.2.2網(wǎng)絡(luò)技術(shù)為數(shù)據(jù)庫制作提供了先進的工作組織和協(xié)作手段以及先進的傳播手段。網(wǎng)絡(luò)技術(shù)極大地擴展了數(shù)據(jù)庫共享的空間和時間范圍,這是文獻工作者多年來夢寐以求的目標。 但是在網(wǎng)絡(luò)上傳播數(shù)據(jù)庫要有一定的運行平臺,這個平臺根據(jù)不同的標準劃分范圍,或以地域為標準,或以行業(yè)為標準,或以行政上的統(tǒng)屬關(guān)系為標準……,例如ndcnc系統(tǒng)就是全國文化信息資源建設(shè)管理中心網(wǎng)站上各種數(shù)據(jù)庫的運行平臺,而我們河北文化信息資源共享中心的網(wǎng)站則采用了自建的dhbc系統(tǒng)。 在圖書館發(fā)展久遠的歷史中,圖書館學和情報科學的領(lǐng)域內(nèi),已經(jīng)形成了完備的文獻檢索理論和強大的檢索技術(shù)體系和手段。數(shù)據(jù)庫建設(shè)最重要的目的之一就是方便讀者通過便捷的檢索方式查找到所需信息,能以更高的效率檢索到前人和別人取得的經(jīng)驗和成果,那么數(shù)據(jù)庫檢索設(shè)定尤為重要。計算機技術(shù)的引入使檢索技術(shù)具有了更加強大的功能和效率。 [1] [2] [3] [] [] 數(shù)據(jù)庫是相關(guān)記錄的集合,它以記錄為基本單位。每條記錄都有固定格式。正是因為有了這個固定格式,數(shù)據(jù)庫中的數(shù)據(jù)才得以有序的組織和存儲,高效率的檢索才得以實現(xiàn)?! ?.2信息資源技術(shù)。信息資源是數(shù)據(jù)庫的靈魂。采用各種復雜的技術(shù)制作數(shù)據(jù)庫,目的就是實現(xiàn)信息資源的存儲、檢索和傳播。因此,處理各種信息資源的技術(shù)也是制作數(shù)據(jù)庫必備的技術(shù)。數(shù)據(jù)庫給資源提供了表現(xiàn)形式,并不意味著資源可以任意使用和安排,資源經(jīng)過整理、加工才可以合理使用。信息資源技術(shù)包括以下幾個方面: 1.2.1信息資源的采集。首先確定所需資源主題,其次以主題為中心查找、征集相關(guān)資源,資源的形式多種多樣,應(yīng)盡可能的廣泛的搜集,在能力范圍內(nèi)征集?! ?.2.2信息資源的預處理。對采集到的所有資源篩選歸類,標準應(yīng)由數(shù)據(jù)庫的制作者按照已定主題,從內(nèi)容到形式全面、仔細考慮,取其精華,在準確的前提下再進行加工整合。這一步驟看似簡單,其實要求較高,主要考驗的是制作人員的綜合素質(zhì)和業(yè)務(wù)水平。 1.2.3信息資源的轉(zhuǎn)換。因為資源的載體不同,所以需要對資源的形式調(diào)整。例如書籍、報刊上的有用資源就需要經(jīng)過加工,轉(zhuǎn)換成數(shù)字化資源。現(xiàn)階段我們常用的主要轉(zhuǎn)換途徑有以下兩種方式:原始資源→掃描→轉(zhuǎn)變?yōu)镴PEG格式→加工軟件識別→校對;原始資源→電子照片→轉(zhuǎn)變?yōu)镴PEG格式→加工軟件識別→校對; 1.2.4將數(shù)字化的資源進行加工。著錄:字段設(shè)置應(yīng)該盡量保持與CNMARC中著錄項目要求的一致性,著錄用文字應(yīng)規(guī)范和統(tǒng)一,數(shù)據(jù)格式盡量標準化。標引:分類標引應(yīng)該與《中國圖書館圖書分類法》或者是《資料分類法》保持一致;主題標引(關(guān)鍵詞標引)應(yīng)該依據(jù)《漢語主題詞詞表》,在使用關(guān)鍵詞標引時,應(yīng)該逐步建立所用過的關(guān)鍵詞詞表,以保證今后使用關(guān)鍵詞時的一致性?! ∧壳坝幸粋€光盤版《分類主題詞表》,可以進行分類和主題分類的對照查找,使用方便,是一個不錯的標引工具。2.在數(shù)據(jù)庫建設(shè)中對圖書館資源的利用 圖書館經(jīng)過歷史的發(fā)展,積累了豐富的文獻資源,正所謂汗牛充棟、浩如煙海,這個文獻體系具有組織的科學性、知識的系統(tǒng)性,并且知識門類齊全。這就為我們制作數(shù)據(jù)庫提供了數(shù)據(jù)的可靠來源。但是,圖書館書目檢索系統(tǒng)提供給我們的只是整件文獻,而不是知識單元。這樣,我們就需要從檢索到的整件文獻中找出所需要的知識單元作為我們的數(shù)據(jù),并對這些數(shù)據(jù)進行比較、甄別和選擇。這是一項繁瑣的、精細的工作?! D書館文獻中的信息一般都具有準確性和權(quán)威性,使用它們時有較高的可信程度。圖書館強大的檢索工具可以讓我們能快、準、全地檢索到我們所需要的文獻。所以,把圖書館文獻資源作為制作數(shù)據(jù)庫時的數(shù)據(jù)可靠來源是一個明智的選擇?! ≡诶脠D書館文獻資源的同時,網(wǎng)絡(luò)信息資源也可以作為一個重要的信息來源。網(wǎng)絡(luò)信息資源日益豐富,由于沒有良好的質(zhì)量控制和管理機制,很多信息沒有經(jīng)過嚴格編輯和整理,質(zhì)量良莠不齊,其中參雜了不少的信息垃圾和信息泡沫,形成了一個紛繁復雜的信息世界。所以,我們在使用網(wǎng)上信息時,更應(yīng)該加強選擇和鑒別。同時,網(wǎng)上信息也可以作為我們查找圖書館館藏文獻的提示和索引?! ?shù)據(jù)庫建設(shè)與圖書館資源的結(jié)合使這些問題得到了合理解決,二者相互作用,相互彌補。我在制作《燕趙名人數(shù)據(jù)庫》、《燕趙十三梅數(shù)據(jù)庫》及參于《紀念抗日戰(zhàn)爭勝利60周年》和《紅色旅游》專題數(shù)據(jù)庫的過程中,主要就是依靠并利用了河北省圖書館豐富的館藏資源。3.我國數(shù)據(jù)庫建設(shè)中的不足 在文獻工作采用計算機技術(shù)、尤其是網(wǎng)絡(luò)出現(xiàn)后,世界范圍內(nèi)的數(shù)據(jù)庫制作繁榮起來。目前,世界上有許多優(yōu)秀的大型數(shù)據(jù)庫,例如:《ABI商業(yè)信息數(shù)據(jù)庫》、《LWW 電子期刊全文數(shù)據(jù)庫》、《Emerald管理評論數(shù)據(jù)庫》、《Arts %26amp; Humanities Citation Index(藝術(shù)與人文科學引文索引)》 等等。 [] [] [1] [2] [3] [] [] 雖然與發(fā)達國家相比,我國的數(shù)據(jù)庫建設(shè)在質(zhì)量和數(shù)量上還有一定的差距,但是我國的數(shù)據(jù)庫開發(fā)建設(shè)工作也取得了很大成就。如:中國學術(shù)期刊電子雜志社開發(fā)的《中國學術(shù)期刊光盤數(shù)據(jù)庫》、《中國期刊全文數(shù)據(jù)庫(CNKI)》等,特別是近年來國家從中央到地方大力支持建立了文化信息資源共享工程,制作了一批高質(zhì)量的數(shù)據(jù)庫,為我國數(shù)據(jù)庫建設(shè)的發(fā)展提供了新的契機,將我國的網(wǎng)絡(luò)文化信息資源開發(fā)與建設(shè)工作推向了一個新的階段。
數(shù)據(jù)庫 淺談 幾點 體會 數(shù)據(jù) 建設(shè)
擴展閱讀
對于經(jīng)銷商來說,基于產(chǎn)品經(jīng)銷來賺差價,目前還是主要的盈利模式。這賣產(chǎn)品是通過終端售點來實現(xiàn)的,終端數(shù)量決定了經(jīng)銷商的銷售業(yè)績,而終端質(zhì)量則是決定了經(jīng)銷商的利潤??偠灾K端售點,就是經(jīng)銷商吃飯的本錢
有幸被公司派到杭州的一個商場里實習,實習的內(nèi)容就是與市場第一線的促銷員一起進行促銷活動,在市場的第一線呆了一個多月,對促銷可以說是深有體會,對于這種體會總是有一吐為快的沖動,于是總結(jié)后寫了下來。 親
系列專題:大數(shù)據(jù)營銷 你知道“兩個月就會消失的書”嗎? 這是阿根廷一家出版商利用新型油墨出版的文集,一旦打開,文字接觸到陽光和空氣后2個月就會完全消失,這樣就可以催促那些有“拖延癥”的讀者盡快閱讀,
系列專題:企業(yè)文化建設(shè)一則關(guān)于“畢姥爺”的“不雅視頻”最近被炒的沸沸揚揚,把一向以幽默著稱的老畢推到風口浪尖上。從節(jié)目暫停到停職,再到深入調(diào)查,看來老畢以后很難以主持人身份跟觀眾朋友見面了?! ∫曨l中
中國女排在80年代獲得過“五連冠”的輝煌,“鐵榔頭”郎平也成為了中國女排的代名詞。筆者還記得那時候的年畫都曾有郎平獲獎的圖片,因為那時候百廢待興,中國女排成為了當時國人的模范和驕傲。隨后中國女排中間起
系列專題:2009中國營銷 2009年是一個極不平凡的年度,世界金融危機,H1N1流感的蔓延,給全世界帶來的壓力好像遍布了中國的大江南北,各行各業(yè),就連老百姓都知道危機來了,可想而知這場比想象當中的
版權(quán)聲明:
本網(wǎng)刊登/轉(zhuǎn)載的文章,僅代表作者個人或來源機構(gòu)觀點,不代表本站立場,本網(wǎng)不對其真?zhèn)涡载撠煛?br /> 本網(wǎng)部分文章來源于其他媒體,本網(wǎng)轉(zhuǎn)載此文只是為 網(wǎng)友免費提供更多的知識或資訊,傳播管理/培訓經(jīng)驗,不是直接以贏利為目的,版權(quán)歸作者或來源機構(gòu)所有。
如果您有任何版權(quán)方面問題或是本網(wǎng)相關(guān)內(nèi)容侵犯了您的權(quán)益,請與我們聯(lián)系,我們核實后將進行整理。