流媒體技術(shù)在數(shù)字圖書館建設(shè)過程中的應(yīng)用
數(shù)字圖書館是將有價值的圖像、文本、語言、影像、影視、軟件和科學數(shù)據(jù)庫等媒體信息進行收集,組織規(guī)范性的加工和壓縮處理,進行高質(zhì)量保存和管理,并提供在廣域網(wǎng)上高速橫向跨庫連接的電子存取服務(wù)。隨著目前傳統(tǒng)圖書館逐漸向多功能數(shù)字圖書館演變,在建設(shè)數(shù)字圖書館所涉及到有關(guān)技術(shù)中,首先是解決信息資源的數(shù)據(jù)壓縮和存儲。數(shù)字圖書館所涉及的數(shù)據(jù)類型有文本、圖像、語音、視頻等,而且所面臨的數(shù)據(jù)是海量的。這么大的數(shù)據(jù)量需要很大規(guī)模的數(shù)據(jù)庫來存儲和處理。在數(shù)字圖書館中,文本數(shù)據(jù)所占的比重并不是很大,真正大的是多媒體數(shù)據(jù)。在傳統(tǒng)圖書館中,多媒體信息主要保存在錄像帶、磁帶、CD、VCD、DVD等載體上,這些載體不僅難以長期保存,而且不便于查詢和使用,更不用說能夠在網(wǎng)絡(luò)上傳輸了。因此,必須對多媒體數(shù)據(jù)進行壓縮,使數(shù)據(jù)庫的規(guī)模保持在可管理的范圍內(nèi)。而流媒體技術(shù)的產(chǎn)生和發(fā)展正為數(shù)字圖書館建設(shè)過程中解決多媒體信息處理問題提供了一套完整而有效地解決方案。
1、流媒體技術(shù)概述
1.1 流媒體技術(shù)原理
流媒體(StreamingMedia)是隨著互聯(lián)網(wǎng)的普及而迅速流行起來的一種新技術(shù)。它是指采用流式傳輸?shù)姆绞皆贗nternet播放的媒體格式。流式傳輸方式是將音頻、視頻等多媒體信息經(jīng)過特殊的壓縮方式分成一個個壓縮包,由視頻服務(wù)器向客戶端計算機連續(xù)、實時地傳送。通過這種技術(shù)可以把聲音、圖像資料經(jīng)過計算機進行編碼整理后放到網(wǎng)絡(luò)服務(wù)器上,用戶可以一邊下載一邊收聽、收看,而不需把完整的音像資料下載到自己機器后才能使用。典型例子就是網(wǎng)上電影點播,歌曲點播,電臺電視臺的網(wǎng)上直播等。我們把流媒體技術(shù)引入圖書館的多媒體信息資源管理,正是基于易于管理、使用方便的原則。簡單來說就是:把現(xiàn)有多媒體信息資源進行編碼后變成體積相對較小的流媒體文件并放到網(wǎng)絡(luò)服務(wù)器上,讀者通過館內(nèi)的計算機進行點播式收聽、收看。
流式傳輸?shù)膶崿F(xiàn)需要緩存,因為Internet以包傳輸為基礎(chǔ)進行斷續(xù)的異步傳輸,對一個實時A/V源或存儲的A/V文件,在傳輸中它們要被分解為許多包,由于網(wǎng)絡(luò)是動態(tài)變化的,各個包選擇的路由可能不盡相同,故到達客戶端的時間延遲也就不等,甚至先發(fā)的數(shù)據(jù)包還有可能后到。為此,使用緩存系統(tǒng)來彌補延遲和抖動的影響,并保證數(shù)據(jù)包的順序正確,從而使媒體數(shù)據(jù)能連續(xù)輸出,而不是因為網(wǎng)絡(luò)暫時擁塞使播放出現(xiàn)停頓。通常高速緩存所需容量并不大,因為高速緩存使用環(huán)形鏈表結(jié)構(gòu)來存儲數(shù)據(jù):通過丟棄已經(jīng)播放的內(nèi)容,流可以重新利用空出的高速緩存空間來緩存后續(xù)尚未播放的內(nèi)容。
流式傳輸?shù)膶崿F(xiàn)需要合適的傳輸協(xié)議。在流式傳輸?shù)膶崿F(xiàn)方案中,一般采用HTTP/TCP來傳輸控制信息,而用RTP/UDP來傳輸實時聲音數(shù)據(jù)。流式傳輸?shù)倪^程一般是這樣的:用戶選擇某一流媒體服務(wù)后,Web瀏覽器與Web服務(wù)器之間使用HTTP/TCP交換控制信息,以便把需要傳輸?shù)膶崟r數(shù)據(jù)從原始信息中檢索出來;然后客戶機上的Web瀏覽器啟動A/V Helper程序,使用HTTP從Web服務(wù)器相關(guān)參數(shù)對Helper程序初始化。這些參數(shù)可能包括目錄信息、A/V數(shù)據(jù)的編碼類型或與A/V檢索相關(guān)的服務(wù)器地址。
1.2 流媒體技術(shù)的特點
(1)播放效率高:流媒體把聲音、視頻等信息由服務(wù)器將經(jīng)過特殊方式壓縮的多媒體文件打成一個個壓縮包,向用戶端連續(xù)、實時傳送。流媒體文件從服務(wù)器向客戶端進行實時播放時,用戶不必等到全部文件下載完畢,只需延時幾秒或幾十秒鐘便可在客戶機上播放,文件的其余部分由客戶端計算機在后臺繼續(xù)接收,直至播放完畢或用戶取消播放,這樣可減少用戶大量等待的時間。
(2)所需帶寬?。憾嗝襟w文件采用流媒體格式傳輸時,體積大大縮小,所以傳輸?shù)膸捯笠草^低,采用普通的Modem撥號上網(wǎng)也可以進行視頻點播。
(3)所需存儲空間少:流媒體運用了特殊的CODEC(Coder Decoder)技術(shù),與同樣的.wav文件和.avi文件相比,同樣內(nèi)容的流媒體文件,體積只有它們的5%左右。加上流媒體采用的是“邊傳輸、邊播放、邊丟棄”技術(shù),流媒體數(shù)據(jù)包達到客戶端后經(jīng)過解碼器還原出視頻信息后即丟棄,所以只需要少量的緩存,不占用太多的存儲空間。
(4)可實現(xiàn)雙向交流:流媒體服務(wù)器和客戶端流媒體播放器之間的交流是雙向的。服務(wù)器在發(fā)送數(shù)據(jù)時還在接收用戶發(fā)送來的反饋信息,在播放期間雙方一直保持聯(lián)系。
(5)版權(quán)保護:由于采用了“邊傳輸、邊播放、邊丟棄”技術(shù),媒體信息并不會存儲到客戶端的計算機上,這在一定程度上保護了信息的版權(quán)。
1.3 三種最常用的流媒體技術(shù)介紹
目前的流媒體技術(shù)主要有RealNetworks公司的RealMedia,Microsoft公司的WindowsMedia,Apple公司的QuickTime三種。
RealMedia是目前在Internet上相當流行的跨平臺的客戶/服務(wù)器結(jié)構(gòu)的多媒體應(yīng)用標準,它采用音頻/視頻流和同步回放技術(shù)來實現(xiàn)Intranet上全帶寬地提供最優(yōu)質(zhì)的多媒體,同時也能夠在Intranet上以28.8Kbps的傳輸速率提供立體聲和連續(xù)視頻。RealMedia包括三類文件:RealAudio,RealVideo及RealFlash。該軟件要求播放格式為 Mpeg-1,Mpeg-2,Avi,Mov,或通過RealProducer壓縮成RM格式,RealNetworks在2002年推出的新版播放器 Realone可以支持更多的播放格式,播放效果大為改進。
Microsoft公司的WindowsMedia能保證在各種不同帶寬環(huán)境下提供高質(zhì)量的數(shù)據(jù)流,其核心是Advanced Stream Formart(即ASF,高級流格式)。ASF是一種數(shù)據(jù)格式,音頻、視頻、圖像以及控制命令腳本等多媒體信息通過這種格式,以網(wǎng)絡(luò)數(shù)據(jù)包的形式傳輸,實現(xiàn)流式多媒體的內(nèi)容發(fā)布。它的播放器是WindowsMedia Player,是一個基于DirectShow體系結(jié)構(gòu)的多媒體播放器,也是Windows操作系統(tǒng)默認的媒體播放器。它支持包括CD音頻曲目文件、 ASF、MPEG-1、MPEG-2、WAV、AVI、MIDI、MP3等,同時可播放QuickTime文件。
Apple公司的QuickTime是數(shù)字媒體領(lǐng)域事實上的工業(yè)標準,可以通過Intranet提供實時的數(shù)字化信息流,工作流與文件回放功能,它由三個不同部分組成:QuickTime電影文件格式、Quick Time媒體抽象層以及QuickTime內(nèi)置媒體服務(wù)系統(tǒng)。QuickTime播放器主要包括瀏覽器插件和獨立的應(yīng)用程序。前者用來下載和播放媒體文件,后者用來編輯和回放媒體文件。它支持MPEG、AVI、MOV、WAV、MP3等視音頻文件,并支持格式轉(zhuǎn)換,也能很好地支持基于HTTP、RTP、 FTP等協(xié)議的在線視頻和音頻點播功能。
2、流媒體技術(shù)在數(shù)字圖書館建設(shè)過程中的應(yīng)用
在數(shù)字圖書館建設(shè)中,要將多媒體音像資料數(shù)字化并在現(xiàn)實中得到有效的應(yīng)用,必須建立一套完整的架構(gòu)。其中包括物理架構(gòu)、軟件架構(gòu)和管理架構(gòu)。其工作流程是:建立流媒體信息服務(wù)平臺、信息資源的流媒體轉(zhuǎn)化、流媒體信息發(fā)布與后臺管理
2.1 流媒體信息服務(wù)平臺構(gòu)建
數(shù)字圖書館中的流媒體信息服務(wù)平臺的網(wǎng)絡(luò)拓撲結(jié)構(gòu)可以多種多樣,而且在設(shè)計應(yīng)用系統(tǒng)時應(yīng)考慮用戶群體的因素,它決定了整個系統(tǒng)服務(wù)體系的類型、開發(fā)規(guī)模和系統(tǒng)需求。根據(jù)用戶規(guī)模,預(yù)測可能的并發(fā)數(shù)據(jù)流量,確定合適的服務(wù)器,并據(jù)此選擇相應(yīng)的系統(tǒng)方案。無論是怎樣的結(jié)構(gòu),他都應(yīng)當包含以下幾個部分:
(1)流媒體服務(wù)器
流媒體系統(tǒng)核心還在服務(wù)器。在流媒體網(wǎng)絡(luò)系統(tǒng)中,節(jié)目源、流媒體服務(wù)器和用戶終端設(shè)備是系統(tǒng)主要的應(yīng)用環(huán)節(jié)。流媒體服務(wù)器是由流服務(wù)器硬件平臺和運行其上的流服務(wù)軟件平臺配合提供流式服務(wù)。流媒體服務(wù)器對視頻/音頻碼流進行存儲、管理和分發(fā)作用。圖書館的數(shù)字化的核心在于海量的數(shù)據(jù)存儲。數(shù)據(jù)是圖書館最重要、最寶貴的資源,圖書館的數(shù)據(jù)存儲具有數(shù)據(jù)量龐大、數(shù)據(jù)增長迅速、數(shù)據(jù)類型復雜等特點。因此建設(shè)好流媒體服務(wù)器是很重要的,它要能頂?shù)米【薮髷?shù)據(jù)量。
(2)流媒體數(shù)據(jù)庫
流媒體數(shù)據(jù)庫用于存放流媒體的各種檢索信息,使客戶能快速地獲取需要的流媒體信息。根據(jù)所選擇的操作系統(tǒng)的不同,可以選用不同的數(shù)據(jù)庫系統(tǒng)。如果是 Windows操作系統(tǒng)可以選用ACCESS數(shù)據(jù)庫,如果是LINUX操作系統(tǒng)則可以使用SQL數(shù)據(jù)庫。對于大型圖書館應(yīng)當使用能力更強的數(shù)據(jù)庫系統(tǒng)。
(3)流媒體編碼工作站
通過比較各系統(tǒng)方案的壓縮效率和性能,選擇相同帶寬條件下,傳輸性能好、畫面清晰,速度流暢的解決方案。
2.2 流媒體信息智能檢索系統(tǒng)
隨著數(shù)字圖書館的建設(shè),流媒體信息資源將越來越多,如果這個系統(tǒng)只是一些信息的簡單堆積,那么他也就沒有什么實際應(yīng)用價值。當讀者通過關(guān)鍵詞或關(guān)于所需信息的描述,可以在Internet上很方便地定位相關(guān)信息源。毫無疑問,流媒體信息中也包含有合適檢索的信息,用戶能據(jù)此找到他所感興趣的內(nèi)容。通過開發(fā)高效的流媒體信息檢索系統(tǒng),對于流媒體信息檢索系統(tǒng)應(yīng)當包含視頻分析、視頻索引、視頻匹配三個部分。
從視頻中抽取關(guān)鍵幀,并分析其中的內(nèi)容特征來作為索引。在此基礎(chǔ)上通過關(guān)鍵幀類聚和結(jié)構(gòu)化,提供對視頻內(nèi)容的摘要和內(nèi)容瀏覽。最后,結(jié)合相關(guān)反饋和語義模板檢索,實現(xiàn)關(guān)鍵幀語義查詢。通過相關(guān)反饋的學習,系統(tǒng)可以自己改進語義模板庫,使檢索的準確率越來越高。結(jié)合一些傳統(tǒng)的檢索方式,使讀者能夠更加有效地檢索和瀏覽流媒體信息。
2.3 流媒體信息后臺管理與支持
數(shù)字圖書館所要面對的流媒體信息是海量的,要將如此龐大的信息源有效地組織起來,并能為讀者服務(wù),必須擁有良好的信息服務(wù)系統(tǒng)。該信息服務(wù)系統(tǒng)應(yīng)當包括信息處理、信息發(fā)布和信息維護。
(1)信息處理:信息處理是將傳統(tǒng)圖書館原有的多媒體信息轉(zhuǎn)化為流媒體信息。原有的多媒體信息主要保存在錄像、磁帶、CD、VCD、DVD等載體上,需要通過視頻、音頻工作站將其轉(zhuǎn)化為流媒體信息。這些工作站應(yīng)當配有視頻、音頻采集卡。采集設(shè)備包括電視攝像機、立體聲錄音機、VCD、DVD、錄像機等。
(2)信息發(fā)布:信息發(fā)布是將處理好的流媒體信息發(fā)布到數(shù)字圖書館信息平臺上。根據(jù)館藏量的大小和讀者的多少,相應(yīng)采用合適的信息發(fā)布平臺和數(shù)據(jù)庫系統(tǒng)。在館藏量和讀者群不大的情況下,可以使用成本相對較低的ASP+ACCESS系統(tǒng)。對于大型圖書館,應(yīng)當使用穩(wěn)定性更好、檢索能力更強的UNIX系統(tǒng)。
(3)信息維護:信息維護是流媒體信息能夠在數(shù)字圖書館中得到有效應(yīng)用的保證。流媒體信息的文件大小、數(shù)據(jù)結(jié)構(gòu)較其他媒體復雜許多。要保證流媒體信息能夠在數(shù)字圖書館中得到有效的應(yīng)用,必須配備專門的管理人員對數(shù)據(jù)和系統(tǒng)進行監(jiān)控和維護。作好對流媒體信息的歸檔和做索引的工作。
【參考文獻】
[1] 卡德森,鄭朝陽.《基于流媒體技術(shù)的幾種應(yīng)用方式》.有限電視技術(shù),2003,(2):16-22.
[2] 秦建寧,苗喜德編著.《圖書館現(xiàn)代技術(shù)應(yīng)用教程》.西南交通大學出版社,2003.
[3] 黃晁等.《智能流媒體視頻服務(wù)系統(tǒng)》.計算機工程與應(yīng)用,2002,(9):1-4.