《數(shù)字媒體及應(yīng)用》PPT課件.ppt
《《數(shù)字媒體及應(yīng)用》PPT課件.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《數(shù)字媒體及應(yīng)用》PPT課件.ppt(100頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
第五章數(shù)字媒體及應(yīng)用,,1、簡(jiǎn)單文本(純文本)2、豐富格式文本3、超文本,5.1文本的分類與表示,簡(jiǎn)單文本(plaintext):是由一連串用于表達(dá)正文內(nèi)容的字符(包括漢字)的編碼所組成,它幾乎不包含任何其他的格式信息和結(jié)構(gòu)信息。這種文本通常稱為純文本或ASCII文本,在PC機(jī)中的文件后綴名是.txt特性:呈現(xiàn)為一種線性結(jié)構(gòu),以行、字為單位,順序?qū)懽髋c閱讀是最通用的文本文件格式,文件體積小,閱讀不受限制,幾乎所有的文字處理軟件都能識(shí)別和處理,不能插入圖片、表格等,不能建立超鏈接,1、簡(jiǎn)單文本(純文本),5.1.3文本的分類與表示,,1、簡(jiǎn)單文本(純文本)2、豐富格式文本3、超文本,5.1.3文本的分類與表示,豐富格式文本:經(jīng)過(guò)排版處理后,純文本中就增加了許多格式控制和機(jī)構(gòu)說(shuō)明信息,這樣的文本就稱為“豐富格式文本”。RTF格式:為了便于豐富格式文本能在不同的軟件和系統(tǒng)中互換使用,提出的一種公用中間格式。多媒體文檔(MultimediaDocument):含有聲音和視頻信息的文本。,2、豐富格式文本,5.1.3文本的分類與表示,,1、簡(jiǎn)單文本(純文本)2、豐富格式文本3、超文本,5.1.3文本的分類與表示,線性文本:其內(nèi)容組織是線性的,讀者總是按照順序閱讀的文本結(jié)構(gòu)。超文本:采用網(wǎng)狀結(jié)構(gòu)來(lái)組織信息,文本中的各個(gè)部分按照其內(nèi)容的關(guān)系互相鏈接。超文本(hypertext)的閱讀方式傳統(tǒng)的順序式閱讀通過(guò)鏈接、跳轉(zhuǎn)、導(dǎo)航、回溯等操作實(shí)現(xiàn)跳躍式閱讀,3、超文本,5.1.3文本的分類與表示,超文本結(jié)構(gòu),超鏈(hyperlink)-有向的鏈源:超鏈的起點(diǎn)位置,可以是文本塊中一個(gè)標(biāo)題、句子、圖標(biāo)等鏈宿:超鏈的目的地,可是另一個(gè)文本塊,也可是同一文本塊中的其他部分。,5.1.3文本的分類與表示,超媒體(Hypermedia):以上所說(shuō)的文本塊可以是文字,也可是圖形、圖像甚至聲音或視頻,就把超文本推廣到了多媒體形式,有時(shí)也稱為“超媒體”超文本的應(yīng)用Windows等一些軟件中的“幫助”文件使用瀏覽器從Web服務(wù)器上下載的網(wǎng)頁(yè)(html或htm文件),5.1.3文本的分類與表示,5.1.4文本編輯、排版與處理,1、文本編輯2、文本處理3、常用文本處理軟件,文本編輯的主要功能對(duì)字、詞、句、段落進(jìn)行添加、刪除、修改等操作字的處理:設(shè)置字體、字號(hào)、字的排列方向、間距、顏色、效果等段落的處理:設(shè)置行距、段間距、段縮進(jìn)、對(duì)稱方式等表格制作和繪圖定義超鏈頁(yè)面布局:設(shè)置頁(yè)邊距、每頁(yè)行列數(shù)、分欄、頁(yè)眉、頁(yè)腳等“所見(jiàn)即所得”:一方面所有的編輯操作效果立即可以在屏幕上看到,另一方面在屏幕上看到的效果與打印機(jī)的輸出結(jié)果相同。,1、文本編輯,5.1.4文本編輯、排版與處理,1、文本編輯2、文本處理3、常用文本處理軟件,5.1.4文本編輯、排版與處理,文本處理內(nèi)容:字?jǐn)?shù)統(tǒng)計(jì),字頻統(tǒng)計(jì),簡(jiǎn)/繁體相互轉(zhuǎn)換,漢字/拼音相互轉(zhuǎn)換詞語(yǔ)排序,詞語(yǔ)錯(cuò)誤檢測(cè),文句語(yǔ)法檢查自動(dòng)分詞,詞頻統(tǒng)計(jì),詞性標(biāo)注,詞義辨識(shí),大陸/臺(tái)灣術(shù)語(yǔ)轉(zhuǎn)換文本壓縮,文本加密,文本著作權(quán)保護(hù)關(guān)鍵詞提取,文摘自動(dòng)生成,文本分類文本檢索(關(guān)鍵詞檢索、全文檢索),文本過(guò)濾文語(yǔ)轉(zhuǎn)換(語(yǔ)音合成),文種轉(zhuǎn)換(機(jī)器翻譯)篇章理解,自動(dòng)問(wèn)答,自動(dòng)寫作等,2、文本處理,5.1.4文本編輯、排版與處理,1、文本編輯2、文本處理3、常用文本處理軟件,5.1.4文本編輯、排版與處理,(1)面向通信的文本處理軟件計(jì)算機(jī)網(wǎng)絡(luò)上最普及的應(yīng)用是用電子郵件進(jìn)行通信。大多數(shù)情況下電子郵件正文的內(nèi)容一般都是簡(jiǎn)單文本,因此電子郵件內(nèi)嵌的文本編輯器功能比較簡(jiǎn)單,操作使用方便。典型軟件:微軟公司的OutlookExpress,具有文字的增、刪、改以及字體、字號(hào)的設(shè)置功能,也可以設(shè)定一些簡(jiǎn)單的格式和插入一些圖片。當(dāng)然郵件所帶的附件并不受此限制。,3、常用文本處理軟件,5.1.4文本編輯、排版與處理,(2)面向辦公的文本處理軟件功能要求:文本制作的高效率、高質(zhì)量軟件面向非專業(yè)用戶,易學(xué)好用文本處理能力,既功能豐富,又操作簡(jiǎn)單排版功能典型軟件:MS-OfficeWPS2000,5.1.4文本編輯、排版與處理,(3)面向出版的文本處理軟件排版軟件的主要功能:將文字、圖形和圖像等合理地安排在頁(yè)面內(nèi)典型排版軟件:方正集團(tuán)公司的“飛騰”排版軟件美國(guó)Adobe公司的PageMaker和PDFWriter,5.1.4文本編輯、排版與處理,(4)面向網(wǎng)絡(luò)信息發(fā)布和電子出版的文本處理軟件面向電子出版的軟件美國(guó)Adobe公司的AcrobatPDF格式文件將文字、字型、格式、顏色、圖形、圖像、超文本鏈接、聲音和視頻等信息都封裝在一個(gè)文件中,不僅適合于網(wǎng)絡(luò)和電子出版,也適合于印刷出版,實(shí)現(xiàn)紙張印刷和網(wǎng)絡(luò)出版的統(tǒng)一。,5.1.4文本編輯、排版與處理,文本輸出:在屏幕上進(jìn)行閱讀、瀏覽打印輸出等操作。文本展現(xiàn)過(guò)程:首先要對(duì)文本的格式描述進(jìn)行解釋,然后生成文字和圖、表的映像(bitmap),最后再傳送到顯示器或打印機(jī)輸出。文本閱讀器:承擔(dān)上述文本輸出任務(wù)的軟件,也稱為瀏覽器。它們可以嵌入在文本處理軟件中,如微軟的Word,也可以是獨(dú)立的軟件,如Adobe公司的AcrobatReader,微軟公司的IE等。,5.1.5文本的展現(xiàn),第五章數(shù)字媒體及應(yīng)用,5.1文本與文本處理5.2圖像與圖形5.3數(shù)字聲音及應(yīng)用5.4數(shù)字視頻及應(yīng)用,5.2圖像與圖形,本節(jié)重點(diǎn):圖像的數(shù)字化圖像的表示方法圖像的屬性信息圖像的壓縮編碼常用圖像文件格式數(shù)字圖像處理計(jì)算機(jī)合成圖像的應(yīng)用,從現(xiàn)實(shí)世界中通過(guò)數(shù)字化設(shè)備獲取的圖像,稱為:取樣圖像、也稱點(diǎn)陣圖像、位圖圖像——簡(jiǎn)稱圖像。計(jì)算機(jī)合成的圖像(syntheticimage),稱為:矢量圖形(vectorgraphics),簡(jiǎn)稱圖形(graphics),數(shù)字圖像按生成方法分類:,5.2圖像與圖形,圖像的獲?。簭默F(xiàn)實(shí)世界中獲得數(shù)字圖像的過(guò)程圖像獲取的過(guò)程實(shí)質(zhì)上是模擬信號(hào)的數(shù)字化過(guò)程,它的處理步驟:掃描分色取樣量化,1、圖像的數(shù)字化,5.2.1數(shù)字圖像的獲取,圖像的數(shù)字化過(guò)程,,注:通過(guò)上述方法所獲取的數(shù)字圖像稱為取樣圖像,它是靜止圖像的數(shù)字化表示形式,通常簡(jiǎn)稱為”圖像“。,5.2.1數(shù)字圖像的獲取,設(shè)備:圖像獲取所使用的設(shè)備通稱為圖像獲取設(shè)備設(shè)備的功能:將現(xiàn)實(shí)的景物輸入到計(jì)算機(jī)內(nèi)并以取樣圖像的形式表示例:2D圖像獲取設(shè)備(如掃描儀、數(shù)碼相機(jī)等)只能對(duì)圖片或景物的2D投影進(jìn)行數(shù)字化3D掃描儀能獲取包括深度信息在內(nèi)的3D景物的信息,2、數(shù)字圖像獲取設(shè)備,5.2.1數(shù)字圖像的獲取,從取樣圖像的獲取過(guò)程可以知道,一幅取樣圖像由M(列)*N(行)個(gè)取樣點(diǎn)組成,每個(gè)取樣點(diǎn)是組成取樣圖像的基本單位,稱為像素(pictureelement,簡(jiǎn)寫為pel)。彩色圖像的像素是矢量,它由3個(gè)彩色分量組成,灰色圖像的像素只有1個(gè)亮度分量。,1、圖像的表示方法與主要參數(shù),5.2.2圖像的表示與壓縮編碼,彩色圖像的表示,230,227,220,220,226,229,231,233,229,224,220,219,223,226,233,240,225,222,215,214,220,221,224,225,227,223,218,216,217,219,225,225,183,187,182,177,174,175,175,168,188,180,168,156,162,158,153,147,178,177,158,156,166,159,154,150,176,175,151,150,170,159,156,155,,,,,,,,,,,,,,,,,,,217,210,197,202,220,233,231,228,220,213,196,197,214,224,227,224,210,207,194,198,210,212,212,211,218,207,196,192,202,215,210,212,225,216,197,193,196,208,203,208,224,217,189,181,184,178,175,174,231,223,200,177,180,175,178,179,226,216,205,176,176,176,176,178,,,,,,,,,,,,,,,,,,,220,212,206,200,225,230,230,228,230,216,200,197,214,226,225,222,238,214,192,194,210,213,214,217,234,212,195,192,202,218,214,211,237,220,205,198,198,218,215,219,235,229,207,194,191,190,185,182,233,239,217,192,188,179,184,182,231,225,220,190,190,187,177,180,,,,,,,,,,,,,,,,,,,紅色分量,綠色分量,藍(lán)色分量,,,5.2.2圖像的表示與壓縮編碼,取樣圖像在計(jì)算機(jī)中的表示方法:灰色圖像用一個(gè)矩陣來(lái)表示彩色圖像用一組(一般是3個(gè))矩陣來(lái)表示,矩陣的行數(shù)稱為圖像的垂直分辨率,列數(shù)稱為圖像的水平分辨率,矩陣中的元素是像素顏色分量的亮度值,使用整數(shù)表示,一般是8位至12位,5.2.2圖像的表示與壓縮編碼,圖像的屬性信息圖像大小,也稱圖像分辨率(垂直分辨率*水平分辨率)顏色空間的類型,指彩色圖像所使用的顏色描述方法,也叫顏色模型。常用顏色模型:RGB(紅、綠、藍(lán))、CMYK(青、品紅、黃、黑)、HSV(色彩、飽和度、亮度)、YUV(亮度、色度)等像素深度,即像素的所有顏色分量的二進(jìn)制位數(shù)之和,它決定了不同顏色(亮度)的最大數(shù)目。,5.2.2圖像的表示與壓縮編碼,練習(xí):,某一彩色圖像有R、G、B三基色組成,若三個(gè)分量的像素位數(shù)分別為2,4,8,則該圖像的像素深度為?最大顏色數(shù)目為?,一幅圖像的數(shù)據(jù)量可按下面的公式進(jìn)行計(jì)算(以字節(jié)為單位):圖像數(shù)據(jù)量=圖像水平分辨率圖像垂直分辨率像素深度/8幾種常用圖像的數(shù)據(jù)量,2、圖像的壓縮編碼,從表中可看出,即使是單幅(靜止的)數(shù)字圖像,其數(shù)據(jù)量也很大。,5.2.2圖像的表示與壓縮編碼,圖像數(shù)據(jù)壓縮的可能性:由于數(shù)字圖像中的數(shù)據(jù)相關(guān)性很強(qiáng),數(shù)據(jù)的冗余度很大,因此對(duì)數(shù)字圖像進(jìn)行大幅度的數(shù)據(jù)壓縮是完全可能的。而且,人眼的視覺(jué)有一定的局限性,即使壓縮前后的圖像有一定失真,只要限制在人眼允許的誤差范圍之內(nèi),也是允許的。,5.2.2圖像的表示與壓縮編碼,數(shù)據(jù)壓縮類型無(wú)損壓縮:壓縮以后的數(shù)據(jù)進(jìn)行圖像還原(也稱為解壓縮)時(shí),重建的圖像與原始圖像完全相同例如:行程長(zhǎng)度編碼(RLE)、哈夫曼(Huffman)編碼有損壓縮:使用壓縮后的數(shù)據(jù)進(jìn)行圖像重建時(shí),重建后的圖像與原始圖像雖有一定的誤差,但不影響人們對(duì)圖像含義的正確理解。如變換編碼、矢量編碼等,5.2.2圖像的表示與壓縮編碼,圖像壓縮方法很多,不同方法適用于不同的應(yīng)用,在計(jì)算機(jī)中常常是多種壓縮方法的綜合使用。為得到較高的數(shù)據(jù)壓縮比,一般都采用有損壓縮。壓縮編碼方法優(yōu)劣的評(píng)價(jià)壓縮倍數(shù)的大小重建圖像的質(zhì)量(有損壓縮時(shí))壓縮算法的復(fù)雜程度,5.2.2圖像的表示與壓縮編碼,圖像壓縮編碼方法的國(guó)際標(biāo)準(zhǔn)和工業(yè)標(biāo)準(zhǔn):ISO和IEC兩個(gè)國(guó)際機(jī)構(gòu)聯(lián)合組成了一個(gè)專家組,制定了一個(gè)靜止圖像數(shù)據(jù)壓縮編碼的國(guó)際標(biāo)準(zhǔn),稱為JPEG標(biāo)準(zhǔn)。JPEG標(biāo)準(zhǔn)的特點(diǎn):適用范圍廣、能處理各種連續(xù)色調(diào)的彩色或灰度圖像、算法復(fù)雜度適中、既可用硬件實(shí)現(xiàn),也可用軟件實(shí)現(xiàn)圖像的壓縮比可控制(壓縮比越低,圖像質(zhì)量越好;壓縮比越高,圖像質(zhì)量越差),5.2.2圖像的表示與壓縮編碼,3、常用圖像文件格式,5.2.2圖像的表示與壓縮編碼,BMP圖像:微軟公司在Windows操作系統(tǒng)下使用的一種標(biāo)準(zhǔn)圖像文件格式,一個(gè)文件存放一幅圖像,可以使用行程長(zhǎng)度編碼(RLE)進(jìn)行無(wú)損壓縮,也可不壓縮。不壓縮的BMP文件是一種通用的圖像文件格式,幾乎所有Windows應(yīng)用軟件都能支持。,5.2.2圖像的表示與壓縮編碼,TIFF(TaggedImageFileFormat)圖像文件格式:用于掃描儀和桌面出版,能支持多種壓縮方法和多種不同類型的圖像,有許多應(yīng)用軟件支持這種文件格式。,5.2.2圖像的表示與壓縮編碼,GIF:互聯(lián)網(wǎng)上廣泛使用的一種圖像文件格式,它的顏色數(shù)目較少(不超過(guò)256色),文件特別小,適合網(wǎng)絡(luò)傳輸。由于顏色數(shù)目有限,GIF適用于插圖、剪貼畫等色彩數(shù)目不多的應(yīng)用場(chǎng)合。GIF格式能夠支持透明背景,具有在屏幕上漸進(jìn)顯示的功能。尤為突出的是,它可以將許多張圖像保存在同一個(gè)文件中,顯示時(shí)按預(yù)先規(guī)定的時(shí)間間隔逐一進(jìn)行顯示,從而形成動(dòng)畫的效果,因而在網(wǎng)頁(yè)制作中大量使用。,5.2.2圖像的表示與壓縮編碼,5.2.3數(shù)字圖像處理與應(yīng)用,1、數(shù)字圖像處理數(shù)字圖像處理:使用計(jì)算機(jī)對(duì)來(lái)自照相機(jī)、攝像機(jī)、傳真機(jī)、掃描儀、醫(yī)用CT機(jī)、X光機(jī)等的圖像,進(jìn)行去噪、增強(qiáng)、復(fù)原、分割、提取特征、壓縮、存儲(chǔ)、檢索等操作處理,對(duì)圖像進(jìn)行處理的主要目的提高圖像的視感質(zhì)量圖像復(fù)原與重建圖像分析圖像數(shù)據(jù)的變換、編碼和數(shù)據(jù)壓縮,用以更有效地進(jìn)行圖像的存儲(chǔ)和傳輸圖像的存儲(chǔ)、管理、檢索,以及圖像內(nèi)容與知識(shí)產(chǎn)權(quán)的保護(hù),5.2.3數(shù)字圖像處理與應(yīng)用,與應(yīng)用領(lǐng)域密切相關(guān),通常具有很強(qiáng)的專業(yè)性,如遙感圖像處理軟件、醫(yī)學(xué)圖像處理軟件等。使用較多的是面向辦公、出版與信息發(fā)布的圖像處理軟件,也稱為圖像修飾(imageretouching)或圖像編輯軟件,支持多種不同的圖像文件格式,提供多種圖像編輯處理功能,可制作出生動(dòng)形象的圖像。如美國(guó)Adobe公司的PhotoShop,它集圖像掃描、圖像編輯、繪圖、圖像合成及圖像輸出等多種功能于一體,是一個(gè)流行的圖像處理工具。,2、圖像處理軟件,5.2.3數(shù)字圖像處理與應(yīng)用,圖像的顯示控制圖像區(qū)域的選擇圖像的編輯操作圖像的濾鏡操作繪圖功能文字編輯功能圖層操作,PhotoShop的主要功能包括,5.2.3數(shù)字圖像處理與應(yīng)用,圖像通信遙感醫(yī)療診斷工業(yè)生產(chǎn)中的應(yīng)用機(jī)器人視覺(jué)軍事、公安、檔案管理,3、數(shù)字圖像的應(yīng)用,5.2.3數(shù)字圖像處理與應(yīng)用,景物的模型(model):景物在計(jì)算機(jī)內(nèi)的描述景物的建模(modeling):人們進(jìn)行景物描述的過(guò)程繪制(rendering):也稱圖像合成(imagesynthesis),根據(jù)景物的模型生成圖像的過(guò)程,所產(chǎn)生的數(shù)字圖像稱為計(jì)算機(jī)合成圖像計(jì)算機(jī)圖形學(xué)(ComputerGraphics):研究如何使用計(jì)算機(jī)描述景物并生成其圖像的原理、方法與技術(shù),1、景物形狀的計(jì)算機(jī)表示,5.2.4計(jì)算機(jī)圖形,幾何模型:景物建模的方法與景物的類型有關(guān)。普通工業(yè)產(chǎn)品(如電視機(jī)、電話機(jī)、汽車、飛機(jī)等),使用基本的幾何元素(如點(diǎn)、線、面、體等)及表面材料的性質(zhì)等進(jìn)行描述所建立的模型幾何模型應(yīng)用:工業(yè)產(chǎn)品的計(jì)算機(jī)輔助設(shè)計(jì)/制造過(guò)程模型/算法模型:根據(jù)景物的生成規(guī)律,并使用相應(yīng)的算法來(lái)描述其規(guī)律所建立的模型,5.2.4計(jì)算機(jī)圖形,使用計(jì)算機(jī)合成圖像的主要優(yōu)點(diǎn):能生成實(shí)際存在的具體景物的圖像,還能生成假想或抽象景物的圖像能生成靜止圖像,還能生成各種運(yùn)動(dòng)、變化的動(dòng)態(tài)圖像,2、計(jì)算機(jī)合成圖像的繪制,5.2.4計(jì)算機(jī)圖形,3、計(jì)算機(jī)合成圖像的應(yīng)用,計(jì)算機(jī)合成圖像的應(yīng)用:計(jì)算機(jī)輔助設(shè)計(jì)和輔助制造(CAD/CAM)利用計(jì)算機(jī)生成各種地形圖、交通圖、天氣圖、海洋圖、石油開(kāi)采圖等作戰(zhàn)指揮和軍事訓(xùn)練計(jì)算機(jī)動(dòng)畫和計(jì)算機(jī)藝術(shù)其他:電子出版、數(shù)據(jù)處理、工業(yè)監(jiān)控、輔助教學(xué)(CAI)、軟件工程等,5.2.4計(jì)算機(jī)圖形,矢量圖形:計(jì)算機(jī)合成圖像矢量繪圖軟件:制作矢量圖形的軟件如:AutoCAD、MAPInfo、ARCInfo等2D的矢量繪圖軟件:Corel公司的CorelDrawAdobe公司的IllustratorMacromedia公司的FreeHand微軟公司的MicrosoftVisio微軟公司Office辦公套件中的Word和PowerPoint,4、矢量繪圖軟件,5.2.4計(jì)算機(jī)圖形,第五章數(shù)字媒體及應(yīng)用,5.1文本與文本處理5.2圖像與圖形5.3數(shù)字聲音及應(yīng)用5.4數(shù)字視頻及應(yīng)用,5.3數(shù)字聲音及應(yīng)用,本節(jié)重點(diǎn):聲音信號(hào)數(shù)字化的過(guò)程波形聲音的獲取設(shè)備波形聲音的主要參數(shù)第2代全頻帶聲音壓縮編碼標(biāo)準(zhǔn)計(jì)算機(jī)合成聲音,5.3數(shù)字聲音及應(yīng)用,數(shù)字聲音是一種在時(shí)間上連續(xù)的媒體,數(shù)據(jù)量大,對(duì)存儲(chǔ)和傳輸?shù)囊蟊容^高。,5.3.1波形聲音的獲取與播放,1、聲音信號(hào)的數(shù)字化聲音:由振動(dòng)而產(chǎn)生,通過(guò)空氣進(jìn)行傳播。它由許多不同頻率的諧波所組成,諧波的頻率范圍稱為聲音的帶寬(bandwidth),帶寬是聲音的一項(xiàng)重要參數(shù)。,多媒體技術(shù)處理的聲音信號(hào)主要是人耳可聽(tīng)到的20~20kHz的音頻信號(hào)(audio)言語(yǔ)(speech)/語(yǔ)音:人說(shuō)話的聲音,其頻率范圍約為300~3400Hz全頻帶聲音:音樂(lè)聲、風(fēng)雨聲、汽車聲等其他聲音,其帶寬可達(dá)到20~20kHz,5.3.1波形聲音的獲取與播放,聲音信號(hào)的數(shù)字化:將模擬聲音信號(hào)轉(zhuǎn)換成二進(jìn)制數(shù)字編碼形式以便于計(jì)算機(jī)進(jìn)行處理的過(guò)程聲音信號(hào)數(shù)字化的過(guò)程:取樣量化編碼,模擬聲音信號(hào),,取樣,,量化,,編碼,,數(shù)字聲音,011010011101……,5.3.1波形聲音的獲取與播放,模擬的聲音信號(hào)轉(zhuǎn)變成數(shù)字形式進(jìn)行處理的優(yōu)點(diǎn):以數(shù)字形式存儲(chǔ)的聲音重放性能好,復(fù)制時(shí)沒(méi)有失真數(shù)字聲音的可編輯性強(qiáng),易于進(jìn)行效果處理數(shù)字聲音能進(jìn)行數(shù)據(jù)壓縮,傳輸時(shí)抗干擾能力強(qiáng)數(shù)字聲音容易與其他媒體相互結(jié)合(集成)數(shù)字聲音為自動(dòng)提取“元數(shù)據(jù)”和實(shí)現(xiàn)基于內(nèi)容的檢索創(chuàng)造了條件,5.3.1波形聲音的獲取與播放,麥克風(fēng):將聲波轉(zhuǎn)換為電信號(hào),然后由聲卡進(jìn)行數(shù)字化聲卡(soundcard):進(jìn)行數(shù)字化,主要功能包括:波形聲音的獲取與數(shù)字化:把模擬的聲音信號(hào)轉(zhuǎn)換為數(shù)字形式。波形聲音的重建與播放MIDI(MusicalInstrumentDigitalInterface)聲音的輸入MIDI聲音的合成與播放,2、波形聲音的獲取設(shè)備,5.3.1波形聲音的獲取與播放,聲卡組成與工作原理原理:聲卡以數(shù)字信號(hào)處理器(DSP)為核心,DSP在完成數(shù)字聲音的編碼、解碼及聲音編輯操作中起著重要的作用。它利用PCI總線與主機(jī)進(jìn)行數(shù)據(jù)交換,混音器(mixer)的將不同的聲音信號(hào)進(jìn)行混音,并提供音量控制功能。(圖)PC機(jī)的聲卡較多的已經(jīng)與主板集成在一起,不再做成獨(dú)立的插卡。利用聲卡可在線(on-line)獲取聲音;使用數(shù)碼錄音筆可離線(off-line)獲取聲音,然后再通過(guò)USB接口直接將已經(jīng)數(shù)字化的聲音數(shù)據(jù)送入計(jì)算機(jī)中。,5.3.1波形聲音的獲取與播放,聲音播放:計(jì)算機(jī)輸出聲音的過(guò)程,通常為兩步:1、聲音重建:把聲音從數(shù)字形式轉(zhuǎn)換成模擬信號(hào)形式,也由聲卡完成。(圖)解碼:把壓縮編碼的數(shù)字聲音恢復(fù)為壓縮編碼前的狀態(tài)數(shù)模轉(zhuǎn)換:把聲音樣本以數(shù)字量轉(zhuǎn)換為模擬量。插值處理:通過(guò)插值把時(shí)間上離散的一組樣本轉(zhuǎn)換成在時(shí)間上連續(xù)的模擬聲音信號(hào)。2、將模擬聲音信號(hào)經(jīng)過(guò)處理和放大送到揚(yáng)聲器發(fā)出聲音,3、聲音的播放,聲音的重建由什么完成的?,5.3.1波形聲音的獲取與播放,數(shù)字聲音,,解碼,,數(shù)模轉(zhuǎn)換,,插值,,重建的模擬聲音信號(hào),011010011101……,波形聲音的重建,5.3.1波形聲音的獲取與播放,5.3.2波形聲音的表示與壓縮編碼,1、波形聲音的主要參數(shù)取樣頻率量化位數(shù)聲道數(shù)目使用的壓縮編碼方法數(shù)碼率(bitrate):指的是每秒鐘的數(shù)據(jù)量,也稱比特率、碼率數(shù)字聲音未壓縮前,其計(jì)算公式為:波形聲音的碼率=取樣頻率量化位數(shù)聲道數(shù)壓縮編碼以后的碼率=壓縮前的碼率/壓縮倍數(shù),幾種常見(jiàn)數(shù)字聲音的主要參數(shù),5.3.2波形聲音的表示與壓縮編碼,第2代全頻帶聲音壓縮編碼標(biāo)準(zhǔn),5.3.2波形聲音的表示與壓縮編碼,MPEG-1聲音壓縮編碼是國(guó)際上第一個(gè)高保真聲音數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn),它分為三個(gè)層次:層1(Layer1):編碼簡(jiǎn)單,用于數(shù)字盒式錄音磁帶層2(Layer2):算法復(fù)雜度中等,用于數(shù)字音頻廣播(DAB)和VCD等層3(Layer3):編碼復(fù)雜,用于互聯(lián)網(wǎng)上的高質(zhì)量聲音的傳輸。如MP3音樂(lè)——一種采用MPEG-1層3編碼的高質(zhì)量數(shù)字音樂(lè),它能以10倍左右的壓縮比降低高保真數(shù)字聲音的存儲(chǔ)量。,5.3.2波形聲音的表示與壓縮編碼,杜比數(shù)字AC-3(DolbyDigitalAC-3):美國(guó)杜比公司開(kāi)發(fā)的多聲道全頻帶聲音編碼系統(tǒng),它提供的環(huán)繞立體聲系統(tǒng)由5個(gè)或7個(gè)全頻帶聲道加一個(gè)超低音聲道組成,所有聲道的信息在制作和還原過(guò)程中全部數(shù)字化,信息損失很少,細(xì)節(jié)豐富,具有真正的立體聲效果,在數(shù)字電視、DVD和家庭影院中廣泛使用。,5.3.2波形聲音的表示與壓縮編碼,流媒體:一方面要求數(shù)字聲音壓縮后數(shù)據(jù)量要小,另一方面還要使聲音數(shù)據(jù)的組織適合于流式傳輸。聲音流媒體產(chǎn)品RealNetworks公司的RA(RealAudio)數(shù)字音頻微軟公司的WMA(WindowsMediaAudio)數(shù)字音頻蘋果公司的QuickTime,5.3.2波形聲音的表示與壓縮編碼,語(yǔ)音:空氣通過(guò)聲道引起聲門振動(dòng)產(chǎn)生語(yǔ)音帶寬只有300~3400Hz壓縮方法:采用波形編碼(基于感覺(jué)模型的壓縮方法)PCM(脈沖編碼)和ADPCM(自適應(yīng)差分脈沖編碼)特點(diǎn):碼率較高(64kb/s、32kb/s)、語(yǔ)音質(zhì)量高、算法簡(jiǎn)單、易實(shí)現(xiàn)應(yīng)用:固定電話通信系統(tǒng)、多媒體文檔,3、數(shù)字語(yǔ)音的壓縮編碼,5.3.2波形聲音的表示與壓縮編碼,5.3.3波形聲音的編輯,聲音編輯軟件的功能錄制聲音編輯聲音聲音的效果處理格式轉(zhuǎn)換播放聲音,5.3.4計(jì)算機(jī)合成聲音,計(jì)算機(jī)合成聲音,,語(yǔ)音合成,音樂(lè)合成,語(yǔ)音合成(Speechsynthesis):根據(jù)語(yǔ)言學(xué)和自然語(yǔ)言理解的知識(shí),使計(jì)算機(jī)模仿人把一段文字朗讀出來(lái),這個(gè)過(guò)程稱為文語(yǔ)轉(zhuǎn)換(Text-To-Speech,簡(jiǎn)稱TTS)。計(jì)算機(jī)合成語(yǔ)音的應(yīng)用:股票交易、航班動(dòng)態(tài)查詢、電話報(bào)稅等業(yè)務(wù)有聲E-mail服務(wù)CAI課件或游戲解說(shuō)詞的自動(dòng)配音文稿校對(duì)、語(yǔ)言學(xué)習(xí)、語(yǔ)音秘書、自動(dòng)報(bào)警、殘疾人服務(wù)等,5.3.4計(jì)算機(jī)合成聲音,音樂(lè)合成音樂(lè)是使用樂(lè)器演奏而成的音源:也稱為音樂(lè)合成器(musicsynthesizer),它能模仿許多樂(lè)器生成各種不同音色的音符。PC機(jī)的聲卡一般都帶有音源樂(lè)譜在計(jì)算機(jī)中采用一種叫MIDI的音樂(lè)描述語(yǔ)言來(lái)表示MIDI是樂(lè)譜的數(shù)字表示方法,使用MIDI描述的音樂(lè)稱為MIDI音樂(lè)一首樂(lè)曲對(duì)應(yīng)一個(gè)MIDI文件,其文件擴(kuò)展名為.MID,5.3.4計(jì)算機(jī)合成聲音,MIDI文件在Windows系統(tǒng)中可以使用媒體播放器進(jìn)行播放。播放MIDI音樂(lè)的過(guò)程(圖):媒體播放器軟件從磁盤上讀入MID文件把其中的一個(gè)個(gè)MIDI消息發(fā)送給聲卡上的音樂(lè)合成器由音樂(lè)合成器解釋并執(zhí)行MIDI消息所規(guī)定的操作合成出各種音色的音符,通過(guò)揚(yáng)聲器播放出樂(lè)曲來(lái),5.3.4計(jì)算機(jī)合成聲音,MIDI音樂(lè)的播放:,5.3.4計(jì)算機(jī)合成聲音,MIDI音樂(lè)與高保真的波形聲音相比:缺點(diǎn):音質(zhì)方面較差無(wú)法合成出所有各種不同的聲音(例如語(yǔ)音)優(yōu)點(diǎn):數(shù)據(jù)量很少(比CD-DA少3個(gè)數(shù)量級(jí),比MP3少2個(gè)數(shù)量級(jí))易于編輯修改可以與波形聲音同時(shí)播放,5.3.4計(jì)算機(jī)合成聲音,第五章數(shù)字媒體及應(yīng)用,5.1文本與文本處理5.2圖像與圖形5.3數(shù)字聲音及應(yīng)用5.4數(shù)字視頻及應(yīng)用,5.4數(shù)字視頻及應(yīng)用,本節(jié)重點(diǎn):視頻采集卡視頻壓縮編碼的標(biāo)準(zhǔn)及其應(yīng)用,5.4數(shù)字視頻及應(yīng)用,視頻(video):指的是內(nèi)容隨時(shí)間變化的一個(gè)圖像序列,也稱為活動(dòng)圖像(motionpicture)。常見(jiàn)的視頻有電視和計(jì)算機(jī)動(dòng)畫。電視:能傳輸和再現(xiàn)真實(shí)世界的圖像與聲音,是當(dāng)代最有影響力的信息傳播工具。數(shù)字視頻:數(shù)字化的電視信號(hào)稱為數(shù)字視頻。計(jì)算機(jī)動(dòng)畫:是計(jì)算機(jī)制作的圖像序列,是一種計(jì)算機(jī)合成的視頻。,基本概念:,電視畫面:一種由光點(diǎn)自左向右、自上向下而掃描形成的光柵掃描圖像,一般采用隔行掃描方式,即圖像由奇數(shù)場(chǎng)和偶數(shù)場(chǎng)兩部分組成,合起來(lái)組成一幀圖像,1、電視基本知識(shí),5.4.1數(shù)字視頻基礎(chǔ),PAL制式(中國(guó)采用)幀頻25幀/s,場(chǎng)頻50場(chǎng)/s,遠(yuǎn)距離傳輸時(shí)用亮度信號(hào)Y和兩個(gè)色度信號(hào)U、V來(lái)表示優(yōu)點(diǎn):能與黑白電視接收機(jī)保持兼容,Y分量由黑白電視機(jī)直接顯示而無(wú)需做進(jìn)一步處理可以利用人眼對(duì)兩個(gè)色度信號(hào)不太靈敏的視覺(jué)特性來(lái)節(jié)省電視信號(hào)的帶寬和發(fā)射功率,5.4.1數(shù)字視頻基礎(chǔ),彩色信號(hào)的YUV表示與RGB表示的轉(zhuǎn)換:亮度分量Y=0.3R+0.59G+0.11B色度分量U=0.493(B-Y)色度分量V=0.877(R-Y),,5.4.1數(shù)字視頻基礎(chǔ),數(shù)字視頻與模擬視頻相比的優(yōu)點(diǎn):復(fù)制和傳輸時(shí)不會(huì)造成質(zhì)量下降容易進(jìn)行編輯修改有利于傳輸(抗干擾能力強(qiáng),易于加密)可節(jié)省頻率資源,2、視頻信號(hào)的數(shù)字化,5.4.1數(shù)字視頻基礎(chǔ),以一幀幀畫面為單位進(jìn)行由于采用YUV彩色空間,人眼對(duì)顏色信號(hào)的敏感度遠(yuǎn)不如對(duì)亮度信號(hào)靈敏,所以色度信號(hào)的取樣頻率可以比亮度信號(hào)的取樣頻率低,以減少數(shù)字視頻的數(shù)據(jù)量,5.4.1數(shù)字視頻基礎(chǔ),視頻采集卡:PC機(jī)中用于視頻信號(hào)數(shù)字化的插卡,簡(jiǎn)稱視頻卡它能將輸入的模擬視頻信號(hào)(及伴音信號(hào))進(jìn)行數(shù)字化后存儲(chǔ)在硬盤中。數(shù)字化的同時(shí),視頻圖像經(jīng)過(guò)彩色空間轉(zhuǎn)換(從YUV轉(zhuǎn)換為RGB),然后與計(jì)算機(jī)圖形顯示卡產(chǎn)生的圖像疊加,用戶可在顯示器屏幕上指定窗口中監(jiān)看(聽(tīng))其內(nèi)容。,5.4.1數(shù)字視頻基礎(chǔ),數(shù)字?jǐn)z像頭:在線獲取數(shù)字視頻的設(shè)備。通過(guò)光學(xué)鏡頭采集圖像,然后直接將圖像轉(zhuǎn)換成數(shù)字信號(hào)并輸入到PC機(jī),不再需要視頻采集卡進(jìn)行模數(shù)轉(zhuǎn)換。最高分辨率:640480,一般:352288,速度:30幀/s左右,鏡頭視角:45~60度光傳感器:大多采用CCD,部分采用CMOS類型,后者分辨率不能很高,但功耗低、速度快接口:USB接口,IEEE1394(火線)接口。,5.4.1數(shù)字視頻基礎(chǔ),數(shù)字?jǐn)z像機(jī):一種離線的數(shù)字視頻獲取設(shè)備。原理:與數(shù)碼相機(jī)類似,功能更多壓縮編碼:視頻圖像及伴音使用MPEG記錄介質(zhì):磁帶,硬盤接口:USB,IEEE1394,5.4.1數(shù)字視頻基礎(chǔ),數(shù)字視頻的數(shù)據(jù)量很大解決上述問(wèn)題的出路是對(duì)數(shù)字視頻信息進(jìn)行數(shù)據(jù)壓縮。由于視頻信息中畫面內(nèi)部有很強(qiáng)的信息相關(guān)性,相鄰畫面的內(nèi)容又有高度的連貫性,再加上人眼睛的視覺(jué)特性,所以數(shù)字視頻的數(shù)據(jù)量可壓縮幾十倍甚至幾百倍。,數(shù)字視頻壓縮的可行性,5.4.2數(shù)字視頻的壓縮編碼,視頻壓縮編碼的標(biāo)準(zhǔn)及其應(yīng)用,5.4.2數(shù)字視頻的壓縮編碼,數(shù)字視頻的編輯,是在非線性編輯器的軟件支持下進(jìn)行的使用模式:把電視節(jié)目素材存入硬盤中,根據(jù)需要對(duì)不同長(zhǎng)短、不同順序的素材進(jìn)行剪輯,同時(shí)配上字幕、特技和各種動(dòng)畫,再進(jìn)行配音、配樂(lè),最終制作成高質(zhì)量的電視節(jié)目核心軟件:數(shù)字視頻編輯器,如AdobePremiere,5.4.3數(shù)字視頻的編輯,概念:采用計(jì)算機(jī)制作可供實(shí)時(shí)演播的一系列連續(xù)畫面的一種技術(shù)?;A(chǔ):計(jì)算機(jī)圖形學(xué)制作過(guò)程:先在計(jì)算機(jī)中生成場(chǎng)景和形體的模型→描述它們的運(yùn)動(dòng)→生成圖像并轉(zhuǎn)換為視頻信號(hào)輸出,5.4.4合成視頻——計(jì)算機(jī)動(dòng)畫,創(chuàng)作軟件:二維動(dòng)畫軟件如AnimatorPro三維動(dòng)畫軟件如3DStudioMAX等動(dòng)畫網(wǎng)頁(yè)類型:GIF動(dòng)畫:目前WEB網(wǎng)頁(yè)上最常用的動(dòng)畫表現(xiàn)形式之一。Adobe的ImageReady工具,在使用時(shí)只要先將圖片制作好,保存成gif、bmp或jpg格式文件,然后再按序?qū)雊if文件即可。FLASH動(dòng)畫:廣泛使用的WEB網(wǎng)頁(yè)動(dòng)畫制作軟件。制作的的動(dòng)畫是矢量圖形,不管放大縮小都清晰可見(jiàn)。.swf很小,便于傳輸且有交互性。,5.4.4合成視頻——計(jì)算機(jī)動(dòng)畫,CD(CompactDisc):小型光盤,最早應(yīng)用于數(shù)字音響領(lǐng)域,代表產(chǎn)品是CD唱片。每張CD唱片的存儲(chǔ)容量是650MB左右,可存放1小時(shí)的立體聲高保真音樂(lè)。,1、VCD與DVD,5.4.5數(shù)字視頻的應(yīng)用,VideoCD(簡(jiǎn)稱VCD):1994年由JVC、Philips等公司聯(lián)合定義的一種以數(shù)字技術(shù)在CD光盤上存儲(chǔ)視頻和音頻信息的規(guī)范。規(guī)定了將MPEG-1音頻/視頻數(shù)據(jù)記錄在CD光盤上的文件系統(tǒng)的標(biāo)準(zhǔn),使一張普通的CD光盤可記錄約60分鐘的音視頻數(shù)據(jù),圖像質(zhì)量達(dá)到家用錄放像機(jī)的水平,可播放立體聲。VCD播放機(jī)體積小,價(jià)格便宜,音視頻質(zhì)量較好。VCD的一個(gè)派生產(chǎn)品是KaraokeCD光盤,它同VCD保持兼容。,5.4.5數(shù)字視頻的應(yīng)用,DVD(DigitalVersatileDisk):數(shù)字多用途光盤。有多種規(guī)格,用途廣泛。其中的DVD-Video(日常簡(jiǎn)稱為DVD)就是一種類似于LD或VideoCD的家用影碟。,5.4.5數(shù)字視頻的應(yīng)用,DVD-Video的特點(diǎn)和功能:提供32種文字或卡拉OK字幕,最多可錄放8種語(yǔ)言的聲音具有多結(jié)局、多角度(從9個(gè)角度選擇觀看圖像)、變焦和家長(zhǎng)鎖定控制等功能畫面的長(zhǎng)寬比有三種方式:全景掃描、4:3普通屏幕、16:9寬屏幕方式伴音具有5.1聲道(左、右、中、左環(huán)繞、右環(huán)繞和超重低音),實(shí)現(xiàn)三維環(huán)繞立體音響效果,5.4.5數(shù)字視頻的應(yīng)用,DVD影碟與VCD相比:存儲(chǔ)容量大得多。CD光盤容量650MB,存放74分鐘VHS質(zhì)量(352240)的視頻圖像;單面單層DVD容量4.7GB,以平均碼率4.69Mb/s播放視頻圖像,能存放133分鐘的接近于廣播級(jí)圖像質(zhì)量(720480)的整部電影壓縮編碼:MPEG-2畫面品質(zhì)比VCD高,5.4.5數(shù)字視頻的應(yīng)用,2、可視電話與視頻會(huì)議,可視電話在打電話同時(shí)還可以互相看見(jiàn)對(duì)方的圖像。分為靜態(tài)圖像和動(dòng)態(tài)圖像兩種??梢曤娫挼慕K端是集攝像、顯示、聲音與圖像的編/解碼等功能于一體的,內(nèi)置高質(zhì)量的數(shù)字變焦鏡頭及MODEM,可連接到普通的電話線上。編碼標(biāo)準(zhǔn)是H.263,圖像格式為360*288或180*144,幀頻不小于10幀每秒,音頻碼率是5.3kbit/s和6.3kbit/s兩種。,5.4.5數(shù)字視頻的應(yīng)用,視頻會(huì)議通過(guò)數(shù)字音視頻數(shù)據(jù)實(shí)時(shí)傳送聲音、圖像,使得分散在兩個(gè)或多個(gè)地點(diǎn)的用戶就地參加會(huì)議的一種多媒體通信應(yīng)用。利用計(jì)算機(jī)網(wǎng)絡(luò)進(jìn)行可視電話和視頻會(huì)議具有使用方便、成本較低的優(yōu)點(diǎn)。,5.4.5數(shù)字視頻的應(yīng)用,數(shù)字電視:將電視信號(hào)進(jìn)行數(shù)字化,然后以數(shù)字形式進(jìn)行編輯、制作、傳輸、接收和播放。數(shù)字電視的特點(diǎn):頻道利用率高、圖像清晰度好可以開(kāi)展交互式數(shù)據(jù)業(yè)務(wù),包括電視購(gòu)物、電視銀行、電視商務(wù)、電視通信、電視游戲、實(shí)時(shí)點(diǎn)播電視、電視網(wǎng)上游覽、觀眾參與的電視競(jìng)賽等,3、數(shù)字電視,5.4.5數(shù)字視頻的應(yīng)用,數(shù)字電視系統(tǒng)的構(gòu)成:信源編碼、業(yè)務(wù)復(fù)用、信道傳輸與發(fā)送美國(guó)的DTV、歐洲的DVB和日本的ISDB這幾種標(biāo)準(zhǔn)中:信源編碼中,視頻都采用MPEG-2標(biāo)準(zhǔn),音頻采用MPEG-2或DolbyAC-3業(yè)務(wù)復(fù)用采用的都是MPEG-2系統(tǒng)層規(guī)范或其擴(kuò)展形式信道及發(fā)送部分各不相同數(shù)字電視接收機(jī)(簡(jiǎn)稱DTV接收機(jī))的三種形式:數(shù)字電視接收機(jī)——傳統(tǒng)模擬電視接收機(jī)的換代產(chǎn)品傳統(tǒng)模擬電視機(jī)外加一個(gè)數(shù)字機(jī)頂盒可以接收數(shù)字電視的PC機(jī),5.4.5數(shù)字視頻的應(yīng)用,VOD(VideoOnDemand):視頻點(diǎn)播(也稱為點(diǎn)播電視)技術(shù)的簡(jiǎn)稱,即用戶可以根據(jù)自己的需要收看電視節(jié)目。,4、點(diǎn)播電視(VOD),5.4.5數(shù)字視頻的應(yīng)用,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)字媒體及應(yīng)用 數(shù)字 媒體 應(yīng)用 PPT 課件
鏈接地址:http://ioszen.com/p-11508523.html