内容简介
数字媒体技术是一门综合计算机技术、通信技术、视听技术和信息技术成果的技术,是信息社会发展的一个新方向。《数字媒体技术与创意应用研究》共分五章,主要围绕数字媒体技术与创意应用展开论述,介绍了数字媒体技术的研究方向和内容,详细论述了数字媒体处理技术、数字媒体制作技术和数字媒体传播技术,综合阐述了数字媒体技术在数字媒体广告设计、数字动画创意和数字影视后期剪辑中的创意应用等内容,并进一步研究、总结了数字媒体技术的创意应用路径。
目录
第一章 数字媒体技术基础
第一节 数字媒体技术的概念与特征
第二节 数字媒体技术的发展趋势
第三节 数字媒体技术的研究方向和内容
第二章 数字媒体处理技术
第一节 数字媒体音频处理技术
第二节 数字媒体视频处理技术
第三节 数字媒体图像处理技术
第三章 数字媒体制作技术
第一节 数字媒体人机交互技术
第二节 数字媒体界面设计技术
第三节 数字媒体虚拟现实技术
第四节 数字媒体水印制作技术
第四章 数字媒体传播技术
第一节 数字媒体传播基础
第二节 数字媒体传播中的流媒体技术
第三节 数字媒体传播中的通信与网络技术
第五章 数字媒体技术的创意应用
第一节 数字媒体广告设计
第二节 数字动画创意
第三节 数字影视后期剪辑应用
参考文献
试读
《数字媒体技术与创意应用研究》:
七、数字语音处理技术
对于人类社会而言,语言是人们进行交流与沟通的最为便捷的工具和载体,鉴于此,在数字媒体内容与应用中,语言具有非常重要的地位与作用。语音领域的数字语音处理技术主要包括语音合成技术、语音增强技术和语音识别技术三方面的内容,特别是语音识别技术为人机交互提供了一个友好的界面。
(一)语音合成技术
语音合成的基本目的是让机器模仿人类的发音来传送信息。数字语音合成方法主要有波形编码语音合成、参数式分析语音合成和规则语音合成等。文-语转换系统是规则语音合成技术的典型应用。
1.波形编码语音合成
波形编码语音合成也称录音编辑合成,其基本原理是通过录音和数字编码将句子、短语、单词和音节作为合成单元,压缩数据后形成语音库;在对语音进行重放的时候,会在语音库中根据要输出的信息来提取相应单元的波形数据,通过串接或编辑的方法将语音结合在一起,经过解码实现语音的还原。这类系统的特点是结构简单、价格低廉,但其合成音质的自然度取决于单元的大小,因而需要很大的存储空间,码率也大。
基音同步叠加算法使波形编码语音合成技术得到了广泛的应用。根据上下文的要求,在对语音波形片段进行拼接之前采用基音同步叠加算法调整拼接单元的韵律特性,可以使合成波形在保留原有发音主要音段特征的基础上实现拼接单元的韵律特征与上下文的要求相吻合,呈现出非常高的自然度,提高清晰度。
国内对将基音同步叠加算法应用于汉语的文一语转换系统进行了大量广泛且深入的研究,也开发出基于波形拼接的汉语文一语转换系统,如清华大学的SinoSonic系统。
2.参数式分析语音合成
音节、半音节或音素是参数式分析语音合成的合成单元。对于参数式分析语音合成而言,其基本思路为:基于语音理论分析所有合成单元的语音,对于其中有关的语音参数进行逐帧提取,对其进行编码,由此组成合成语音库;在进行输出的时候,针对需要合成的语音信息在语音库中找出相应的合成参数,对合成参数进行连接和编辑,之后按照顺序送入语音合成器,在合成器中合成参数的控制下,再逐帧对语音波形进行还原。控制音强的幅度、控制音色的共振峰参数、控制音高的基频都属于较为典型的合成参数。与波形编辑公式相比,这类系统的码率相对较低,有着非常复杂的系统结构,也没有较为清晰的合成音质。目前,这类系统已做到芯片级系统。
3.规则语音合成
规则语音合成的目标是通过语音学规则来产生语音。规则语音合成系统存储的是较小语音单位的声学参数,如音素、双音素、半音节或音节等,也会储存各种规则,如由音素组成音节,之后由音节组成词或者组成句子的规则。合成系统会在输入字母符号的时候借助规则对它们进行自动的转换,转换为非常连续的语音声波。鉴于语音中存在协同发音效应,这不同于单独存在的元音和辅音,因此,合成规则是建立在不同环境中每一个语音单元协同发音效应的分析基础上,并在对其规律进行归纳的前提下制定的,较为典型的有共振峰频率规则、声调的语调规则、时长规则等。鉴于语句中不仅有重音还有轻音,因此还需要对语音减缩规则进行归纳和总结。规则语音合成相较于参数式分析语音合成有着较小的语音库存储量,在音质上也相对较差,但是其有着非常复杂的结构,会涉及非常多的语言学和语音学模型。
文-语转换系统是一种规则语言合成系统,其主要输入的是文字串,一般为文本字串。系统中的文本分析器对于输入的文字串会先根据发音字典将其分解为带有属性标记的词语和对应的发音符号。接着,通过语义规则为每个词语和每个音节确定重音级别、语句结构、语调、停顿,在完成这个过程之后就实现了将文字串转换为代码串。以此为依托,规则语音合成系统就会合成一些不同语气的语句。文一语转换系统不仅包含各种规则,如词规则、语义学规则、语音学规则等,还要求正确理解文字的内容,即正确理解自然语义,因此,我们可以认为文一语转换系统为人工智能系统。
(二)语音增强技术
周围环境、传播媒介等都会使语音传播过程遭受噪声的干扰,这些噪声的出现使得信宿接收的语音不够纯粹,其中夹杂着噪声的语音信号不再是原本纯净的原始语音信号。语音增强的目的在于从含噪声的信号中提取最清晰的原始语音。但是,一般来说,干扰并不是有规律可循的,是非常随机的,因此在带噪声的语音中实现提取完全纯净的语音基本上是无法实现的。基于此,语音增强主要有两个目的:第一,实现语音质量的提高,将背景噪声消除掉,有利于听者乐于接收,也不会产生听觉疲劳,这属于主观度量;第二,将语言可懂度提高,这属于客观度量。这两个目的一般来说很难一起实现。语音增强不仅与语音信号数字处理有着千丝万缕的联系,还关乎人的听觉感知和语言学。语音增强的基础是对语音和噪声特性的了解与分析,由于噪声特性各异,语音增强的方法也各不相同。对于加
前言/序言
数字媒体兴起于1995年,是计算机技术、网络技术与媒体技术融合的产物。进入21世纪以来,数字媒体产业基于数字技术、网络技术及文化产业的融合,借助数字、新材料、移动互联网、人工智能、虚拟现实等技术,以文化产业发展需求为中心提高文化产业自主创新能力,提高技术的研发水平与能力,具有高技术含量、高人力资本含量和高附加值等特点。要发展具有竞争力的数字媒体产业,必须有数字媒体技术的支撑和引领。
数字媒体技术是20世纪90年代开始应用的新技术,它融合了数字信息处理技术、计算机技术、数字通信和网络技术等,是借助现代计算机技术以及通信技术来对数字化的文字、声音、图像等进行处理,将原本并不抽象的信息转化为可以进行管理和可以被感知的、可交互的信息的一种技术。在数字媒体技术的发展中,科学技术、信息技术及数字科学技术等都能为数字媒体技术提供相应的指导,并且可以整合文化、教育、艺术等相关的理论,这些都建立在新时代艺术的辅助和大众传播理论的基础之上。当前数字媒体技术已经实现了对文字、语言及电子技术的超越,数字媒体成为当前最新的信息载体。
在数字媒体技术中,数字化表达是最为突出的特点。当前网络技术实现了突飞猛进,不同系统之间存在数据传输问题,计算机处理这些数据时就需要借助接收设备来进行数字化转换,将其转化为数字信号,一般为数字、图片或者视频。数字媒体通常具备信息无限重复传播的特点,根据该特点,数字媒体可以实现数字的多样化。传统媒体的制作需要耗费较长的时间,数字媒体可以有效解决类似的问题。例如,将数字媒体技术融入大型的活动中,可以实现对数字媒体技术的充分挖掘,借助计算机这一媒介进行展示可以使得活动的效率大幅提高。
数字媒体技术随着社会的发展在各个领域得到了广泛应用,起到了积极的推动作用,并且还实现了生产效率的提高以及对互联网技术的突破。随着数字媒体技术的广泛应用,当前我国大部分企业的改革与调整基于此进行,并将数字媒体技术作为重点,以此来实现自身的长远发展,紧跟时代发展的步伐,促进行业的进步与发展。此外,数字媒体技术会对消费者产生一定的影响,这也间接对各个行业与产业产生影响。同时,数字媒体技术在实践应用中出现了一些问题,只有对这些问题进行有效处理,才能保证数字媒体技术迈向更高的台阶。相关技术人员应该根据实际情况进行深入的调研,对数字媒体技术的未来发展趋势和前景进行预测,加大对数字媒体创新技术以及产品升级的重视程度,以此来开拓新的市场。在未来,数字媒体技术会展现独特的魅力、发挥更大的优势,将带领行业走向新的发展阶段。
全书共五章。第一章是数字媒体技术基础,主要介绍了数字媒体技术的概念与特征、数字媒体技术的发展趋势、数字媒体技术的研究方向和内容。第二章是数字媒体处理技术,主要对数字媒体音频处理技术、数字媒体视频处理技术、数字媒体图像处理技术进行了阐述。第三章是数字媒体制作技术,从数字媒体人机交互技术、数字媒体界面设计技术、数字媒体虚拟现实技术、数字媒体水印制作技术四个方面进行了论述。第四章是数字媒体传播技术,主要对数字媒体传播基础、数字媒体传播中的流媒体技术、数字媒体传播中的通信与网络技术进行了阐述。第五章是数字媒体技术的创意应用,包括数字媒体广告设计、数字动画创意、数字影视后期剪辑应用等内容。
在撰写本书的过程中,笔者参考了诸多学术文献,得到了许多专家学者的帮助,在此表示真诚感谢。但由于笔者水平有限,书中难免有疏漏之处,希望广大同行及时指正。