投稿指南
一、本刊要求作者有严谨的学风和朴实的文风,提倡互相尊重和自由讨论。凡采用他人学说,必须加注说明。 二、不要超过10000字为宜,精粹的短篇,尤为欢迎。 三、请作者将稿件(用WORD格式)发送到下面给出的征文信箱中。 四、凡来稿请作者自留底稿,恕不退稿。 五、为规范排版,请作者在上传修改稿时严格按以下要求: 1.论文要求有题名、摘要、关键词、作者姓名、作者工作单位(名称,省市邮编)等内容一份。 2.基金项目和作者简介按下列格式: 基金项目:项目名称(编号) 作者简介:姓名(出生年-),性别,民族(汉族可省略),籍贯,职称,学位,研究方向。 3.文章一般有引言部分和正文部分,正文部分用阿拉伯数字分级编号法,一般用两级。插图下方应注明图序和图名。表格应采用三线表,表格上方应注明表序和表名。 4.参考文献列出的一般应限于作者直接阅读过的、最主要的、发表在正式出版物上的文献。其他相关注释可用脚注在当页标注。参考文献的著录应执行国家标准GB7714-87的规定,采用顺序编码制。

结构化文本格式MusicXML对音乐编辑出版思维的

来源:信息系统工程 【在线投稿】 栏目:期刊导读 时间:2020-08-12
作者:网站采编
关键词:
摘要:数据科学的兴起和发展,让数据库技术与思维的意义在各个领域开始凸显,人文学科亦莫能全然置身事外。其中,艺术类学科与数据思维联姻的案例更是值得关注,这类的案例,在诸多

数据科学的兴起和发展,让数据库技术与思维的意义在各个领域开始凸显,人文学科亦莫能全然置身事外。其中,艺术类学科与数据思维联姻的案例更是值得关注,这类的案例,在诸多“互联网+艺术”的研究与产业建设中都可以找到,比如笔者供职的中国文联出版社开展的“中国艺术(出版)资源素材库”项目。从事这类工作的音乐编辑人员,若能积极掌握相关的新思路和新概念,无疑将事半功倍;而这些新的工作方式在融入音乐出版物的传统编审工序之后,也会为其基本理论体系补充一些新的命题。音乐文化的传播是多么倚重音乐出版事业,自不待言,因此笔者试在适度介绍相关技术概念的基础上,就未来音乐类出版专业技术人员的理想的能力结构,以及相应人才队伍的建设与培养提出几点自己的看法,以期抛砖引玉。 一、文本的结构化与XML技术 数字时代的出版业已经不能再将“文本”简单理解为文字内容,而是应从语言学和符号学的角度,将其看作一个相对封闭、自足的符号系统。各种向读者传达信息的形态,都可以看成由符号构成的一个文本。而早在结构主义和符号学的研究中,文本已是结构化的对象。结构对应于内在的符号关系,具有重要的世界观意义,这正如结构主义者的基本观点所说,“事物的真正本质不在于事物本身,而在于我们在各种事物之间构造,然后又在它们之间感觉到的那种关系……世界是由各种关系而不是由事物构成的观念”①[英]特伦斯·霍克斯著《结构主义和符号学》,瞿铁鹏译,刘峰校,上海译文出版社1977年版,第8页。。对人文学科中的艺术资源,我们可称其为结构化文本,它直达事物内容和语义的根本。 大数据理论认为,不仅数据是可以结构化的,文本也是可以结构化的,②参见周宝曜、刘伟、范承工主编《大数据:战略·技术·实践》,电子工业出版社2013年版,第7页。而且可被称为“半结构化数据”。一般说来,可以被二维模式(或说二维结构)表现的数据,即为结构化数据;而半结构化数据并没有严格的模式,以下文要涉及的XML为例,它的模式、结构,与它的数据值、内容是混合在一起的,或者说,它的结构是通过可“自描述”的“标记”,与内容结合在一起的。①参见孟小峰《XML数据管理:概念与技术》,清华大学出版社2009年版。笔者认为,结合结构主义的视角看,后者之所以被表述为“半结构”,在于文本的一部分符码的能指可以成为标记,或者可以组成标记,而还有相当一部分符码在文本规模有限的情况下很难被纳入缜密的结构关系中,其语义信息很难在结构关系中得到体现。所以我们应该认为,结构化与非结构化之间没有绝对的界限。 传统数据库中的是典型的结构化数据,对应的技术范畴是数据库系统;而文本是半结构化的,所以它对应的技术范畴是信息系统。检索数据库系统已有成熟的技术,如SQL;而查询半结构化的文本被称为信息检索,②参见[美]西尔伯沙茨等著《数据库系统概念》,杨冬青等译,机械工业出版社2012年版。笔者使用该文献时用词有改动,原文称文本为“非结构化的”,实际上指的就是笔者改动后的“半结构化”。如“音乐信息检索”(Music Information Retrieval)等。 这里必须明确,作为文本的艺术出版资源,它所对应的信息系统领域的技术,在很大程度上和数据库系统的技术相同——特别是资源存储和检索方面。因为只要对半结构化数据稍加处理,就能将其在一定程度上转换成格式化的、结构化的数据,从而应用于数据库系统。③参见陈建红等主编《Web数据库与XML应用》,高等教育出版社2004年版,“前言”。但是,信息系统领域和数据库系统领域强调的重点又不尽相同——艺术(出版)资源素材库的技术重点,是基于关键词的查询,文档与查询的相似度分析,以及文档的分析、分类和索引等。④参见《数据库系统概念》。而对这类数据资源的检索以至各种整合来说,XML技术的支撑尤有意义。⑤推荐深入阅读潘有能著《XML挖掘:聚类、分类与信息提取》,浙江大学出版社2012年版。 XML(eXtensible Markup Language)意为“可扩展标记语言”。XML文档其实也是一个文本文件,但它是由标记及其所标记的内容构成的文本文件(最初设计它,就是为了让它成为给正文文档添加标注信息的一种途径),这些标记可以自由定义(自描述),所以它有“可扩展”之称。它的核心是(使用标记)描述数据的组织结构,从而从中体现含义。通过将文本与子标记嵌套在父标记之下,再层层嵌套直到根标记,形成“树形结构”,可以很好地揭示文本内容与它们之间的结构关系。(形象地说,图书的目录即是典型的树形结构,它可以很好地概括书的内容编排情况,也利于读者查找。)XML通过文档类型定义(Document Type Definition,DTD)和XML纲要定义(XML Schema Definition,XSD)模式对数据结构(内容)进行定义与约束,通过层叠样式表(CSS)和可扩展样式语言(XSL)对显示方式(形式)进行规定。 XML既可以使用在结构化数据上,也可以使用在半结构化数据上,且可以用来处理“结构化文本”。它不是编程语言,而是一组语法规则,可在诸多领域创建语义丰富的标记语言(比如下文提及的音乐),也可以作为数据交换的标准格式。应该说,它对出版资源的存储、检索、分析、加工和处理都可以有重要作用。 二、对应于音乐领域的MusicXML技术 乐谱作为音乐语言的符号表达方式,是一种很典型的结构化文本。所以,XML对音乐记谱领域的渗入是有其自然趋势的。 目前通用的一种使专业音乐和互联网、数字出版无缝对接的XML制式是MusicXML,它由Recordare公司开发,至2011年已发布3.0版本,该公司也在公共领域发布了名为“MusicXML 3.0 Tutorial”的官方使用教程。Music XML基于XML,是一种开放的、用于电子乐谱发布与信息交换的文件格式,适用于各种记谱软件、音序软件、音频软件(如Steinberg系列等)。相对于MIDI,Music XML可以在传递音乐文件时让更多的信息完好保存,并很容易用来在网上发布交互式乐谱,⑥参见杨万钧《从MIDI到MusicXML——计算机乐谱信息交换格式的发展》,载《演艺科技》2014年第7期。这是因为它传递的信息中有相当一部分是在传达音乐的结构和语义信息,这是MIDI所不具备的。举一个最简单的例子:关于“等音”概念,MIDI无法表现升F音和降G音在符号意义上的区别(显然这一区别在乐理和作曲技术理论领域是非常重要的),但MusicXML可以做到。 MusicXML设计理念的核心,就是描述音乐文本的组织结构。其各层标记形成的树状结构如下页图1所示。⑦金玉《基于MUSICXML的音乐个性化推荐系统》,吉林大学2015届硕士学位论文。图经过重制,中文释义是重制时加的,仅供参考。图中的每个方框代表MusicXML中定义的一种标记,方框之间的从属关系代表标记之间的嵌套关系。MusicXML中定义的标记非常多,此图仅列举了主要的一些,具体可参见MusicXML 3.0的官方教程。MusicXML的意义可以具体地从以下两个方面得到诠释。 MusiiccXXMMLL作为记谱媒介的意义我们知道,五线谱作为一种记谱法,其重要意义不仅在于从作曲技法层面记录音乐,还在于从表演层面做记录,二者紧密结合,才能尽量给音乐语义信息“保真”。类似地,在描述信息特征时,MusicXML也显著地把信息的标记分为“可视的”和“可听的”两个层面:听觉层面信息的标记和MIDI基本相同,如对音高、时值等的记录;视觉层面的信息标记则主要有对谱面上的基本音型的选定,对声部划分、乐句划分,以及拍子、调号、歌词、速度、表情记号等的记录。这一划分对应到XML文件中,通常表现为<note>和<attributes>两类标记的划分,参见图1。 当然,图1所示的结构如果以XML标记(用尖括号包围的关键字)的形式写出来,样貌应基本如下(为节约篇幅,这里仅列出开头,而且,每个标记其实还有一个对应的结束标记,以加斜杠来表示,这里也不再赘列): 除了基本的乐谱元数据信息(如上述标签中的乐章及其编号、名称等)之外,这个文件的主体是结构化文本信息。但是这里有一个必须说明的问题:乐谱的结构是由“横向的组合”与“纵向的聚合”两个维度构成的——音符按照节拍、小节与时值横向组合,也按照对位线条、乐器声部与和声纵向聚合,但XML本身是通过标记逐级嵌套来形成结构的。所以,我们要么选择将纵向的聚合嵌套在横向的组合之内,要么反过来将横向组合嵌套在纵向聚合之内。前文给出的示例是常用的方式,即让纵向嵌套在横向之内,其根标记为“声部序列”即<partwise>(严格的标记书写是<score-partwise>),每次一级的标记都通过缩进(即Tab键效果)记在上一级标记之下。 图1 MusicXML的各种标记形成的树状结构举例 MusiiccXXMMLL对音乐文本结构分析的意义既然对音乐文本的建构可以从横向的声部出发,也可以从纵向的节律出发,那么从音乐分析的角度来看,对侧重于用复调思维建构起来的音乐和对侧重于用和声思维建构起来的音乐,MusicXML的描述可以有所区别。因为XML的结构如同数据库,在构建文本信息的层次关系时,也需要考虑如何更有效地去构建,即如何尽量避免信息冗余、信息缺失。我们可以合理地设想:对侧重于复调结构的音乐,将小节标记嵌套于声部标记之内为宜;对侧重于和声结构的音乐,将声部标记嵌套于小节标记之内为宜。更加幸运的是,对同样的音乐文本,MusciXML能够灵活地在这两种类型之间转换。 在这种区别化的描述之间进行抉择与设计,对音乐结构的认知、音乐的语义分析,都别具意义。就像普通XML有检索优势那样,MusicXML可以实现音乐结构信息的索引功能。我们可以设计出特定的算法,给音乐分析方面的问题提供帮助,比如对四部和声的规范性进行校验、对曲式进行基本归类与聚合、对对位法的类型进行识别、对和声进行与和声节奏进行辨认、对配器布局进行分析等。这意味着未来在信息系统平台上工作的音乐编辑从业者,可以给音乐家和音乐学者提供更为科学、有效的专业支持。 三、音乐文本结构化技术对音乐类编辑思维的可能影响 在简单讨论了关于音乐资源文本的结构化问题之后,就可以回到数字出版的话题上来了。数字出版的技术平台,以数字资源的管理为核心,以传统出版资源和新兴资源的数字化转型和构建为关键,而基于XML的结构化文本处理技术正好对应着这个关键。面对文本和数据以及二者交融的信息资源,出版社的编辑团队该如何定位自己的职能呢?笔者认为,从传统的专业门类编辑逐步过渡到基于信息系统的数字化管理编辑是比较合适的。下文谨按传统的对编辑职能的分类,尝试申说这一潮流对音乐类编辑人员职能的影响。 (一)策划编辑 策划编辑的重要职能包括进行选题策划与营销,以及管理涉及读者、作者等的客户关系。未来,若要使其职能在新的技术条件下得到更好的发挥,至少应考虑强化以下几项有益的技能:建立用户数据库、作者与受众数据库;建立出版物的元数据①元数据的定义,参见《XML挖掘:聚类、分类与信息提取》,第99页。亦可参见国家新闻出版广电总局出版专业资格考试办公室编《数字出版基础》,电子工业出版社2015年版。标引规范,使之指向基础的、元数据层面的信息资源整合;熟悉关系数据库的构建和SQL查询语言②关系数据库是指建立在关系模型基础上的数据库,其存储的数据对格式的要求非常严谨,是高度结构化的。正因如此,关系数据库允许用户使用符合特定语法的查询语言对其进行条件非常复杂的查询。的使用,使之最终指向基于用户信息需求的数字出版模式。 (二)内容编辑 对文本内容的处理,主要包括校、编、审。传统的内容编辑从业者主要是从版式、语言文字规范和学科专业视角来把关的,而数字出版的内容编辑应该还可以结合结构化文本的处理思想,优化这些工作环节。概括地说,对文本的结构化描述和基于它的信息检索,无疑是内容编辑的有效工具,所以面对结构化的文本,应该结合信息系统的观念来认知并处理。下面就校、编、审三个环节分别做具体论述。 “校”的环节首先,文本作为一种半结构化数据,可以用类似于关系模式的“模式信息”(即通过DTD或XSD)在一定程度上规定文本的结构。 其二,之所以有“校异同比校对错要难”的公认看法,是因为由异同而致的“差错”是一个相对而非绝对的问题。但就结构化的文本而言,破除异同障碍的齐、清、定原则履行起来就容易得多。而正如概念的本质在于结构中的关系那样,概念的正谬也应该根据结构关系来判断。对被纳入结构关系中的文字文本来说,校异同更为重要,而在何种程度上将“异”化为“同”,又要参考其结构模式。对于未被纳入结构关系中的文本,依然以校是非为主要任务。 具体到乐谱的校对方面更是如此。从记谱法的角度看,可以通过对MusicXML数据结构的特定限制(使用DTD或XSD)避免记谱方面出现基本逻辑错误。当然,许多打谱软件已经通过特定的算法基本满足了这个诉求,但仍存有一些模棱两可的问题,比如“西贝柳斯”软件在一行五线谱记录两个声部(符杆分别向上和向下)的情况下,对那些在一个小节内时值不完整的声部,究竟允许省略其休止符还是必须通过休止符填满那个小节,其实并不明确,这常常给校对造成棘手的问题。而通过DTD和XSD进行限制,就可以很容易地统一规范并鉴别错误。 当然,有些音乐流派,比如结构主义,其作曲家及编辑可能会有意识地在声部的处理方式、连音线对乐句的划分方式等方面突出结构上的呼应。将来MusicXML通过标记的深度扩展与算法的开发,也可以去实现一定程度上的校异同功效。 “编”的环节这个环节就MusicXML的特点来说,重点会集中在标引的问题上——标注出哪些属于结构的范围,哪些属于非结构化的内容范围,这也是半结构化文本XML之所长。而且,XML及围绕其周边的技术可以对文本从内容到形式进行由内到外的统一整合,比如,利用XML的样式表即CSS或XSL对版式进行规定,或将XML和HTML有效对接,可以更好地实现网络上的交互与内容结构的可视化。 图2 使用Excel软件分析结构化的音乐文本的一个例子 对高度结构化的音乐作品文本,可以另从关系数据库的“数据透视表”模式着眼。这里举一个关于仅凭数据内容就能将音乐结构可视化的简单例子:在一本关于“曲式与作品分析”的图书中,加进MusicXML的作品数据库,甚至将XML格式化为关系数据表,就能在Excel软件上通过类似于数据透视表的工具进行交叉分析,如图2。 鉴于作品的音乐结构特点和分析诉求,图2的根标记是小节(即<measure>),它所示的界面反映了透视表的基本架构:它的列字段有曲式结构部(中间段)、排练号(B28、C29)、小节号(从小到大排序)、调性;行字段则有自定义的主题(Theme 1、Theme 2 condensation、Motive)、配器声部;交叉区域为对小节的计数项。通过这个图,可以直观而准确地看到作曲家的创作思路——主题动机分配在不同的乐器组,善犯而后避,呈现出明显的按等比关系进行的分裂与缩减,在此基础上,调性按全音阶音程关系加速递转。①这个曲例出自格里格《培尔·金特》第二组曲中的《海上风暴之夜》,图示主要集中于其“中间段”。至于对其从常规作曲技术理论出发进行的分析,可具体参考彭志敏著《音乐分析基础教程》(人民音乐出版社1997年版)的第八章。 若还原它的XML数据面貌,无论对大多数传统音乐编辑还是对音乐学师生而言,可能都不够“友好”: 当然,XML也有丰富的对版式进行定义和表现的功能,即样式表。通过样式表,再将其展示为音乐学师生熟悉的曲式分析图是不难的。限于篇幅,在此不作详述。 总之,从编辑学中“编”这个环节的视角看,结构化文本带来了很重要的一个概念,可以写作“汇·编”:它的要点在于对已有资源——对音乐资源而言,是音乐文本的“语料库”——进行重新整合。如果拥有像上例这样的音乐资源库,那么很多彼此相似的乐谱类出版物在加工中就省去了不少重复劳动。 “审”的环节这个环节主要牵扯到对信息的认知的问题。编辑业务中的审稿过程,实际上是审稿者对文本的语义信息的定性过程,从信息论的角度看,这种性质实际上是信息的规律性与变化性之间的对立与统一。笔者认为,文本既然可以被XML充分描述,那么它的这种规律性与变化性也是可以在XML的结构中自然体现出来的:有序的结构关系是规律性的体现,而除了标记之外,其他内容以及标记的属性(这个属性是非结构化的)是不断变化的信息,它们具有不确定性,缺乏模式的约束,是趋于非结构化的,以前文的思路来看是“很难被纳入缜密的结构关系中”的。所以,XML的“自描述”结构,本身就可以很好地揭示这样一种思维:一部稿件,既作为信息系统中的文本,又作为音乐艺术领域中的文本,可以因为混乱而复杂(指非结构化信息过多,这里的复杂是贬义),也可以因为缜密而复杂(指以结构化信息为主导,这里的复杂是褒义),亦可以因为松散而简单(指以非结构化信息为主导,这里的简单是贬义),还可以因为冗余而简单(指结构化信息充足,这里的简单是褒义)。 这种思想,是结构化文本与XML的描述技术给关于“审”的理论的重要启发。为了便于体会其间的辩证关系,笔者拟下页图3以示意之。 图3 从结构化的视角看音乐文本稿件的质量①这个编审方阵模式图系本文作者之一曹军军设计,力图结合XML结构化数据描述的实际。例如,通常所见的“流水清单”是非常适于用XML文档描述的,而对这个文档的判定,恰可以结合此方阵的思路——该文档应当处于右下部,因为用XML描述的流水清单恰恰是结构化程度非常高且有大量冗余的。 进一步说,对音乐艺术作品类的出版资源的审读也是一个审美的问题,所以图3的理念也可以在审美领域得到引用:从形式主义艺术观的视角来看,方阵的右列对应于自律性和结构化的资源,方阵的左列对应于有更多现代主义②王宏建在其《艺术概论》(文化艺术出版社2010年版)中论及现代主义思潮时,有意地用了“结构趋于松散而复杂”这两个看似相悖的概念。笔者认为这一用法是很有道理的,而且可以通过图3所示的方阵“可视化”地展现出来——非结构化恰对应于两种样态,即松散且复杂。方阵的左侧趋于“贬义”,和文艺界对现代主义“反传统”的价值评判也是不无关联的。特性以致趋于解构的、渐受诟病的后现代主义。 因此,艺术类出版物的编辑对文本质量的评审与审美,是相通的且彼此融合的。具体到音乐领域,也早已有如上所述的“信息论”式的,将质化、量化融合的评述。乐谱编辑面对让人眼花缭乱的乐谱资源,做最基本的审阅时,是可以尝试结合图3的思路的:冗余而简单的信息特征应该对应古典主义音乐风格,趋于“缜密而复杂”的可能就对应着传统和声学历史的复杂化演进但又不失一个“(调性)中心”的风格发展历程,而无调性的序列音乐则大致对应着方阵的左侧。 (三)融合编辑——编辑人才建设的方向 我们知道,在策划编辑业务范围内获得的基础的元数据等一系列信息资源,本身就容易成为完全结构化的数据——XML标记的可扩展特征,让它很利于元数据标引。而且从数字出版技术的角度看,“描述信息资源的粒度既要能够描述一个资源集合,也要能够描述一个单一资源或者资源的内部组成部分”③参见《数字出版基础》,第166页。关于这个论题,从实用层面来看,Jing.fm创始人施凯文曾谈及:“我们能获取的信息只有名称、歌手、作曲等,而里面更丰富的信息,比如包含的乐器、使用的语言、包含的情感、适合的场景等信息,则处于隐藏状态,无从而知。”(佚名《探索第四代在线音乐——深度揭秘Jing.fm》,载“豆瓣网”,2012年6月26日。 notes//note//)这自然地牵引着我们将数据量化的目标由元数据转向结构化的文本内部,即音乐作品文本内部。,因此,XML与文本内容信息的有机对接,合乎数字出版技术的发展趋势。 策划与编、审、校这些业务,是可以在结构化数据层面彼此接通的。策划工作中如果善用XML和它的检索与挖掘技术(如XQuery),就相当于具体编校工作中善用元数据层面的关系数据库和SQL查询语言。这种接通的意义,在数字出版的一些目前略显尴尬的微观领域可以有所体现,比如编辑结合对专业内容的“前理解”、对作者与读者需求的调查,自主地对出版资源进行标引工作,定义自己的XML扩展标记,从而形成信息数据化的管理架构。当然具体来说还有一些需要注意的事情,比如像西方古典音乐这样的严肃音乐出版内容,其资源的整合就不会像流行音乐中“单曲和专辑”那样简单明了。如果将某部组曲,或者规范的四乐章交响曲,又或古典主义奏鸣曲定义为独立的标记,那么标记之内嵌套的子标记就要是完整作品之下的某个单曲小品或某个乐章,再往下才可能是对作品的内部结构的标记。而从曲式与音乐作品分析的视角来看,单曲小品和乐章的划分与排序,本身就有着很重要的结构意义。若出版人员将这类单乐章、单曲小品视同于流行歌中的“单曲”并纯粹地将其作为元数据加以标引和处理,就显得缺乏一定的音乐专业的意识。这也从另一个角度说明,策划编辑的元数据处理和内容编辑的文本结构数据处理,本应当无缝对接、有机融合。所以,恰是XML这样的文本和数据处理工具在思想上启发我们:未来应当有一种“融合编辑”的角色,这种角色应当具有数据库的管理思想并能使之渗入宏观的策划与微观的内容编校工作。 简单概括来说,出版技术发展的趋势是趋于实现更加有效的查询与匹配。基于XML的挖掘——聚类、分类与信息提取——为我们提供了多种出版效益模式的可能性。数字出版人才既要人文学科式地从质化的角度纵深认识每项专业内容的信息层面,做好数字内容的标引工作(如对XML标记的扩展描述),又要自然科学式地敢于接纳量化的工具与思想。后一方面是本文尤其想强调的,例如:“分类”挖掘是基于门类专业纵深的预定义(如参照已经标准化的MusicXML的标记)去对文本进行分类与匹配,“聚类”挖掘是在海量资源的基础上更客观地实现自动化分类,“发现XML文档间隐含的知识,确定XML文档内标记的真实语义信息,为语义网的发展奠定坚实基础”。①《XML挖掘:聚类、分类与信息提取》,第26页。

文章来源:《信息系统工程》 网址: http://www.xxxtgc.cn/qikandaodu/2020/0812/563.html



上一篇:数字化技术在非物质文化遗产保护中的应用 —
下一篇:转型升级正当时——广西二七二地质队综合改革

信息系统工程投稿 | 信息系统工程编辑部| 信息系统工程版面费 | 信息系统工程论文发表 | 信息系统工程最新目录
Copyright © 2018 《信息系统工程》杂志社 版权所有
投稿电话: 投稿邮箱: