假如我们参加一个婚礼,当新郎和新娘站在他们的家人和亲友,过往甜蜜的日子浮现在眼前,发出充满希望和爱的宣言,如果此时响起的音乐是西游记主题曲,大家还会留下幸福的泪水么。又假如当Jack慢慢消失在冰冷的北大西洋海水中,将生存的希望留给Rose,此时影院里响起的不是“My heart will go on”而是"Let it go",你会不会怒而退票。
如果把音乐看做一种复杂而有序的声音信号,人体内似乎存在感知这种信号的方式。而我们欣赏音乐的方式与我们的人种差异,教育程度,年龄大小无关,就好像这是我们与生俱来的天赋。那到底这些信号是如何和人的情绪联系起来的呢?
音乐应该是一个复杂的系统,包括诸多元素,到底是哪个或是哪些元素会在大脑哪些部位产生刺激?为什么不同文化背景的人会对不同的音乐形式感知有偏好?比如有人钟情古典音乐,却对流行音乐不为所动。有人偏好Jazz或Rap,而另外的更喜欢Rock & Roll。人是从什么时候开始形成感知音乐的机制?这种信号反馈机制是先天还是需要后天习得?音乐的不同元素是如何转变成大脑的神经信号,并产生情绪反应的?
音乐的感知
音乐是一种有组织的声音,由诸多元素组成,包括音调,节奏,节拍,音色,旋律,响度,混响以及轮廓和空间位置等。往往这些元素不是单独表现,而是以融合形式表现出来。
经历成千上万年的进化,人的听觉系统可以将外界所有的声音进行分组。大脑默认听到的声音来自于一个声源,并通过一种类似于似然算法解析这个声音是否来自同一个声源。而且这是一个无意识的过程,即便一个没有受到专业的音乐训练的人也能分辨出两种同时演奏的乐器声音。而当不同的乐器同时演奏一个音符的时候,大脑却无法分辨。因为听觉系统对时间间隔很敏感,最低的分辨极限大约几毫秒。然而因为泛音的存在,我们依然能够分辨不同的乐器。
相较于对时间的敏感度,听觉系统对空间的感觉可以说很迟钝,我们很难分辨单音节的音调高低,但是我们对一个音节相对于邻近的音节的高低变化却很敏感。这也是为什么我们不管按什么调起,都能够完整的把生日歌唱出来。而且这也是为什么大合唱的领唱人很重要了,起音准才能让后面的跟唱的人不跑调。
人的大脑按功能可以分为四瓣:额叶,颞叶,顶叶,枕叶和小脑。简单来说额叶负责感知各种外界的信号,颞叶负责听觉和记忆,顶叶参与运动和空间感知,枕叶与视觉相关,小脑作为大脑最保守的区域,与情绪和运动相关[1]。
由于音乐是融合了各种元素的整体,起初人们认为大脑处理音乐是简单的单核处理。然而后来才发现对音乐的处理比想象中要复杂,涉及到大脑几乎所有的区域和神经系统。而且是采用特征提取和功能整合方式处理音乐:
首先大脑具备一套完善的音乐元素分析机制,将一段音乐信号还原成最基本的元素,然后将这些基本的信号呈递给大脑不同的区域,由不同的神经系统并行处理,互不干扰,这是一种自下而上的处理过程;这些基本的感知系统处理不同元素是一种低级的加工过程,大脑会收集所有反馈的信息,进行高级的分析,整合后才能形成对音乐完整的理解。音乐是一个连续的过程,大脑提取这些信号进行初级分析的同时,高级处理部分也会获得源源不断的信息,整合得到的前一秒的信息会不断被更新,并且预测接下来会是什么[1]。
大脑感知音乐信号是通过听觉通路(皮层下耳蜗核——脑干——小脑——听觉皮层)实现。对于一段熟悉的音乐,还会涉及到大脑的记忆系统,包括海马左边区域和额叶下皮层,而对于一段未知的旋律,则会激活海马右边区域。当我们跟随音乐的节奏打拍子或只是在心中默念,还会涉及到小脑的定时回路。而演奏音乐,不管是任何乐器,演唱或是指挥,会激活额叶和顶叶的运动皮层区域和感觉皮层区。阅读乐谱则会激活视觉皮层区。理解或回忆歌词的时候则会激活颞叶和顶叶的语言中枢[1]。
听觉皮层(Auditory cortex)是大脑处理音乐的核心,位于侧裂的上颞平面。音乐的很多元素的处理都是在这一区域。感受音调从高到低的神经元在听觉皮层,而且音调的处理有层级关系,前额皮层和丘脑判断音调,颞横回感受固定的音调,次级听觉皮层的后部感受音调高度,前部感受音调集合。音色的感知主要是激活大脑的感觉皮层区和小脑的感知区域,包括颞上回和颞横回。音程和轮廓主要是在听觉皮层颞上回和颞上回前侧。节奏的感知也是具有层级性,会激活大脑感知皮层区和躯体运动皮层相关区域,基底神经节和小脑,影响皮层下情绪相关的区域活动。对于更复杂的和弦,则会激活杏仁核,压后皮质区,脑干和小脑[1-3]。
文化还是自然?
这个问题一直存在争议。有人认为音乐是与生俱来的,是人的自然属性。迄今为止人类社会诞生了无数种的音乐形式,并且无独有偶这些音乐都具有共同的“内在核心属性”,并且一直保持不变。这种音乐的“自然属性”是我们在发育早期对音乐认知的一种能力,与“语言习得机制”一样,称为“音乐习得机制”,但是特定的音乐学习还需要后天的培养。
有人则认为音乐是文化性的,可变的,很难用一般的科学术语解释的,是已知的人类社会中与音乐相关的一切普遍性为。但是这里的“音乐”并不仅仅是声音,而是记录在特定的文化背景下的与音乐活动相关的声音。想要了解这种“音乐”,必须长期浸淫在这样的文化中,而且要尝试着感受各种乐器以及特定行为所传达的意义。这是人类很长一段时间内所遵循的模式,直到最近几百年随着音乐成为商品化听觉的消耗品,这种音乐本身和人的社会活动之间的关联才逐渐淡化。但是不可否认,音乐和人类活动的不可分割的特性也赋予了音乐的时代和文化特征。不管是与死者交流还是他人建立社交关系,音乐在其中扮演重要的角色,尽管这些“音乐”没有明确的意义,但是却是至关重要的[4]。
音乐的意义不仅源于社会背景不同,同时对音乐认知也可以追溯到个体与个体差异。和语言类似,音调和节奏是音乐最基本的“语法”,通常这也是区别特定文化背景下不同音乐类型的重要标志。现代语言学家和心理学家Noam Chomsky认为我们在出生时就具备理解世界上任何一种语言的内在能力,但是在特定的语言环境里,那些不必要的神经回路会被削弱甚至放弃,而那种特定语言的感知机制则会被加强。音乐也是如此,在特定文化内音乐环境下形成的音乐认知系统会逐渐降低对外来音乐结构感知的敏感度,在出生后的一年内大脑的神经元快速的生长,听觉系统就已经建立起来。经过童年,我们熟悉的或是经常使用的神经回路会得到加强,而其他的则会被削弱[5]。而正是这个时候,是我们对音乐的喜好建立的拐点。这也许就是我们成年以后建立对音乐喜好,被什么样的音乐所感动以及音乐是如何打动我们的根本原因。但是这并不意味着成年以后我们就丧失了对其他音乐形式的感知系统,就像电脑一样使用二进制作为基本语言一样,音乐感知的基本功能是一样的,只是刚出生时候大脑的内存比较大,读写速度快。成年后需要更加频繁的刺激才能建立起新的音乐形式的感知系统。
幻觉和期望
音乐的神秘之处是大脑可以将这些特定的声音信号转化成经验的情绪反应。那么大脑又是如何知道呢?如果音乐被认为是大脑将一种情绪错觉强加到一串特定结构和序列的声音上。大脑将音乐和现实生活中的其他元素整合到神经代码里面,作曲家尽管不知道神经代码是如何工作的,但是却知道如何使用不同的音色搭配和音符长段,音调高低,音量大小的改变(”幻觉“)来传达人类快乐,悲伤,惊喜,恐惧等许多不同的情感的经验(”期望“)。
那么,作曲家是如何制造我们听觉的“幻觉”呢?大脑的认知来自一连串的神经元活动并最后合并形成的一个瞬时的影像,这种感官的直觉很多时候给我们一种误导。大多数我们听到是声音都是支离破碎的,就像远古时候我们听到躲藏在树林背后的老虎的低吟,草丛里狮子的嘶吼的声音都是残缺不全的声音,而且受到环境干扰。我们的感知系统能够恢复丢失的信息,帮助我们在威胁来临的情况下迅速作出决策。感知系统在无意识情况下将将破碎的信息填满,并呈现出来。作曲家正是利用了这个漏洞欺骗了听觉系统,一段旋律即使是其他的旋律打断了,听觉系统还是能把这段旋律填满。比如钢琴和低音提琴最低音频率大概在30赫兹左右,实际上他们是无法发出那么低频的声音的,我们的听觉系统会自动补充,制造出低音的效果。比如 Eagles’ 的这首“One of These Nights”
虾米音乐播放器的前奏巧妙地利用贝斯的单音和吉他滑弦的结合给人造成一种低音滑动的错觉。现代的录音和麦克风技术也善于利用这个把戏,巧妙地利用人工混响让声音听起来充满立体感。
音乐造成的最大的幻觉还是而通过对单个的音符和旋律的改变达到对整个作品的结构和形式的期望的变化。操纵听众的期望成了音乐的核心,西方古典音乐中最常用的手段是假终止式,一个终止式旋律往往带着一个结束曲子的期望,而作者往往在最后使用一个意想不到的音符来影响听众的情绪,告诉他们还没结束呢。以欢乐颂为例:
mi - mi - fa - sol - sol - fa - me - re - do - do -re - mi - mi - re - re
mi - mi - fa - sol - sol - fa - me - re - do - do -re - mi - re - do - do
贝多芬在第一小节的开始和结尾巧妙的使用一个非常规的音符违反了我们的预期来达到效果,以mi而不是do起,然后逐步上升,然后下降到do,但此时并没有停止,而是继续上升到开始的mi,然后又开始下降,我们以为又会降到do,而他却停在了re。第二小节,前面重复第一小节,到最后在停在了do,才满足大家的期望。
为什么有的音乐可以抚慰人心,而有的音乐令人紧张不安?尽管大多数情况下不同的声音,我们有不同的解读,但是有一点是共同的点:突然,短,响亮的声音对许多动物来说是一种报警信号,例如我们知道汽车短处尖锐的鸣笛意味着危险。而一些舒缓,悠长,安静的声音表达一种平静,至少是中性的状态。这是进化埋藏在我们基因里的对外界环境的经验的情绪反应。作曲者通过操纵期望将这些经验的情绪添加到音乐中。海顿著名的“Surprise Symphony”以柔和的小提琴为主题,伴随短促的拨弦声,这种矛盾给人一种平静的环境中潜伏着危机的感觉。
情绪的机制
音乐激发情绪产生的神经机制的主要是来源功能神经影像学和病变的研究,大多采用PET(Positron Emission Eomography)或fMRI(functional Magnetic Resonance Imaging)。当然因为实验个体的差异和实验思路的不同,得到的结果也不尽相同,不过从已知的研究中也能窥的一些端倪。音乐可以激发所有的边缘和旁边缘大脑结构(limbic and paralimbic brain structures),边缘结构包括杏仁核(Am),伏隔核(NAc)和海马(Hipp),旁边缘大脑结构包括前扣带回(ACC)眼窝前额皮质(OFC)和海马回(PH)和颞极(Temp P)(下图)。其中杏仁核是边缘和旁边缘大脑结构的中心,是情绪唤起,维持和终止的枢纽,可惜我们对他的功能还没有完全了解。
其中伏隔核是大脑奖励机制的中心,激活的伏隔核会影响腹侧被盖区(VTA)和下丘脑(hypothalamus)区域,释放多巴胺,让人感到快乐,形成一个“奖赏回路”(reward circuit)。就像我们赢了一场赌博,或是药物上瘾释放多巴胺一样,让人觉得快乐[6, 7]。
有的研究认为小脑也参与音乐的情绪反应[6],因为小脑和杏仁核之间有丰富的神经元链接,而且小脑空间感知和运动相关,运动和音乐之间的很重要的一个纽带就是时序,这也许就是我们为什么听到MJ的音乐时,会不自主的跟着节拍起舞,释放自己的情绪。
于是,当我们听到贝多芬的欢乐颂时候:
mi - mi - fa - sol - sol - fa - me - re - do - do -re - mi - mi - re - re
mi - mi - fa - sol - sol - fa - me - re - do - do -re - mi - re - do - do
re - re - mi - do - re - mi - fa - mi - do - re - mi - fa - mi - re - do - re - sol
mi - mi - fa - sol - sol - fa - me - re - do - do -re - mi - re - do - do
声音通过空气震动传到鼓膜,鼓膜将信号传递给耳蜗的毛细胞,链接神经突出的毛细胞将振动信号转化为不同频率神经信号,神经信号然后经由脑干传递到听觉皮层。
然后在听觉皮层对音乐的各个元素进行初步的分析:前额皮层和颞横回告诉你里面有哪些频率的声音,然后颞叶的其他部分包括颞上回和颞上沟告诉我们这里面有哪几种音色,海马体在回忆里搜索这些音色对应什么样的乐器,颞叶和顶叶的语言中枢会将这些乐器对应的文字呈现出来,呈现在我们脑海里的是钢琴还是小提琴。这些还只是最基本的处理,接下来额叶皮质和布罗德曼区44和47将音乐的结构解析出来,外侧小脑和小脑蚓部把节奏分析出来。最后,通过边缘和旁边缘大脑结构,与情绪相关的额叶、小脑、杏仁核和伏隔核会受到激发,释放多巴胺,感受到音乐带来的快乐。-
Refs
This is your brain on music——The Science of a Human Obsession. Daniel J. LevitinCurrent Advances in the Cognitive Neuroscience of Music. Daniel J. Levitin and Anna K. TirovolasLarge-scale brain networks emerge from dynamic processing of musical timbre, key and rhythm. Vinoo AlluriMusic, cognition, culture and evolution. Annals of the New York Academy of Sciences
Music and early language acquisition. Anthony Brandt, Molly Gebrian and L.Robert SlevcThe rewards of music listening: Response andphysiological connectivity of the mesolimbic system. Menon, V. and Levitin, D.J.Towards a neural basis of music-evoked emotions. Stefan Koelsch