太阳鲸

反逆白黑/朱修不完全整理见合集,主播士潇,《棠棣》七九,《花亦山》玉泽右向,凌玉/忱玉杂食向,关注请注意

[反逆白黑]用Praat分析北美版朱修“攻”“受”音的声学特征(一)

场景取自R1第14话著名的“你不在”:



格式工厂截取4:46-5:18,输出格式WAV,采样率44100Hz,单声道。

 为了让大家有个参考大鲸把这段剪辑上传到百度云了,下载地址 (密码:72rn)

 

缘起:虽然润润和考哥堪称天作之合,然而大鲸私心还是比较喜欢约翰尼和尤里的北美版配音,那天想了一下原因,可能给我感觉这对的朱雀鲁鲁配音“攻受感”更鲜明。

 

然而“攻受感”这玩意儿是个很主观的东西,大鲸有个简单的猜测:首先从超音段特征来讲,攻音的声调应该更低一些;从音段特征来讲,辅音能量更大,元音共振峰分布频率更低。这些乱七八糟的东西大家看不懂没什么,其实简单就一句话:攻声音更男人

 

然而尤里的声音真的要比约翰尼更攻吗?换句话说,大鲸的那几个预测真的符合事实吗?要知道耳朵是会骗人的,然而机器不会,所以大鲸就用一个全世界语音学家都在用(因为免费)的语音分析软件Praat(引用一)来对一段WAV格式的音频进行了简单的segmentation(语音分段?真不知道该咋翻译……后面也会有很多的英文乱入主要是每个单词都去查实在太麻烦了而且也未必准确),然后主要从三个方面入手对声谱图进行分析:(1)声调(Pitch),也就是基频(F0);(2)浊辅音的Voiced-Bar(大概在F1的位置出现,能够体现声带振动的能量);(3)元音的第一第二(或许有第三,看情况)共振峰的频率分布(声线越男人,F1和F2的位置应该越低,当然这针对的是同一种元音,不同元音不能比较,好在这俩讲的都是美式英语)。

 

当然,因为论证相当繁琐,如果你只关心结果,你可以跳过全部过程,直接拉到最下面。(不过大鲸这是第一部分,所以你也只能看到第一部分的结论)

如果你同时也对语音学、声学和物理学饶有兴趣,不妨都看了,包你干货吃得爽。

 

好了废话不多说我们现在开始:

 

Praat打开之后,读取目标声音文件并创建TextGrid,两个interval tier分别用来进行键入文本和segmentation的,也就是说上面那行相当于字幕,下面那行是用IPA进行的语音分段。


声音文件和TextGrid一起打开看是这个样子的:


上面是波形图,下面那个就是spectrogram(声谱图,我也不知道这个翻译对不对……),我们放大到十秒内spectrogram就能显示出来了:

大家看到那条蓝色的线了吗?那个就是声调(pitch),Praat里面它和基频(F0)是不区分的(具体怎么区分大鲸也不知道……)之前大鲸的预测是攻音的基频要比受音低,当然这段材料截取得其实并不好,朱雀大部分是问句,问句会影响声调走高(你看那个Lelouch?结尾的部分,你能相信大鲸已经把pitch的最大取值调到400 Hz了吗???大鲸身为母的最高pitch也不过300 Hz而已),所以可能会影响结果。因此我们待会测量元音共振峰尽量选陈述句的元音,或者疑问句也可以,只要不带lexical phrasal stress就行,比如鲁路修的这句“anything unusual three?”越到后面的元音越不能用,会受到prominence的影响。

 

然后进入segmentation的部分,前面说到我们有两个要观察的对象:浊辅音voiced-bar的能量(intensity,amplitude都可以,Praat里面使用的是前者)和元音第一第二共振峰。我们先把浊辅音和元音在第二层tier里面标记出来:

 

我们就用这个典型的“咦咦咦咦咦咦咦咦你不在我不在。”这个句子经典是经典,但我相信所有搞语音分段的人见到这种句子都想骂娘:


TMD一个爆破音没有!开头就给老子上Approximant(/j/)!全程就俩辅音,还特么是俩sonorant辅音(响音辅音)!摩擦音往往见了就跟爹一样亲,偏偏选了一个最没用的Glottal Fricative(喉音摩擦音)!其实一句话就是语音分段的难度相当之大,鲸表示终于找到了从尤里这句狗粮告白单曲循环中走出的良药。

 

然而好在我们重点考察的/n/,因为有anti-format的存在,还是比较好划分的。为什么重点考察/n/呢?大鲸前面假设已经提到过了,目标是浊辅音的能量,然而纵观浊辅音,没有哪个辅音比鼻音辅音更有说服力——爆破音能量只在release一瞬间,塞擦音能量波动太大,所以一个低调的nasal正是我们喜闻乐见的。(然而这个出发点其实是错的!大家注意,随后的数据证明大鲸这部分的假设是有问题在里面的。)

 

于是我们选中/n/所在的区域用Praat自带的tracker生成intensity,也就是能量,得出数值:


然后因为voiced-bar分布在元音第一共振峰也就是F1的位置,我们继续用自带的tracker生成F1数值:


大家看到那一排红点点了吗?那个就是Format,因为/n/在F2和F3上都有anti效应,所以我们重点考察F1,得到一个保留到小数点后二位约等于412.68 Hz的数值。

 

在这里大鲸插一句:有很多coarticulation的边界非常不好区分,这种情况下大鲸都是采取了Turk(2006)对于consonant closure怎么标onset和offset的标准,详情见引用二。(然而其实这些都无甚所谓)

 

接下来要做的就是重复性工作了,因为单样本毕竟不可靠,大鲸照着上面的步骤分别测量了这段话里约翰尼三个nasals(讲电话的声音不能用,响度会降低)和尤里的另外两个nasals,Excel数据列表如下: 


大鲸定睛一看:这数据不对啊!

 

虽然F1的结果符合猜测(攻的F1更低),但是intensity却和预测(攻的intensity更高)相反。

 

大鲸仔细想了想原因,恍然大悟,应该是nasal这个样本自带的特殊性决定的。

 

Nasal是神马?鼻音啊!!!

 

大家还记得平时听的Drama不?小受那撩人的声音?有很多都是鼻音的效果啊!!

 

鲁路修的声音比朱雀带点鼻音怎么了??这难道不符合预测吗??雀仔服过役,成天拉着嗓子喊口号,早就练就了一副Breathy voice,怎么会有那种能够把你浑身上下的神经全部撩起来的软媚鼻音??而鲁路修,为了抚慰他成天打打杀杀的男人,在床上惯用共鸣腔给雀仔一点帮他全身放松下来的福利,久而久之把鼻音带到了平时说话的声线特征里,这个结果其实反而是大大的符合预测啊!!


鲸已经看到学过语音学的人投来的鄙视眼神了,没关系,就是图个乐子,顺便告诉大家学术界的一半以上paper是怎么发表的——数据不符合预期,我就强行解释成符合预期嘛23333。


不过intensity暂且不提,F1还是符合预测的,并且前者能够解释为“强则鼻音的感知特征更强并没有错”,后者却是实实在在说明了一个发声腔特征的问题——更多数据还是要看元音的测量结果。这也就是为什么大鲸前面讲到“考察浊辅音响度这个出发点就是错的”,因为浊辅音的intensity太受制于这个辅音本身的发音特征了,就好比考察送气爆破音release的强度,值高则只能说明送气比较多,感知上来说没有太大的差别。nasal可能会影响感知,但受制于其鼻音的本质,intensity却也不能与“雄浑有力”有直接挂钩。不过我们还是很乐意看到鲁路修比朱雀有着更重的鼻音这种让人浮想联翩浑身酥软的结论的。

 

请大家敬请期待下一期:关于元音和基频的探讨。

 

References

 

Boersma, Paul & Weenink, David (2016).Praat: doing phonetics by computer [Computer

program]. Version 6.0.22, retrieved 15November 2016 from https://www.praat.org/

Turk, A., Nakai, S., & Sugahara, M.(2006). Acoustic segment durations in prosodic research: A practical guide.Methods in empirical prosody research, 3, 1-28.

 

 

---------------------

最后一句:我特么是有多无聊才在手头一堆坑的情况下搞这个毛线。


评论(27)
热度(117)
  1. 共8人收藏了此文字
只展示最近三个月数据

© 太阳鲸 | Powered by LOFTER