不同情绪状态下汉语语音的声学特征分析
王春兰
摘 要:文章通过对正常、大声两种说话状态下的普通话的声强、基频、共振峰等声学参数的比对分析,综合比较了各个参数的变化规律,经过实验之后,发现大声说话时的语音并不是正常说话时语音的简单放大,两者不仅在声强上存在着差别,同时在频率域上也发生了重要的变化。同一人在不同状态下发音时的频谱特征差异较大,在同种状态下发音时的相似性和可比性比较强,为此,在声纹鉴定的过程中应当尽量选取状态相同的语音进行比对分析。
关键词:正常说话;大声说话;声纹鉴定;声学分析
中图分类号:O42 文献标志码:A 文章编号:2095-2945(2017)35-0007-03
1 声纹鉴定的优势、法律意义及研究现状
声纹鉴定的优势:
声纹是由声谱仪显示出来的、带有许多言语声学信息的语音声波图谱的统称,它是各种反映声学特征的图谱的综合表现,在语音学中将其形象地称为语图,在刑事科学技术和司法鉴定方面,人们比照着指纹把它形象地称为声纹[1],声纹所具有的两大特点较为突出且利用价值高,即特定性和相对稳定性[2]。当前我国的声纹鉴定技术逐渐发展壮大为一门中独立的学科,主要应用于刑事科学技术的侦查以及司法鉴定,对于解决许多传统刑侦手段无法解决的问题有无可比拟的优势,例如电话作案的电信网络诈骗犯罪、鉴定法庭上的录音证据的真伪等方面[3]。
在声纹鉴定技术的实践或者侦破案件的过程中一般都会遇到这样的情况:在检材录音的过程中,因为犯罪嫌疑人或者当事人当时的情绪比较激动,音量提高,有时由于愤怒可能还会喊叫;而嫌疑人或者当事人在录制语音样本的时,情绪比较低落,说话音量会比较小,又或者情况会恰恰相反,语音检材中的音量相对正常,语音样本中的音量却很大。本文通过实验研究对比在大声和正常两种说话状态下,声纹特征的变化情况。
2 实验设计
根据语音鉴定相关标准,实验以普通话中的四个汉字“办”、“到”、“我”、“客”为研究对象,通过比对分析发音人在正常和大声两种不同说话状态下的发音,找出声学参数的变化规律,为在不同的音量状态下的语音鉴定提供一定的理论依据。
2.1 实验前准备
设备、发音人、录音内容:
实验需要VS99语音工作站和Praat语音分析软件。找普通话标准的10个人(五个男生,五个女生),分别在正常与大声状态下说相同的内容进行录音。最后选取8个人(四个男生,四个女生)的录音进行剪辑并实验分析。录音内容为两句话:“这事我办不到!”“不要怪我不客气!”。
2.2 实验语音材料的处理
语音材料降噪剪辑:
在采样频率为44100Hz的情况下,对所录的实验语音材料进行必要的降噪处理,并将降噪后的实验语音材料中的“办”、“到”、“我”、“客”进行剪辑。
2.3 实验分析过程
在以下分析中,B代表男生(Boy),G代表女生(Girl),N代表正常说话(Normal volume ), L代表大声说话(Loud volume),在变化的平均数值中,+代表升高,-代表降低。
2.3.1 声强(intensity)
实验中测量了8位发音人(4位女生,4位男生)在正常和大声说话时发“客”、“我”、“办”、“到”时声强的平均值,得到结论是8位发音人的4个汉字的声强的平均数值均随音量的增加而提高。
2.3.2 基频(f0)
图1(a)、(b)、(c)、(d)为分析基频时的部分实验截图,分别代表B2与G1在正常与大声两种说话状态时发“我”与“办”的窄带语图,其他具体实验数据见表1。
表1是8位发音人在两种不同状态下发四个汉字时的f0的平均值。从表中可以看出,相比正常说话而言,大声说话时所有发音人的四个汉字的f0均有一定程度的提高。
共振峰是同一鉴定时非常重要的声纹参数,下面分别对F1~F4进行分析。
2.3.3 第一共振峰(F1)
图2(a)、(b)、(c)、(d)为分析第一共振峰F1时的部分实验截图,分别代表B3与G2分别在正常与大声两种说话状态时发“到”与“客”的宽带语图。
表2是8位发音人两种状态下发四个汉字的F1的变化情况。很明显,男生四个汉字的F1均随音量的增加而提高。女生除“客”略有下降(-24.5Hz)外,其他三个汉字的F1普遍升高。
2.3.4 第二共振峰(F2)
对各发音人的两种状态下测量各音节的第二共振峰F2时发现,男生除“办”有所降低(-9.2Hz)外,其他三個汉字的F2均有所升高;女生除“我”略有下降(-12.5Hz),其他三个汉字均有不同程度的升高。
2.3.5 高级共振峰(F3、F4)
对各发音人的两种状态下测量各音节的第二共振峰F3时同样发现男生除“办”有所降低(-12.7Hz)外,其他三个汉字的F3均有所升高;女生除“我”略有下降(-8.0Hz),其他三个汉字均有不同程度的升高。经过分析发现,F4也有类似的结果。
3 实验总结
由以上的实验分析可知,大声说话时的语音与正常语音经过简单地放大之后并不完全相同,因为大声说话时声强升高,在频率和共振峰上也有明显的变化。
第一,随着音量的提高,声带的紧张程度会增大,同一个体的不同汉字的f0更趋于一致,因此,我们不能轻易依据发声类型和f0的差异而做出同一鉴定的否定判断。
第二,正常与大声说话两种状态下的语音频谱发生了不同程度的变化,共振峰不仅会发生整体规律性的变化(如F1,F2),同时还会发生个体性变化(如F3)。因此,在做同一鉴定时,应该尽量保证样本和检材的音量相近。
最后,本次实验是在较理想的环境下进行的,实践中往往还会伴有许多其他的影响因素,如发音人的情绪(比如高兴、愤怒)、伪装的方式、录音环境、录音器材等本文未加考虑。
参考文献:
[1]曹剑芬.现代语音研究与探索[M].北京:商务印书馆,2007.
[2]孔江平.论语言发声[M].北京:中央民族大学出版社,2001:23-27.
[3]王士元,彭刚.语言、语音与技术[M].上海:上海教育出版社,2006.endprint