正式版说话人角色特征标注方法

时间:2021-11-06 11:52:48 资料 我要投稿

正式版说话人角色特征标注方法

计算下列各说话人特征值(建立一个新的excel表格,表格命名为“会议名称_角色特征”,具体参见示例)

说话次数:说话人i在此音频文件中的说话次数(如果同一个说话人中间有不超过3秒的多人重叠语音这样的情况,那在多人重叠语音前后的同一个说话人的发音计为一次说话)

首次说话时间:说话人i在此音频文件中第一次开始发音的时间

相邻两次说话时间间隔的平均值:计算说话人i在此音频文件中各次说话的时间间隔(是指某个说话人的两个相邻turn之间的间隔,第i个turn的起点减去第i-1个turn的http://www.unjs.com终点),然后求取时间间隔的平均值(时间间隔平均值=sum(说话人i各次时间间隔)/(说话人说话次数-1))。

注:turn就是话轮,一个turn就是指一次完整的中间没被他人插话的某个说话人的发言。

单次最大说话时长:统计某个说话人在一次话轮中的最大说话时长。

发音时长(总时长):说话人i各次发音时长的总和(这里的'发音时长指总时长,包括同一个人发音期间出现的静音)。(注:每轮发音最后面的静音、笑声、其他声音等时长不用计算在内)

上次发音后的时间:指第i次(此次)发音开始时的时间点与第i-1次(上次)发音结束的时间点之间的差值。用采样点表示。(以一个话轮为1次发音)

说话人所占时长与语音段数之比:语音段数是指在会议中某个说话人的连续发音时能量不为零的语音段个数,如果一次连续发音时说了一下然后中途停了,出现了1秒或2秒以上的静音,那么就算一个语音段结束了,但是他还在继续发音所以turn没有结束,静音之后出现的语音又是一个语音段了,这样算下去,只要他还在说话没被他人打断,那么该说话人的turn就没增加,但是中途出现的1秒或2秒以上的静音就会使语音段数增加;说话人所占时长是指会议中某个说话人发音总时长。两者之比。

说话有效时长与总时长之比:说话总时长是指某个说话人在会议中连续发音的总时长(包括中间的一些停顿、静音等);说话有效时长是指发音总时长中的语音信息的时长,不包括非语音段的长度(比如静音、笑声等)

语音段数:语音段数是指在会议中某个说话人的连续发音时能量不为零的语音段个数,如果一次连续发音时说了一下然后中途停了,出现了1秒以上的静音(多人重叠语音、笑声、掌声等),那么就算一个语音段结束了,但是他还在继续发音所以turn没有结束,静音之后出现的语音又是一个语音段了

说话人最后一个话轮结束到整个录音结束的时间:整个录音结束时间与某个说话人最后一个话轮结束时间的差值

说话范围:从某个说话人的第一段到最后一段总共的时间,即说话人的最后一个话轮的结束时间与说话人的第一个话轮的开始时间之差。

闲置率:某个说话人的说话范围与总的说话时长(发音时长)的差值

【正式版说话人角色特征标注方法】相关文章:

螺纹画法及标注方法 -工程01-01

把握说话礼仪 不失“角色地位”01-01

试论说话者角色的分离07-19

人的角色作文09-08

AutoCAD尺寸公差标注方法 -工程01-01

沉头孔标注方法 -工程01-01

常用材料标注方法 -工程01-01

说话的方法技巧01-15

AutoCAD公差标注的简单方法 -工程01-01