DAICWOZ数据集官方文档翻译
DAIC_WOZ数据集官方文档翻译
- 前言
- DAIC-WOZ Depression Database
- 数据说明
- Auido File
前言
本人是做语音抑郁分析的新手,DAIC_WOZ数据集是刚刚接触到,在网上搜了一下官方文档的翻译,基本上都是机翻,非常影响阅读,所以自己手动翻译了一下,因为本人是做音频方面,所以暂时只翻译了官方文档上音频文件相关的部分,翻译的不合理的地方,还请大家在评论里指出。
DAIC-WOZ Depression Database
此数据库是一个大型语料库的一部分,疾病分析访谈语料库(DAIC,the Distress Analysis Interview Corpus),其中包括临床访谈,旨在支持诊断心理困扰状况,如焦虑、抑郁和创伤后应激障碍。收集这些访谈是为了创建一个用于确定精神疾病的语言和非语言指标的计算机代理。收集的数据包括录音、录像和广泛的问卷答复;这部分语料库包括The Wizard of Oz访谈(《The Wizard of Oz》:绿野仙踪),由一位名叫Ellie的动画虚拟面试官主持,Ellie由另一个房间的面试官控制,数据已被转录和注释以用于各种文本和非文本特征。
数据说明
数据包括300-492共189段会话,由于技术原因,某些会话被排除在外(见下文),数据按照会话进行分组。

排除的会话:342,394,398,460;
包括特别说明的会话:
- 373 — 由于技术人员进入录音室处理技术问题,会话在5:52—7:00处被中断,the session continuous and completes (应该是在处理技术问题的过程中录音仍持续并 完成)。
- 444 — 由于参与者的电话响了,实验成员进入房间帮助他们关掉电话,会话在4:46 —6:27处被中断,the session continuous and completes.
- 451,458,480 — 会话在技术上是完整的,但丢失了Ellie(虚拟面试官)部分的手抄 本,参与者的手抄本仍然包括在内,但没有面试官的问题。
- 402 — 视频录制在对话结束前剪切了约2分钟。
Auido File
语音片段使用头戴麦克风(森海塞尔HSP4-EW-3)在16kHz条件下的录音。音频文件可能包含少量虚拟面试官的语音;在处理过程时,请使用文字记录文件来缓解此问题,可识别的话语被从录音中删除,即波形在相应的时间内被调零,使用转录文件和关键字“scrubbed_entry”来识别这些实例,经过擦洗的条目也会在特征文件中归零。
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
