Praat语音标注

基本操作

  1. 打开Praat,关掉“Praat Picture”窗口
  2. Open -> Read from file -> 选择一个语音文件,m4a文件需要转换成mp3或wav格式

3.Annotate -> To TextGrid

4.输入每层tier的名称,用空格隔开(纯基础转写不涉及point tiers,空着就行;point tiers就是标注一段sequence中的一个点,e.g., utterance/stress/Yes/No)

图示的tier名称其实并不理想,长度最好还是两三个字符,例如“S1 S2”

5.选中音频与TextGrid文件 -> View & Edit

6.可见范围放大到10秒以下,记得随手保存,开始分割句子并转写出文字或音素

7.保存:File -> Save TextGrid as Text File,确保TextGrid文件与音频文件名称一致

TextGrid转TXT Script

推荐脚本:save_conversation_tiers_as_text_file.praat by Mietta Lennes

注:TextGrid中输入的“”会.txt文件吞掉,如果出现符号error则需要回到TextGrid中删除无法识别的符号。

Tips

  1. 不止语气词,语法错(e.g., run-on sentences)也应如实转写;
  1. 蓝色的音高曲线能帮助精确句子的起始与结尾,对更加“抑扬顿挫”的语言来说效果拔群;
  1. 摩擦音的词句频率更高,因此在spectrum“上方”呈暗色,可借此确定词句边界:

如上图,0.4秒的红色选中区域为「し(shi)んぱい」一词。两个红圈分别指出该词的起始、以及接续该词的下一个假名(し)的起始,以此确定「しんぱい」发音的边界;

4.一个语句segment最好不超过四秒;

5.保存!备份!