基本操作
- 打开Praat,关掉“Praat Picture”窗口
- Open -> Read from file -> 选择一个语音文件,m4a文件需要转换成mp3或wav格式
3.Annotate -> To TextGrid
4.输入每层tier的名称,用空格隔开(纯基础转写不涉及point tiers,空着就行;point tiers就是标注一段sequence中的一个点,e.g., utterance/stress/Yes/No)
图示的tier名称其实并不理想,长度最好还是两三个字符,例如“S1 S2”
5.选中音频与TextGrid文件 -> View & Edit
6.可见范围放大到10秒以下,记得随手保存,开始分割句子并转写出文字或音素
7.保存:File -> Save TextGrid as Text File,确保TextGrid文件与音频文件名称一致
TextGrid转TXT Script
推荐脚本:save_conversation_tiers_as_text_file.praat by Mietta Lennes
注:TextGrid中输入的“”会.txt文件吞掉,如果出现符号error则需要回到TextGrid中删除无法识别的符号。
Tips
- 不止语气词,语法错(e.g., run-on sentences)也应如实转写;
- 蓝色的音高曲线能帮助精确句子的起始与结尾,对更加“抑扬顿挫”的语言来说效果拔群;
- 摩擦音的词句频率更高,因此在spectrum“上方”呈暗色,可借此确定词句边界:
如上图,0.4秒的红色选中区域为「し(shi)んぱい」一词。两个红圈分别指出该词的起始、以及接续该词的下一个假名(し)的起始,以此确定「しんぱい」发音的边界;
4.一个语句segment最好不超过四秒;
5.保存!备份!