textgrid文件說明
第一行是固定的:File type = "ooTextFile"
第二行也是固定的:Object class = "TextGrid"
空一行
xmin = xxxx.xxxx # 表示開始時間
xmax = xxxx.xxxx # 表示結束時間
tiers? <exists> # 這一行固定
size = 4 # 表示這個文件有幾個item, item也叫tiers, 可以翻譯為'層', 這個值是幾,就表示有幾個item
item []:
item [1]:
class = "IntervalTier"
name = "phone"
xmin = 1358.8925
xmax = 1422.5525
intervals: size = 104
intervals [1]:
xmin = 1358.8925
xmax = 1361.8925
text = "sil"
intervals [2]:
xmin = 1361.8925
xmax = 1362.0125
text = "R"
intervals [3]:
...
intervals [104]:
xmin = 1422.2325
xmax = 1422.5525
text = "sil"
item [2]:
class = "IntervalTier"
name = "word"
xmin = 1358.8925
xmax = 1422.5525
intervals: size = 3
intervals [1]:
xmin = 1358.8925
xmax = 1361.8925
text = "sp"
textgrid文件中的size的值是幾就表示有幾個item, 每個item下面包含class, name, xmin, xmax, intervals的鍵值對,
item中的size是幾就表示這個item中有幾個intervals, 每個intervals有xmin, xmax, text三個鍵值參數.
所有item中的xmax-xmin的值是一樣的
代碼生成
#! /usr/bin/env python
# -*- coding: utf-8 -*-#
# -------------------------------------------------------------------------------
# Name: demo
# Author: yunhgu
# Date: 2021/8/24 10:56
# Description:
# -------------------------------------------------------------------------------
import textgrid
# 讀取音頻文件給定最大時長
tg = textgrid.TextGrid(minTime=0, maxTime=2)
print(tg.__dict__)
tier_word = textgrid.IntervalTier(name="word", minTime=0., maxTime=2) # 添加一層,命名為word層
tier_phone = textgrid.IntervalTier(name="phone", minTime=0., maxTime=2) # 添加一層,命名為phone音素層
# 添加分割線
interval = textgrid.Interval(minTime=0, maxTime=2, mark="s")
interval2 = textgrid.Interval(minTime=1, maxTime=2, mark="asdfas")
tier_word.addInterval(interval)
tier_phone.addInterval(interval2)
# 添加到tg對象中
tg.tiers.append(tier_word)
tg.tiers.append(tier_phone)
print(tg.__dict__)
# 寫入保存
tg.write("1.TextGrid")
生成圖片樣例
問題
一般意義上textgrid時間上是不可以有重疊部分的,textgrid,設置了嚴格性參數,默認為True.
因此如果允許時間上有重疊的話,可以:
tier_text = textgrid.IntervalTier(name="文本", minTime=min_time, maxTime=max_time)
tier_text.strict = False