python生成textgrid文件


textgrid文件說明

第一行是固定的:File type = "ooTextFile"
第二行也是固定的:Object class = "TextGrid"
空一行
xmin = xxxx.xxxx  # 表示開始時間
xmax = xxxx.xxxx  # 表示結束時間
tiers? <exists>  # 這一行固定
size = 4     # 表示這個文件有幾個item, item也叫tiers, 可以翻譯為'層', 這個值是幾,就表示有幾個item
item []:
    item [1]:
        class = "IntervalTier"
        name = "phone"
        xmin = 1358.8925
        xmax = 1422.5525
        intervals: size = 104
        intervals [1]:
            xmin = 1358.8925
            xmax = 1361.8925
            text = "sil"
        intervals [2]:
            xmin = 1361.8925
            xmax = 1362.0125
            text = "R"
        intervals [3]:
            ...
        intervals [104]:
            xmin = 1422.2325
            xmax = 1422.5525
            text = "sil"
    item [2]:
        class = "IntervalTier"
        name = "word"
        xmin = 1358.8925
        xmax = 1422.5525
        intervals: size = 3
        intervals [1]:
            xmin = 1358.8925
            xmax = 1361.8925
            text = "sp"

textgrid文件中的size的值是幾就表示有幾個item, 每個item下面包含class, name, xmin, xmax, intervals的鍵值對,
item中的size是幾就表示這個item中有幾個intervals, 每個intervals有xmin, xmax, text三個鍵值參數.
所有item中的xmax-xmin的值是一樣的

代碼生成

#! /usr/bin/env python
# -*- coding: utf-8 -*-#

# -------------------------------------------------------------------------------
# Name:         demo
# Author:       yunhgu
# Date:         2021/8/24 10:56
# Description: 
# -------------------------------------------------------------------------------
import textgrid

# 讀取音頻文件給定最大時長
tg = textgrid.TextGrid(minTime=0, maxTime=2)
print(tg.__dict__)

tier_word = textgrid.IntervalTier(name="word", minTime=0., maxTime=2)  # 添加一層,命名為word層
tier_phone = textgrid.IntervalTier(name="phone", minTime=0., maxTime=2)  # 添加一層,命名為phone音素層

# 添加分割線
interval = textgrid.Interval(minTime=0, maxTime=2, mark="s")
interval2 = textgrid.Interval(minTime=1, maxTime=2, mark="asdfas")
tier_word.addInterval(interval)
tier_phone.addInterval(interval2)

# 添加到tg對象中
tg.tiers.append(tier_word)
tg.tiers.append(tier_phone)

print(tg.__dict__)
# 寫入保存
tg.write("1.TextGrid")

生成圖片樣例
image

問題

一般意義上textgrid時間上是不可以有重疊部分的,textgrid,設置了嚴格性參數,默認為True.
image
因此如果允許時間上有重疊的話,可以:

tier_text = textgrid.IntervalTier(name="文本", minTime=min_time, maxTime=max_time)
tier_text.strict = False


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM