抖音代碼舞Python3實現


一、背景說明

過年被肺炎困在家里實在無聊,早上想着要做什么的時候突然想到抖音上的代碼舞(我也不知道叫不叫這名字)挺有意思,就來研究一番。

首先要知道Python處理圖片/音視/視頻一般都是pillow/opencv/ffmpeg組合,至於具體代碼不知道這也好解決:內事不決問百度,外事不決問谷歌,碼事不決問github。

至於說不是原創這種事情,冠冕堂皇點說這叫開源精神,投機取巧點說叫微創新,真實點說代碼這東西別人抄得我抄不得?

 

二、項目說明

項目github地址:https://github.com/PrettyUp/CodeDance

2.1 項目目錄結構說明

-CodeDance
 |
 |--bak--原項目的備份文件。刪除無影響。
 |
 |--video
 |  |
 |  |--test.mp4--項目測試使用的原視頻文件
 |  |
 |  |--test-code.mp4--原視頻文件生成的代碼式視頻文件
 |
 |--video_2_code_video.py--實現代碼

 

2.2 開發環境說明

操作系統:Windows7(沒在Linux上確認是否能成功,但就算要調整的應該也不多)

Python版本:Python3.7(Python3.5+應該都沒有問題)

依賴庫:pip install opencv-python pillow

依賴應用: ffpmeg(下載直接解壓、將bin目錄加到PATH環境變量)

 

2.3 使用說明

在config_dict中配置好輸入的視頻文件路徑,直接運行video_2_code_video.py即可。

至於運行效果演示,博客園上傳視頻比較麻煩,可自行對比GitHub項目video目錄下的兩個視頻。

 

三、實現源代碼

import argparse
import os
import cv2
import subprocess
from cv2 import VideoWriter_fourcc
from PIL import Image, ImageFont, ImageDraw

# 命令行輸入參數處理
# aparser = argparse.ArgumentParser()
# aparser.add_argument('file')
# aparser.add_argument('-o','--output')
# aparser.add_argument('-f','--fps',type = float, default = 24)#幀
# aparser.add_argument('-s','--save',type = bool, nargs='?', default = False, const = True)
# 是否保留Cache文件,默認不保存

class Video2CodeVideo:
    def __init__(self):
        self.config_dict = {
            # 原視頻文件
            "input_file": "video/test.mp4",
            # 中間文件存放目錄
            "cache_dir": "cache",
            # 是否保留過程文件。True--保留,False--不保留
            "save_cache_flag": False,
            # 使用使用的字符集
            "ascii_char_list": list("01B%8&WM#*oahkbdpqwmZO0QLCJUYXzcvunxrjft/\|()1{}[]?-_+~<>i!lI;:oa+>!:+. "),
        }

    # 第一步從函數,將像素轉換為字符
    # 調用棧:video_2_txt_jpg -> txt_2_image -> rgb_2_char
    def rgb_2_char(self, r, g, b, alpha=256):
        if alpha == 0:
            return ''
        length = len(self.config_dict["ascii_char_list"])
        gray = int(0.2126 * r + 0.7152 * g + 0.0722 * b)
        unit = (256.0 + 1) / length
        return self.config_dict["ascii_char_list"][int(gray / unit)]

    # 第一步從函數,將txt轉換為圖片
    # 調用棧:video_2_txt_jpg -> txt_2_image -> rgb_2_char
    def txt_2_image(self, file_name):
        im = Image.open(file_name).convert('RGB')
        # gif拆分后的圖像,需要轉換,否則報錯,由於gif分割后保存的是索引顏色
        raw_width = im.width
        raw_height = im.height
        width = int(raw_width / 6)
        height = int(raw_height / 15)
        im = im.resize((width, height), Image.NEAREST)

        txt = ""
        colors = []
        for i in range(height):
            for j in range(width):
                pixel = im.getpixel((j, i))
                colors.append((pixel[0], pixel[1], pixel[2]))
                if (len(pixel) == 4):
                    txt += self.rgb_2_char(pixel[0], pixel[1], pixel[2], pixel[3])
                else:
                    txt += self.rgb_2_char(pixel[0], pixel[1], pixel[2])
            txt += '\n'
            colors.append((255, 255, 255))

        im_txt = Image.new("RGB", (raw_width, raw_height), (255, 255, 255))
        dr = ImageDraw.Draw(im_txt)
        # font = ImageFont.truetype(os.path.join("fonts","漢儀楷體簡.ttf"),18)
        font = ImageFont.load_default().font
        x = y = 0
        # 獲取字體的寬高
        font_w, font_h = font.getsize(txt[1])
        font_h *= 1.37  # 調整后更佳
        # ImageDraw為每個ascii碼進行上色
        for i in range(len(txt)):
            if (txt[i] == '\n'):
                x += font_h
                y = -font_w
            # self, xy, text, fill = None, font = None, anchor = None,
            # *args, ** kwargs
            dr.text((y, x), txt[i], fill=colors[i])
            # dr.text((y, x), txt[i], font=font, fill=colors[i])
            y += font_w

        name = file_name
        # print(name + ' changed')
        im_txt.save(name)


    # 第一步,將原視頻轉成字符圖片
    # 調用棧:video_2_txt_jpg -> txt_2_image -> rgb_2_char
    def video_2_txt_jpg(self, file_name):
        vc = cv2.VideoCapture(file_name)
        c = 1
        if vc.isOpened():
            r, frame = vc.read()
            if not os.path.exists(self.config_dict["cache_dir"]):
                os.mkdir(self.config_dict["cache_dir"])
            os.chdir(self.config_dict["cache_dir"])
        else:
            r = False
        while r:
            cv2.imwrite(str(c) + '.jpg', frame)
            self.txt_2_image(str(c) + '.jpg')  # 同時轉換為ascii圖
            r, frame = vc.read()
            c += 1
        os.chdir('..')
        return vc

    # 第二步,將字符圖片合成新視頻
    def txt_jpg_2_video(self, outfile_name, fps):
        fourcc = VideoWriter_fourcc(*"MJPG")

        images = os.listdir(self.config_dict["cache_dir"])
        im = Image.open(self.config_dict["cache_dir"] + '/' + images[0])
        vw = cv2.VideoWriter(outfile_name + '.avi', fourcc, fps, im.size)

        os.chdir(self.config_dict["cache_dir"])
        for image in range(len(images)):
            # Image.open(str(image)+'.jpg').convert("RGB").save(str(image)+'.jpg')
            frame = cv2.imread(str(image + 1) + '.jpg')
            vw.write(frame)
            # print(str(image + 1) + '.jpg' + ' finished')
        os.chdir('..')
        vw.release()

    # 第三步,從原視頻中提取出背景音樂
    def video_extract_mp3(self, file_name):
        outfile_name = file_name.split('.')[0] + '.mp3'
        subprocess.call('ffmpeg -i ' + file_name + ' -f mp3 -y ' + outfile_name, shell=True)

    # 第四步,將背景音樂添加到新視頻中
    def video_add_mp3(self, file_name, mp3_file):
        outfile_name = file_name.split('.')[0] + '-code.mp4'
        subprocess.call('ffmpeg -i ' + file_name + ' -i ' + mp3_file + ' -strict -2 -f mp4 -y ' + outfile_name, shell=True)

    # 第五步,如果沒配置保留則清除過程文件
    def clean_cache_while_need(self):
        # 為了清晰+代碼比較短,直接寫成內部函數
        def remove_cache_dir(path):
            if os.path.exists(path):
                if os.path.isdir(path):
                    dirs = os.listdir(path)
                    for d in dirs:
                        if os.path.isdir(path + '/' + d):
                            remove_cache_dir(path + '/' + d)
                        elif os.path.isfile(path + '/' + d):
                            os.remove(path + '/' + d)
                    os.rmdir(path)
                    return
                elif os.path.isfile(path):
                    os.remove(path)
                return
        # 為了清晰+代碼比較短,直接寫成內部函數
        def delete_middle_media_file():
            os.remove(self.config_dict["input_file"].split('.')[0] + '.mp3')
            os.remove(self.config_dict["input_file"].split('.')[0] + '.avi')
        # 如果沒配置保留則清除過程文件
        if not self.config_dict["save_cache_flag"]:
            remove_cache_dir(self.config_dict["cache_dir"])
            delete_middle_media_file()

    # 程序主要邏輯
    def main_logic(self):
        # 第一步,將原視頻轉成字符圖片
        vc = self.video_2_txt_jpg(self.config_dict["input_file"])
        # 獲取原視頻幀率
        fps = vc.get(cv2.CAP_PROP_FPS)
        # print(fps)
        vc.release()
        # 第二步,將字符圖片合成新視頻
        self.txt_jpg_2_video(self.config_dict["input_file"].split('.')[0], fps)
        print(self.config_dict["input_file"], self.config_dict["input_file"].split('.')[0] + '.mp3')
        # 第三步,從原視頻中提取出背景音樂
        self.video_extract_mp3(self.config_dict["input_file"])
        # 第四步,將背景音樂添加到新視頻中
        self.video_add_mp3(self.config_dict["input_file"].split('.')[0] + '.avi', self.config_dict["input_file"].split('.')[0] + '.mp3')
        # 第五步,如果沒配置保留則清除過程文件
        self.clean_cache_while_need()

if __name__ == '__main__':
    obj = Video2CodeVideo()
    obj.main_logic()

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM