python excel多行合並


一、概述

現有一個wenda1.xlsx文件,內容如下:

 

需要將faq記錄合並為一行,效果如下:

 

注意:faq記錄,每一行用||來拼接。

 

二、多行轉換一行

新建test1.py,內容如下:

# !/usr/bin/python3
# -*- coding: utf-8 -*-
import xlrd

# 打開excel文件,創建一個workbook對象
rbook = xlrd.open_workbook('wenda1.xlsx')
# sheets方法返回對象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>]
rbook.sheets()
# xls默認有3個工作簿,Sheet1,Sheet2,Sheet3
rsheet = rbook.sheet_by_index(0)  # 取第一個工作簿

faq_tmp_dict = {}  # FAQ臨時字典
faq_formal_list = [] # FAQ正式列表
first_category_tag = ""  # 一級分類標識
index = 0 # 索引

#循環工作簿的所有行
for row in rsheet.get_rows():
    index +=1

    first_category_row = row[0]  # 1級分類所在的列
    first_category_value = first_category_row.value  # 1級分類的值
    if first_category_value != '1級分類':  # 排除第一行,這些都是列名
        if first_category_value:  # 當1級分類的值不為空時
            # 更新一級分類標識,用#連接
            first_category_tag = "%s#%s"%(first_category_value,index)
            faq_like_column = row[1]  # FAQ相似句所在的列
            faq_like_value = faq_like_column.value  # FAQ相似句的值
            # 更新臨時字典,不存在默認值為空字典,否則追加到列表中
            faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)
        else:
            # 當1級分類的值為空時
            faq_like_column = row[1]  # FAQ相似句所在的列
            faq_like_value = faq_like_column.value
            faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)


print(faq_tmp_dict)
# 處理臨時字典
for i in faq_tmp_dict:
    tmp_dict = {}
    # 一級分類,切割#號,取第一個
    first_category = i.split('#')[0]
    # print("first_category",first_category)
    # faq所有記錄,將faq列表轉換為一行,用逗號拼接
    faq_like_all = "||".join(faq_tmp_dict[i])
    # print("faq_merge",faq_all)
    tmp_dict['first_category'] = first_category
    tmp_dict['faq_like_all'] = faq_like_all
    faq_formal_list.append(tmp_dict)

print(faq_formal_list)
View Code

執行輸出:

{'閑聊#2': ['不在嗎?', '你好在嗎?', '你在不在', '有人在么。', '你好?', '在么?說話啊', '客戶在不在?'], '閑聊#9': ['你好', '客服你好', '你好,客服']}
[{'first_category': '閑聊', 'faq_like_all': '不在嗎?||你好在嗎?||你在不在||有人在么。||你好?||在么?說話啊||客戶在不在?'}, {'first_category': '閑聊', 'faq_like_all': '你好||客服你好||你好,客服'}]

 

從上面輸出內容,可以看出。將多行合並為一行,並且將faq記錄寫入到一個字典里面了。接下來就可以寫入到新表格了。

 

三、寫入新表格

完整代碼如下:

# !/usr/bin/python3
# -*- coding: utf-8 -*-
import xlrd

# 打開excel文件,創建一個workbook對象
rbook = xlrd.open_workbook('wenda1.xlsx')
# sheets方法返回對象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>]
rbook.sheets()
# xls默認有3個工作簿,Sheet1,Sheet2,Sheet3
rsheet = rbook.sheet_by_index(0)  # 取第一個工作簿

faq_tmp_dict = {}  # FAQ臨時字典
faq_formal_list = [] # FAQ正式列表
first_category_tag = ""  # 一級分類標識
index = 0 # 索引

#循環工作簿的所有行
for row in rsheet.get_rows():
    index +=1

    first_category_row = row[0]  # 1級分類所在的列
    first_category_value = first_category_row.value  # 1級分類的值
    if first_category_value != '1級分類':  # 排除第一行,這些都是列名
        if first_category_value:  # 當1級分類的值不為空時
            # 更新一級分類標識,用#連接
            first_category_tag = "%s#%s"%(first_category_value,index)
            faq_like_column = row[1]  # FAQ相似句所在的列
            faq_like_value = faq_like_column.value  # FAQ相似句的值
            # 更新臨時字典,不存在默認值為空字典,否則追加到列表中
            faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)
        else:
            # 當1級分類的值為空時
            faq_like_column = row[1]  # FAQ相似句所在的列
            faq_like_value = faq_like_column.value
            faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)


print(faq_tmp_dict)
# 處理臨時字典
for i in faq_tmp_dict:
    tmp_dict = {}
    # 一級分類,切割#號,取第一個
    first_category = i.split('#')[0]
    # print("first_category",first_category)
    # faq所有記錄,將faq列表轉換為一行,用逗號拼接
    faq_like_all = "||".join(faq_tmp_dict[i])
    # print("faq_merge",faq_all)
    tmp_dict['first_category'] = first_category
    tmp_dict['faq_like_all'] = faq_like_all
    faq_formal_list.append(tmp_dict)

print(faq_formal_list)

import xlwt
import json
f = xlwt.Workbook()
sheet1 = f.add_sheet('Sheet1', cell_overwrite_ok=True)
row0 = ["1級分類", "faq記錄"]

# 寫第一行
for i in range(0, len(row0)):
    sheet1.write(0, i, row0[i])

# # 加載json文件
# with open("tj.json", 'r') as load_f:
#     load_dict = json.load(load_f)  # 反序列化文件
#
num = 0  # 計數器
max_length = 0  # 最大長度
for i in faq_formal_list:
    num+=1  # 自增1

    faq_col = sheet1.col(1)  # faq記錄所在的列
    length = len(i['faq_like_all'])  # 計算長度
    # print("長度",length)
    # 更新最大長度
    if max_length < length:
        max_length = length

    # 設置表格寬度
    faq_col.width = max_length * 20* 20
    # 寫入庫名
    sheet1.write(num, 0, i['first_category'])
    # faq_like_str = "||".join(i['faq_like_all'])
    sheet1.write(num, 1, i['faq_like_all'])

# 保存到表格
f.save('test1.xls')
View Code

執行代碼,它會生成一個test1.xlsx。

 

打開文件,效果如下:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM