Pandas讀取csv文件某一列並保存到txt文件中
按道理來說挺簡單的,但是卻查了好久,本來想利用pandas的api獲取某一列的數據,然后寫入到文件中,但是寫入到文件后出現各種問題,要不程序報錯,要不不分行。最后還是按照之前的那樣,獲取的之后一個個的添加到之前創建好的list中。
def save_csv_to_text(filename, csv_name, usecols):
'''
讀取csv的文件,將指定列轉換存到txt文件中,usecols=0 摘要,usecols=1 文章
'''
data = pd.read_csv(os.path.join(DATA_ROOT, csv_name), usecols=[usecols])
data_list = data.values.tolist()
result = []
for item in data_list:
result.append(item[0])
print("start process {}".format(filename))
start_time = time.time()
with open(filename, 'w', encoding='utf-8') as f:
for item in tqdm(result):
f.write(item + '\n')
f.close()
print("cost time {}".format(time.time() - start_time))
print('save {} done!'.format(filename))
print("---------------------")
在這里tqdm如果想使用的話,導包的時候需要這樣導入:
from tqdm import tqdm