在工作中遇到一個問題即,需要將用戶的賬戶和實時tbox數據 對應上其綁定的車輛靜態數據。
正常的小規模操作是利用一個循環,查找vid 在另一張vid對應車輛名稱用途的表的位置 映射出信息,再調用賦值給原來的vid的index。
這對於大量級的數據操作緩慢。
下文給出 pandas的series如何快速的根據需要的列的名稱,快速添加其他列的方法。
例: 當前數據格式為: 一個簡單的動態數據。現在需要將所有的vid 對應上其車輛的用途和車輛的型號。
因此從數據庫內導入靜態數據的表,見下圖:
二張數據表的紐帶是用戶id,因此需要將二者對應起來
處理后變成:
核心代碼是
chunk=chunk.join(df_vid,on='vid');
還有功能相似的merge用法。主要用於條件拼接。