2020年3月3日 10:25
作者:殷建剛
近日收到業(yè)務(wù)往來公司發(fā)來的數(shù)據(jù)文件,頓覺頭大,文件為CSV格式,有近600行的數(shù)據(jù),內(nèi)容是電話號碼的費用清單。話費的收費有多種目錄,并且一個號碼有多行,每個號碼行數(shù)不一致,用電子表格的VLOOKUP函數(shù)取數(shù)很難實現(xiàn)數(shù)據(jù)的對應(yīng),如果手工整理成統(tǒng)一的格式需半天多時間,且數(shù)據(jù)量大,手工方式極易出錯。
這種數(shù)據(jù)每月都要處理,重復(fù)的事情要想辦法完成,提高工作效率。思恃半天,何不用python小程序來處理這些數(shù)據(jù),思路是先把每個號碼的數(shù)據(jù)合并成一行,再對齊相同內(nèi)容的列,輸出到電子表格中處理。經(jīng)過不斷摸索,編制出如下方法:
用python程序的pandas庫來進行數(shù)據(jù)處理,先用讀取函數(shù)取源文件,生成一個二維數(shù)據(jù)表后,用條件函數(shù)判斷,從數(shù)據(jù)表中取出每個號碼對應(yīng)的多行數(shù)據(jù)合并成一行數(shù)據(jù),經(jīng)過處理,刪除多余數(shù)據(jù),插入數(shù)據(jù)以使每個號碼最終生成的格式一致,把每個號碼生成的列表合并在一個列表中,轉(zhuǎn)換成新的二維表,輸出后導(dǎo)入excel文件,用VLOOKUP函數(shù)自動取數(shù),5分鐘內(nèi)即可處理完畢,程序雖小,也就是了了二十行代碼,很簡單,但是應(yīng)用于工作中,可減少重復(fù)性的操作,工作效率大為提高。
這個方法只是拋磚引玉,在當(dāng)今信息化與工業(yè)化日益融合的時期,我們只有不斷學(xué)習(xí),引入新的技術(shù)應(yīng)用于工作、生產(chǎn)中,才能更好地適應(yīng)這個嶄新的時代。
版權(quán)?2020濟寧中銀電化有限公司 |魯ICP備2020037088號