頻道欄目
首頁 > 程序開發 > Web開發 > Python > 正文
python庫下使用pandas的實例教程
2018-07-27 15:40:08         來源:CoderWangSon  
收藏   我要投稿

python庫使用-pandas

一 .打開文件

通常使用pandas打開一個csv文件,你可以使用read_csv來讀取一個csv文件,他的返回值是一個DataFrame類型的數據。假如csv文件格式如下:
\

其中第一行不是數據,而是列的名字,然后其他的行都是有效數據。

二 .DaTaFrame的使用

其實DataFrame你也可以看成是一個大矩陣,里面是很多的數據,只是這個數據沒一列都有的名字,你可以使用列名操作矩陣。

data = pandas.read_csv(“data.csv”)

這個data就是一個DataFtame類型的數據,你可以使用data.columns獲取列的名字,也就是第一行數據中的內容,用shape整個數據矩陣的大小是多少行與多少列。

data.loc[1]則可以定位每一行的內容,[]里面可以進行切片比如loc[1:3]就是1-3行的數據。

如果你想看某一個列的數據則可以data[‘id’],[]中代表列的名字。

三 .DataFrame常用函數

mean()

這個函數可以求平均值,比如data[‘num’].mean()就代表對所有數據的數量進行求均值。

apply()函數

這個函數可以傳入一個函數,這樣的話就可以對一個DataFrame按照傳入的函數進行處理,比如上面的數據如果你想把某一列的值的格式批量修改,那么你只需要定義一個函數可以修改某個值,然后傳入即可。

比如希望吧num都擴大10倍。

def big(row):
 return row['num']*10

data['num']=data.apply(big,axis=1)  

其中big函數中的row其實就是data中的每一行的數據,然后row[‘num’]就是這一行的num數據,返回了一個*10的結果,就會被data[‘num’]的此行接收。這個函數可以用于把連續的值離散化,或者批量改變某個列的數據格式。

pivot_table()

數據透視圖,可以用于統計比如:

data.pivot_table(index="name",values="num",aggfunc=numpy.sum)  

這個就可以透視出來各種名字不同的物品的各自的總和,其中index就是用來分類的數據,values就是用來統計的數據列,而aggfunc就是說明統計的方式?梢允莝um,mean等。最終生成的結果可以使用result.index和reslut.values分別獲得。

四. Series

其實DataFrame中的行和列都是由Series組成的,可以把Series看做是DataFrame的一個小部件。

點擊復制鏈接 與好友分享!回本站首頁
相關TAG標簽 博客
上一篇:Python下異常、模塊、文件、數據儲存-json等知識講解
下一篇:Python正則表達式學習之match和search的實例
相關文章
圖文推薦
文章
推薦
點擊排行

關于我們 | 聯系我們 | 廣告服務 | 投資合作 | 版權申明 | 在線幫助 | 網站地圖 | 作品發布 | Vip技術培訓 | 舉報中心

版權所有: 紅黑聯盟--致力于做實用的IT技術學習網站

重庆快乐十分开奖记录