Pandas(II)—DataFrame (上)

在了解了ㄧ維度的Series後,今天要跟大家分享的是Pandas裡面多維度的資料結構—DataFrame。如同我們之前所說,這是處理Panel Data的最佳利器,尤其是在選股的應用上,更是不可或缺的好幫手!

現在,就讓我們一起進入DataFrame的世界吧!

(一) 建立DataFrame

DataFrame跟Series一樣,在已經有資料的情況下,我們可以直接經由pd.DataFrame(data)的方式,將資料轉換為DataFrame的資料結構。

而在沒有資料的情況下,我們也可以直接透過字典的建構,來輸入資料,最後再透過一樣的方式將資料結構轉換為DataFrame,範例如下:

這邊我們可以清楚的看到,在資料有缺值的部分,DataFrame也會很聰明的直接補上”NaN”。

(二) 截取資料

在DataFram中,要截取所需資料也是相當方便的,只要指定相對應的行名稱與列名稱即可。可以指定一個直,也可以選定一個區塊,更可以跳著選,完全沒有限制!

(三) 選取資料

在DataFrame中,要選取滿足某個條件的資料,也是相當容易的事情。只要直接把篩選條件寫在DataFrame裡面就可以了!範例如下:

(四) 資料描述

另外,DataFrame中還有一個相當好用的功能,用df.describe()就可以簡單看到每筆資料(股票)的簡單統計特徵。

而如果我們只想看某筆資料(股票)的某個特徵,也可以在describe()後直接指定。

(五) 運算模式

在DataFrame中的運算模式非常方便,我們透過上述的選取資料模式對DataFrame裡面的資料作相互運算,也可以對這整個DataFrame或所選取的範圍做同一運算處理。範例如下:

值得注意的是,還記得我們在最一開始python基礎教學所提到的事情嗎?這些運算都不會改變原本的df,可以利用指定變數的方式把它存成其他變數(效果如copy),或是指定成df直接覆蓋唷!

(五) 簡單繪圖

在DataFrame中,我們也可以用plot()輕鬆執行繪圖動作唷!

到了這邊,相信大家已經對DataFrame有了基礎的認識。下次,我們將分享更多DataFrame的實用功能唷!

Share

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *