在了解了ㄧ維度的Series後,今天要跟大家分享的是Pandas裡面多維度的資料結構—DataFrame。如同我們之前所說,這是處理Panel Data的最佳利器,尤其是在選股的應用上,更是不可或缺的好幫手!
現在,就讓我們一起進入DataFrame的世界吧!
(一) 建立DataFrame
DataFrame跟Series一樣,在已經有資料的情況下,我們可以直接經由pd.DataFrame(data)的方式,將資料轉換為DataFrame的資料結構。
而在沒有資料的情況下,我們也可以直接透過字典的建構,來輸入資料,最後再透過一樣的方式將資料結構轉換為DataFrame,範例如下:
這邊我們可以清楚的看到,在資料有缺值的部分,DataFrame也會很聰明的直接補上”NaN”。
(二) 截取資料
在DataFram中,要截取所需資料也是相當方便的,只要指定相對應的行名稱與列名稱即可。可以指定一個直,也可以選定一個區塊,更可以跳著選,完全沒有限制!
(三) 選取資料
在DataFrame中,要選取滿足某個條件的資料,也是相當容易的事情。只要直接把篩選條件寫在DataFrame裡面就可以了!範例如下:
(四) 資料描述
另外,DataFrame中還有一個相當好用的功能,用df.describe()就可以簡單看到每筆資料(股票)的簡單統計特徵。
而如果我們只想看某筆資料(股票)的某個特徵,也可以在describe()後直接指定。
(五) 運算模式
在DataFrame中的運算模式非常方便,我們透過上述的選取資料模式對DataFrame裡面的資料作相互運算,也可以對這整個DataFrame或所選取的範圍做同一運算處理。範例如下:
值得注意的是,還記得我們在最一開始python基礎教學所提到的事情嗎?這些運算都不會改變原本的df,可以利用指定變數的方式把它存成其他變數(效果如copy),或是指定成df直接覆蓋唷!
(五) 簡單繪圖
在DataFrame中,我們也可以用plot()輕鬆執行繪圖動作唷!
到了這邊,相信大家已經對DataFrame有了基礎的認識。下次,我們將分享更多DataFrame的實用功能唷!