在分析金融商品時,我們時常有一種以上的標的區要進行分析。本單元簡單分享,如何透過Merge功能來合併各種不同的標的,相較於單單使用Excel裡面的vlookup並要去除空值的用法可以節省相當多寶貴時間!
Merge
在python中,我們可以採用pd.merge()來合併不同的DataFrame。
merge(data1,data2,依據,方法)
其中,
data1指的是要合併的第一個DataFrame;
data2指的是要合併的第二個DataFrame;
依據的部份則是指定要依據哪個column來進行資料合併。
如果兩個DataFrame的欄位名稱相同,我們可以直接讓on=’欄位名稱’ ; 反之,兩個DataFrame的欄位名稱不同,我們則要分別給定left_on=’第一個DataFrame欄位名稱’,以及right_on=’第二個DataFrame欄位名稱’。
另外,先前我們也分享過如何將索引設定成日期格式。因此,如果我們想要透過索引來進行資料合併,可以透過給定left_index=True以及right_index=True,就可以輕易透過index來進行資料合併了!
方法的部分則是指定我們要採用的合併方法。
left: 依據第一個DataFrame的資料為基底做合併。
right:依據第二個DataFrame的資料為基底做合併。
inner:依據兩個DataFrame的資料交集做合併。
outer:依據兩個DataFrame的資料聯集做合併。
今天,我們學會了如何合併不同標的資料的方法。這個merge簡單實用,尤其是針對不同國家的金融商品時,因交易時間不同(國定假日),時常會遇到日期對不上的問題,透過這個方法,這些問題都將輕易迎刃而解! 拿起你的資料,一起動手做做看吧!
程式檔案,歡迎下載Github。