Setelah anda mendownload data netCDF data hujan harian yang jumlahnya sesuai jumlah hari yang anda download (misal: 365 untuk data setahun), maka anda akan mendownload banyak file netCDF seperti pada gambar dibawah:

Jika anda perhatikan file tersebut adalah urut per tanggal dan memiliki pola nama tertentu. Sekarang anda harus menggabungkan semua file tersebut kedalam satu file netCDF agar mudah dilakukan analisis berikutnya.
Untuk membaca multiple file NetCDF sebagai satu file time series menggunakan library xarray di Python, Anda dapat menggunakan fungsi open_mfdataset()
yang disediakan oleh xarray. Berikut adalah langkah-langkahnya:
1. Install dan impor xarray
Install library yang anda akan butuhkan untuk membuka file netCDF:
# install seluruh dependencies yang dibutuhkan # "conda install -c conda-forge" digunakan untuk install melalui anaconda conda install -c conda-forge xarray conda install -c conda-forge dask conda install -c conda-forge netCDF4 conda install -c conda-forge bottleneck
Impor library xarray:
import xarray as xr # untuk setting direktori default import os
2. Tentukan pola nama file dan membaca netCDF
Tentukan pola nama file NetCDF Anda. Misalnya, untuk case GPM IMERG ini anda dapat menggunakan pola sebagai berikut. Contoh semua File saya letakkan di folder “Download”
# Set direktori tempat anda menyimpan file-file netCDF os.chdir("D:/Research/Data/") # Buat list file netCDF anda file_pattern = "3B-DAY.MS.MRG.3IMERG.*-S000000-E235959.V06.nc4.SUB.nc4"
Gunakan fungsi open_mfdataset()
untuk membaca multiple file NetCDF dan menggabungkannya sebagai satu file time series:
ds = xr.open_mfdataset(file_pattern)
Setelah menjalankan langkah-langkah ini, Anda akan mendapatkan objek Dataset (ds
) yang berisi time series dari multiple file NetCDF yang telah digabungkan. Anda dapat menggunakan objek ini untuk melakukan operasi dan analisis lebih lanjut pada data time series Anda.

3. Simpan file netCDF
Untuk mengekspor objek Dataset (ds
) ke dalam format file NetCDF, Anda dapat menggunakan metode to_netcdf()
yang disediakan oleh xarray:
output_file = "D:/Research/Data/3B-DAY.MS.MRG.3IMERG.2000-2021.Bali.V06.nc" # Nama dan lokasi file NetCDF yang akan diekspor ds.to_netcdf(output_file)
Setelah menjalankan langkah-langkah ini, objek Dataset (ds
) akan diekspor ke dalam format file NetCDF dengan nama yang Anda tentukan. File NetCDF tersebut akan disimpan di lokasi yang Anda spesifikasikan.