Aplicación de ciencia de datos para la reconstrucción de series de tiempo de variables meteorológicas en Islas del Rosario (Caribe colombiano) entre los años 2013-2021
Average rating
Cast your vote
You can rate an item by clicking the amount of stars they wish to award to this item.
When enough users have cast their vote on this item, the average rating will also be shown.
Star rating
Your vote was cast
Thank you for your feedback
Thank you for your feedback
Date
2022-12Creative Commons
Attribution-NonCommercial-ShareAlike 4.0 International
Metadata
Show full item recordAlternative Title
Application of Data Science for the reconstruction of time series of meteorological variables in the Islas del Rosario (Colombian Caribbean), between the years 2013-2021Abstract
Este estudio revisa dos series de tiempo de variables meteorológicas medidas por una estación automática ubicada en Islas del Rosario (Caribe colombiano), perteneciente a la Red de Medición de Parámetros Oceanográficos y de Meteorología Marina (RedMpomm) de la Dirección General Marítima (Dimar). Las series de tiempo corresponden a datos de temperatura ambiente y magnitud del viento en el periodo 2013-2021, los cuales presentan algunos valores faltantes. El objetivo del estudio fue desarrollar un modelo que permitiera completar automáticamente los diferentes vacíos existentes en las series de tiempo, utilizando las ventajas de la ciencia de datos al completar información con valores estimados. La importancia de obtener series reconstruidas radica en lograr tener bases de datos más sólidas para ser utilizada en los trabajos de investigación y académicos que realiza la Dimar. La metodología desarrollada consistió en el uso de imputación de medianas a partir de datos existentes sobre fechas y horas asociadas a valores faltantes, todo esto mediante el uso de desfases de datos e información complementaria como relaciones de periodicidad sobre el conjunto de datos. Los resultados mostraron que se logró implementar una metodología capaz de estimar el valor más adecuado para completar las diferentes series temporales, la cual constituye una primera aproximación para la reconstrucción de datos meteorológicoThis study reviews two time series of meteorological variables measured by an automatic station located in Islas del Rosario (Colombian Caribbean), belonging to the Network for Measurement of Oceanographic Parameters and Marine Meteorology (RedMpomm) of the General Maritime Directorate (Dimar). The time series correspond to data of air temperature and wind magnitude in the period 2013-2021, which present some missing values. The objective of the study was to develop a model that would automatically reconstruct missing values in the time series, using the advantages of data science to complete information with estimated values. The importance of obtaining reconstructed series lies in having more solid databases to be used in the research and academic work carried out by Dimar. The methodology developed consisted of the use of imputation of medians from existing data on dates and times associated with missing values, all this through the use of data lags and complementary information such as periodicity relationships on the data set. The results showed that it was possible to implement a reliable methodology capable of estimating the most appropriate value to complete the different time series, which constitutes a first approximation for the reconstruction of meteorological data.
Journal
Boletín Científico CIOHVolume
41Issue/Article Nr
2Page Range
pp.67-80Resource/Dataset Location
https://ojs.dimar.mil.co/index.php/CIOH/article/view/604ae974a485f413a2113503eed53cd6c53
https://doi.org/10.26640/22159045.2022.604
Scopus Count
Collections
The following license files are associated with this item:
- Creative Commons
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-ShareAlike 4.0 International