Saltar al contenido principal
gasolinade.com

Metodología

Cómo se construye el dato

gasolinade.com es un observatorio editorial sobre el mercado de los carburantes en España. Esta página explica de dónde proceden los datos, con qué periodicidad se actualizan, qué validaciones pasan antes de publicarse, qué se publica y qué no se publica nunca.

Fuentes oficiales utilizadas

Todos los datos numéricos publicados en gasolinade.com proceden de fuentes oficiales o equivalentes verificables. Cada bloque temático del observatorio tiene su fuente principal:

  • Geoportal de Carburantes (MITECO). Precios diarios de las aproximadamente 11.500 estaciones de servicio terrestres de España. Datos abiertos del Ministerio para la Transición Ecológica y el Reto Demográfico. Es la fuente primaria del bloque de precios por estación, municipio, provincia, marca y carburante.
  • Estructura oficial del precio (MITECO). Desglose periódico del precio final del litro: materia prima, impuesto especial sobre hidrocarburos, IVA, margen de distribución y comercialización. Aparece en las guías editoriales sobre composición del precio.
  • CORES — Corporación de Reservas Estratégicas de Productos Petrolíferos. Consumo nacional mensual por producto (gasolinas, gasóleos, GLP, querosenos, fuelóleos). Es la fuente del bloque de consumo.
  • AEAT — Agencia Estatal de Administración Tributaria. Recaudación anual del Impuesto Especial sobre Hidrocarburos, tipos efectivos por producto, recaudación por tipo reducido. Fuente del bloque de impuestos.
  • DGT — Dirección General de Tráfico. Parque automovilístico por tipo de combustible, matriculaciones mensuales por distintivo medioambiental. Fuente del bloque de transición energética.
  • IDAE — Instituto para la Diversificación y Ahorro de la Energía. Consumo homologado por modelo de vehículo (utilizado en las calculadoras como referencia técnica).
  • Boletín Petrolero Semanal de la Comisión Europea (DG Energy). Precios semanales de carburantes en los 27 países UE con metodología homogénea. Fuente de la comparativa internacional.
  • EIA y Eurostat. Precio internacional del crudo Brent y series energéticas europeas. Series de fondo para guías y para el bloque histórico.
  • BOE — Boletín Oficial del Estado. Cambios normativos en impuestos especiales, IVA, bonificaciones temporales, decretos-ley y sentencias del Tribunal Supremo relevantes. Rastreado diariamente del sumario para alimentar el catálogo de normativa.

Cada cifra publicada en una pieza del observatorio cita su fuente y su fecha de consulta en la propia pieza. Cuando una pieza usa varias fuentes, todas se listan al pie.

Periodicidad y actualización

Cada fuente tiene su propia cadencia de publicación. El observatorio respeta la cadencia original: no acelera la publicación de un dato que el organismo emisor no ha actualizado todavía.

  • Precios por estación (MITECO): se consulta diariamente. El histórico interno se guarda en la base de datos para permitir series temporales.
  • Consumo nacional (CORES): publica cifras mensuales con aproximadamente dos meses de retraso respecto al mes natural. Así aparecen.
  • Recaudación fiscal (AEAT): el informe anual tributario sale entre marzo y mayo del año siguiente. El dato del ejercicio cerrado puede tardar varios meses en estar consolidado; durante ese periodo el observatorio marca explícitamente la cifra como provisional.
  • Parque automovilístico (DGT): anuario que sale en el primer semestre del año siguiente. Matriculaciones mensuales con desfase de uno o dos meses.
  • Boletín Petrolero (UE): semanal, normalmente los lunes con datos del lunes anterior.
  • BOE: rastreo diario del sumario.

Pipeline de carga

El procesamiento de cada fuente sigue el mismo esquema:

  1. Captura: descarga del fichero oficial (JSON, CSV, XML según fuente) en un directorio de staging temporal.
  2. Validación de origen: comprobación del checksum o hash cuando la fuente lo proporciona, validación del esquema esperado del fichero.
  3. Normalización: tipos de datos, codificación de caracteres (todo UTF-8), formato de fechas (ISO 8601), separadores decimales (punto en BD, coma en visualización).
  4. Cruces con catálogos: las entidades nuevas (estaciones, municipios, marcas) se cruzan con los catálogos existentes en la base de datos. Las entidades inexistentes se añaden tras validación manual.
  5. Validaciones automáticas (ver sección siguiente).
  6. Carga atómica: si todas las validaciones pasan, los datos se escriben en la base de datos en transacción atómica. Si falla cualquier validación, la carga se cancela íntegramente; no hay carga parcial.
  7. Auditoría: cada carga deja un registro en la tabla de auditoría con fecha, fuente, número de filas, validaciones aplicadas y resultado.

Validaciones automáticas antes de publicar

Cada carga pasa un bloque de validaciones específicas para detectar errores sistemáticos o anomalías:

  • Rango esperado: precios fuera del rango plausible (por ejemplo, gasolina 95 fuera del rango 0,50 — 5,00 €/L) se marcan para revisión manual.
  • Ausencia de duplicados: la clave compuesta (estación, carburante, fecha) debe ser única. Duplicados activan rechazo.
  • Ausencia de precios negativos: cualquier valor negativo es error de origen y se rechaza.
  • Integridad referencial: cada precio debe corresponder a una estación, municipio y provincia existentes en el catálogo. Referencias huérfanas se rechazan.
  • Detección de caídas masivas: si una carga aporta menos del 70 % de las filas esperadas respecto a la carga anterior, se sospecha fallo de origen y se cancela. Mejor no actualizar que actualizar mal.
  • Coherencia temporal: las fechas deben ser razonables (no futuras, no anteriores al inicio del histórico de la fuente).

Si una validación falla, la carga no se aplica a la base de datos pública. El fichero queda en staging hasta que el editor revisa la incidencia.

Tratamiento de huecos y outliers

La regla es estricta:

  • Huecos: si una fuente tiene un hueco temporal (por ejemplo, la AEAT no publica el dato 2024 hasta abril de 2025), el observatorio tampoco lo publica. No se interpola entre el dato 2023 y el 2025 para completar la serie. El hueco aparece como hueco.
  • Outliers en precios estación: precios manifiestamente erróneos en el Geoportal del MITECO (por debajo de 0,50 €/L o por encima de 5,00 €/L en gasolinas) se marcan internamente y se excluyen de medias agregadas. La ficha individual de la estación sí los muestra con una bandera, porque son lo que el MITECO publicó; pero las agregaciones a municipio, provincia y nación no los incluyen.
  • Outliers en series temporales: una caída o subida del 20 % o más en un solo día de una estación se marca para revisión. Si el dato es real (cambio de marca, cierre temporal, error de actualización del rótulo), se mantiene; si es error sistemático del MITECO, se excluye con bandera.

Derivaciones aceptables y derivaciones no aceptables

El observatorio publica tanto datos oficiales puros como derivaciones calculadas. La regla operativa para distinguir lo aceptable de lo inaceptable:

Sí se publica: medias, medianas, percentiles, variaciones interanuales y ratios calculados sobre datos oficiales (por ejemplo, «precio medio de la gasolina 95 en Madrid» calculado sobre todas las estaciones activas del municipio). Inferencias estructurales con certeza superior al 99 % (por ejemplo, la composición fiscal del precio se deriva con exactitud del tipo del IH y del IVA vigentes). Equivalencias entre unidades. Fórmulas definidas por norma.

No se publica nunca: precios concretos cuando la fuente no los publica (un precio de gasolina en Andorra en 2008 si la fuente no lo recoge); interpolaciones de series con huecos para suplir datos que faltan; estimaciones al ojímetro de cifras que el observatorio no puede verificar contra fuente oficial; resúmenes de prensa convertidos en «datos» (la prensa puede confirmar un dato del BOE, pero la cita es el BOE, no la prensa); ni cifras «razonables» para rellenar tablas que necesiten ese aspecto. Si falta un dato, falta y se publica como hueco.

Calculadoras y estimaciones

Las calculadoras del sitio (coste anual, llenar depósito, ROI gasóleo profesional, etc.) son herramientas de estimación que aplican fórmulas conocidas a inputs del usuario. Cada calculadora:

  • Indica explícitamente la fórmula que utiliza.
  • Muestra los datos de partida (precio medio precargado, tipo impositivo aplicado).
  • Lleva la advertencia «estimación informativa, no vinculante».
  • No sustituye un cálculo personalizado por un profesional fiscal o financiero.

Para temas profesionales (autónomo, transportista, empresa con flota, agricultor, pesca) el observatorio publica páginas con marco legal y referencias BOE pero recomienda siempre verificar con asesor cualificado antes de tomar decisiones que tengan impacto fiscal.

Política de correcciones y revisiones

Si detectas un error en un dato:

  1. Escribe a la dirección de contacto o directamente a info@gasolinade.com.
  2. Indica la URL exacta donde aparece el dato, la cifra que falla y la fuente correcta con su referencia (URL al BOE, número de informe AEAT, etc.).
  3. El observatorio verifica el error contra la fuente original.
  4. Si se confirma el error, se aplica la corrección y se anota la fecha de corrección en la pieza afectada.
  5. Si el error afecta a cifras agregadas (por ejemplo, media municipal o ranking provincial), se recalculan las agregaciones derivadas.
  6. Si el error es de calado (cifra publicada incorrectamente en una guía cabecera, por ejemplo), se anota en la página de actualidad una entrada con la corrección para que el lector que llegó al dato erróneo pueda enterarse.

La política de correcciones es la misma que aplican los medios de comunicación profesionales: transparencia sobre el error, identificación de la causa, corrección rápida, anotación visible. Sin reescritura silenciosa.

Lo que el observatorio nunca hace

Por claridad operativa, la lista explícita de prácticas que están prohibidas en gasolinade.com:

  • Inventar cifras o estimar al ojímetro.
  • Interpolar huecos en series temporales.
  • Convertir titulares de prensa en datos.
  • Publicar artículos patrocinados o enlaces de afiliación.
  • Captar correos, gestionar listas de email o lead magnets.
  • Vender datos del usuario o construir perfiles publicitarios propios.
  • Eliminar correcciones silenciosamente.
  • Publicar reseñas sintéticas de estaciones de servicio.
  • Generar contenido masivo plantilla con datos cambiados (scaled content).
  • Atribuir cifras a fuentes que no las publicaron.

Autoría y publicación

El observatorio lo edita Borja Cifuentes, analista de datos públicos. Cada guía editorial larga, cada entrada de FAQ, cada término de glosario y cada entrada del bloque de actualidad llevan firma de autor y fecha de última revisión. El schema de datos estructurados (Article, Person, Organization) refleja esa autoría para los motores de búsqueda.

La página de autor detalla trayectoria profesional, áreas de cobertura editorial y la red de proyectos editoriales *de.com a la que pertenece gasolinade.com.

Última revisión metodológica: 2026-05-30. Esta página se actualiza cuando cambia algún procedimiento operativo o cuando se incorpora una nueva fuente al observatorio.