PRONÓSTICO DE LA DEMANDA ELÉCTRICA A CORTO PLAZO CON LÓGICA DIFUSA
Jordan Blancas1, Julien Noel2
1Becario
Maestría en Ciencias con Mención en Energética, Universidad Nacional de
Ingeniería-Fondecyt, Ingeniero Mecánico Electricista (Perú)
jblancass@uni.pe
2Universidad de Ingeniería y Tecnología –UTEC, Ingeniería de la Energía (Perú)
jnoel@utec.edu.pe
Recibido: 14/05/2018 y Aceptado: 25/07/2018
ENERLAC. Volumen II. Número 1. Septiembre, 2018 (8-27).
RESUMEN
En este artículo, lógica difusa es
aplicada al problema del pronóstico de la demanda eléctrica de corto
plazo (día siguiente). Para lograrlo es necesario seleccionar los datos
históricos de la demanda real ejecutada para el periodo de estudio y
pre procesarlos con el método c-means agrupándolos de acuerdo a niveles
de potencia (MW) para definir la cantidad de funciones de pertenencia
del sistema difuso, el cual influye en el cálculo del menor error de
pronóstico. Esta metodología es aplicada para pronosticar la demanda
eléctrica diaria del Sistema Eléctrico peruano y mediante el cálculo
del error MAPE se demuestra que brinda mejores resultados que la
metodología tradicional utilizada.
Palabras Clave: Demanda Eléctrica, Lógica Difusa, Pronóstico, C-medios, Sistema Eléctrico Interconectado.
Abstract
In this paper, fuzzy logic is
applied to the problem of short-term load forecasting (next day). To
achieve this, it is necessary to select the historical data of the
actual demand executed for the study period and to pre-process them
using the c-means method, grouping them according to power levels (MW)
to define the number of membership functions to the fuzzy system, which
influences the calculation of the lowest forecast error. This
methodology is applied to predict the daily electrical demand of the
Peruvian Electricity System and by calculating the MAPE error it is
shown that the fuzzy logic offers better results than the traditional
methodology used.
Keywords: Electric Demand, Fuzzy Logic, Forecast, C-means, Interconnected Electrical System.
INTRODUCCIÓN
En todos los horizontes de tiempo,
el pronóstico de la demanda eléctrica ha cumplido un rol importante en
la industria eléctrica por más de un siglo (Hong, 2014) debido a su
impacto tanto en la economía (previsión de precios en los mercados de
energía) como en el planeamiento, la operación confiable y el
mantenimiento de los sistemas eléctricos. Para el caso del horizonte de
corto plazo (día siguiente) se puede mencionar que si la demanda
eléctrica resulta ser más baja que los valores pronosticados, entonces
la energía generada será más costosa e ineficiente y, por otra parte,
si la demanda eléctrica es mayor de lo previsto, entonces las
restricciones de seguridad como los márgenes de reserva, la frecuencia
y la fiabilidad del sistema pueden estar en riesgo (Pandian,
Duraiswamy, Rajan, & Kanagaraj, 2006).
Resulta entonces importante lograr
la mejor aproximación posible a la demanda eléctrica a suministrar,
puesto que un pronóstico preciso no sólo puede mejorar el rendimiento
de gestión de la industria eléctrica, sino también disminuir la
frecuencia de ocurrencia de interrupciones para aumentar el grado de
satisfacción de los usuarios.
Con este propósito, hasta ahora se
han desarrollado varios estudios para mejorar la exactitud del
pronóstico de la demanda eléctrica. De acuerdo con (Ying & Pan,
2008), estos estudios se pueden dividir en cinco grandes categorías:
modelos de series temporales, modelos basados en regresión, espacio de
estados y tecnología de filtrado de Kalman, técnicas de inteligencia
artificial y métodos de lógica difusa.
A pesar de los estudios realizados,
el problema de predicción de la demanda de energía eléctrica aún es
difícil de manejar debido al comportamiento no lineal y al azar de la
variación del consumo eléctrico influido por factores como: (a) Clima,
(b) tiempo, (c) data histórica e (c) incertidumbres (envejecimiento de
las máquinas, las fluctuaciones, pérdidas en líneas de transmisión,
inestabilidad de tensión y frecuencia, etc.).
Estas incertidumbres pueden ser
tratadas con la implementación de lógica difusa (LD) en el cálculo del
pronóstico de la demanda eléctrica de corto plazo (PDECP)1.
La LD resulta un enfoque efectivo para tratar estas incertezas pues se
caracteriza por generalizar la lógica clásica de dos valores (0, 1)
para el razonamiento en condiciones no lineales e inciertas; por lo
tanto, resulta el método más apropiado para describir el “conocimiento
humano” (información) que contiene conceptos vagos y gran cantidad de
datos.
Por otro lado, el sistema actual de
PDECP en Perú está basado en técnicas de modelado estadístico
(regresión lineal con mínimos cuadrados) y según lo mencionado y de
acuerdo con (Mamlook, Badran, & Abdulhadi, 2009), estas técnicas
tienen posibilidades limitadas de predecir cargas precisas para días
anormales cuando ocurren algunos eventos irregulares, lo cual puede
solucionarse con el uso de LD.
(Song, Baek, Hong, & Jang,
2005) utilizaron regresión lineal difusa para pronosticar las cargas
para los días feriados en Corea del Sur. El modelo mostró un importante
y prometedor nivel de precisión en comparación con un enfoque de
inferencia difusa y redes neuronales, con errores promedio de 3.57% y
5.51%, respectivamente. El enfoque propuesto resalta porque
pronosticaba la demanda eléctrica basada solamente la data histórica de
la misma sin considerar la entrada de información meteorológica.
(Pandian et al., 2006) propuso un
sistema de lógica difusa para el pronóstico de la demanda eléctrica
para el caso de la central térmica de Neyveli Unit- II (NTPS-II) en la
India. Se consideró funciones de pertenencia triangulares para las
variables de entrada: Tiempo del pronóstico (media noche, amanecer,
matutino, ante mediodía, post medio día, tarde, anochecer, noche) y
temperatura (sub normal, normal, sobre normal y alto) y la variable de
salida Pronóstico (Muy bajo, bajo, sub normal, normal, normal moderado,
normal, sobre normal, alto, muy alto). Al igual que las funciones de
pertenencia, las reglas difusas en la formulación de lógica difusa
proporcionan una manera intuitiva y directa de incluir heurísticas en
la previsión de carga. Al comparar el error de pronóstico entre el
método convencional (utilizado en ese estudio) y el método difuso, en
este último caso el error porcentual resulta inferior a ± 3%, lo cual
resulta de carácter significativo para este caso.
(Mamlook et al., 2009) modeló un
sistema de LD con funciones de pertenencia de formas gaussianas
considerando las variables de entrada: consumo del último día, consumo
de la última semana, temperatura del último día, temperatura
pronosticada, clima y el día. La data fue tomada la Compañía de Energía
Eléctrica Nacional (NEPCO en inglés) de Jordania y los resultados con
el modelo de LD arrojaron errores promedio de 1.3%, 3.2%, 2.2% y 1.2%
frente a 2%, 7.6%, 4.6% y 2.8%, respectivamente, para cuatro días
diferentes en el año 2007.
(Hong, 2010) consideró que, para
muchas técnicas que se basan en variables explicativas, un paso
importante es determinar qué variables explicativas utilizar y sus
formas funcionales; de esta manera propuso un mecanismo de “selección
de variables” (como método) y lo aplicó a tres técnicas diferentes para
PDECP: regresión lineal, ANN2
y regresión difusa. Los resultados mostraron que, para cada una de las
tres técnicas, el mecanismo propuesto fue capaz de reducir gradualmente
los errores de predicción.
(Gonzales, 2014) propuso el análisis estocástico con ARIMA3
como metodología para el pronóstico de la demanda eléctrica en el Perú.
En el estudio se realiza el pronóstico de cada una de las áreas
operativas consideradas por el COES-SINAC4 (operador del sistema eléctrico peruano) y se logra pasar de un MAPE5
de 2.3% con la metodología tradicional a 1.3% en el Área Centro con la
metodología propuesta, de 2.1% a 1.5% en el Área Sur y de 2.7% a 1.6%
en el Área Norte.
(Zuniga, Castilla, & Aguilar,
2014) realizaron dos modelos en LD para modelar los perfiles de consumo
de energía eléctrica para electrodomésticos e iluminación basadas en el
comportamiento de usuarios residenciales. En este caso la LD permite la
inclusión de características clave del comportamiento humano que
afectan el uso de varios aparatos e iluminación en el hogar. Como
resultado se muestran gráficos donde la propuesta es una herramienta
que, al combinar pocos datos de entrada y conocimiento experto, puede
aproximarse de cerca a la forma de los perfiles de consumo de los
aparatos y la iluminación.
(Vesely, Klöckner, & Dohnal,
2016) demostraron que la lógica difusa puede proporcionar una mejor
herramienta de predicción que una regresión lineal. Este estudio se
centró en la predicción del comportamiento de reciclaje de los
estudiantes de pregrado de cuatro universidades noruegas.
Se compararon los valores absolutos
medios de los residuos en las predicciones de la variable dependiente
(comportamiento de reciclaje) proporcionada por el modelo de lógica
difusa (0.48) y el modelo de regresión lineal (0.96).
El objetivo de este artículo es
utilizar lógica difusa para lograr un error menor en el pronóstico de
la demanda eléctrica diaria en comparación con el método tradicional en
Perú. El enfoque está dividido en 5 sub etapas enmarcadas dentro de 2
grandes etapas: 1) Pre procesamiento: Selección de la data según la
mecánica usada por el COES-SINAC, ordenamiento ascendente, agrupación
de datos con c-means y 2)
Pronóstico: Fusificación, inferencia, defusificación. La sub etapa de
agrupación y la etapa de pronóstico se repite para los casos de 01
hasta 24 “clústers” (grupos)
que definen el número de funciones de pertenencia, de cuya evaluación y
resultados con cada una de ellas elige el aquella con la cual se
obtenga el mínimo error.
La organización del artículo se
presenta de la siguiente manera: La primera sección detalla las
características más importantes de la demanda eléctrica del SEIN6;
la siguiente sección describe la metodología difusa propuesta,
posteriormente se presenta el caso de estudio aplicando la metodología
difusa, se muestran los resultados de la aplicación y finalmente se
presenta algunas conclusiones.
CARACTERÍSTICAS DE LA DEMANDA
La demanda eléctrica en el SEIN
considera los tres periodos horarios mostrados en la tabla 1, de
acuerdo con el nivel de potencia consumida durante un día completo:
Tabla 1. Periodos horarios SEIN.
Fuente: Elaboración propia con información del PR-03 (COES-SINAC, 2011).
En
la figura 1(a) se muestran los perfiles de demanda eléctrica típicas
para cada día de una semana. En este caso se consideró los días del
lunes 04 al domingo 10 de septiembre del 2017.
Figura 1. Demanda eléctrica del 04 al 10 de septiembre del 2017.
Fuente: Elaboración propia con datos de IDCOS7 (COES-SINAC, s.f.).
La
figura 1 muestra la existencia de una particularidad de la demanda
eléctrica propia de cada día, con variaciones evidentes y muy
representativas como en el caso de los días sábado y domingo.
Para denotar de mejor forma esta
variación, en la figura 2 se ha tomado datos de 05 días lunes
anteriores al lunes 11 y 05 días domingos anteriores al domingo 17 de
septiembre del 2017 y se ha realizado diagramas de caja8 en
los intervalos de tiempo correspondientes (cada 30 minutos) para
ilustrar la importante variación en la demanda eléctrica entre los días
lunes (magenta) y domingos (azul).
Figura 2. Demanda eléctrica del 04 al 10 de septiembre del 2017.
Fuente: Elaboración propia con datos de IDCOS (COES-SINAC, s.f.).
Por
otro lado, actualmente el COES-SINAC se encarga del cálculo del perfil
de la demanda eléctrica del día siguiente utilizando una metodología de
cálculo que implica la selección de la data histórica de acuerdo a la
tabla 2, depuración de datos atípicos y el pronóstico mediante
regresión lineal por mínimos cuadrados. Este procedimiento se realiza a
la demanda vegetativa de cada área operativa del SEIN considerada por
el COES-SINAC (Sur, Norte, Centro y Electroándes) que luego es sumada
con la demanda industrial (Usuarios Libres9 con demanda
mayor o igual a 10 MW) de cada área operativa obteniendo así la demanda
total por áreas. Finalmente se realiza la suma de las demandas totales
de las cuatro áreas operativas y se halla la demanda total del SEIN
(COES-SINAC, 2011).
Tabla 2. Selección de data histórica para el pronóstico de demanda eléctrica diaria.
Fuente: PR-03 (COES-SINAC, 2011).
METODOLOGÍA DIFUSA PROPUESTA
La figura 3 ilustra la metodología
propuesta en este artículo para el cálculo del perfil de la demanda
eléctrica del SEIN, la misma que será descrita con mayores detalles.
Figura 3. Metodología propuesta basada en reconocimiento de patrones y lógica difusa.
Fuente: Elaboración propia.
Base de datos
Este enfoque consta de una
selección de las series temporales históricas de la demanda eléctrica
del SEIN disponibles en el portal web del COES (COES-SINAC, s.f. ). Se
considera la selección de los días conforme a lo establecido en la
tabla 2. Por otra parte, la figura 1 y figura 2, demuestran la
importancia de considerar un análisis diario para la demanda eléctrica,
por lo que resulta también importante una clasificación más amplia de
los niveles de demanda eléctrica diaria, para ello es preferible tratar
con la “duración de la carga” de acuerdo al nivel de potencia (MW), la
cual consiste en ordenar los datos de la demanda diaria en forma
ascendente, tal como se muestra en la figura 1(b), la cual será
importante para la clasificación de “clústers” (grupos) mediante reconocimiento de patrones (c-means) de acuerdo a su nivel de potencia para poder determinar las correspondientes “funciones de pertenencia”.
Dado que los métodos basados en la
técnica de minería de datos en series temporales son capaces de
caracterizar y predecir con éxito series temporales complejas, no
periódicas, irregulares y caóticas (Povinelli, 1999), a continuación se
considera el estudio de “fuzzy c-means” como una técnica de descubrimiento de patrones útiles en datos que están ocultos y desconocidos en circunstancias normales.
Reconocimiento de patrones con fuzzy c-means
El agrupamiento de datos es el proceso de dividir los elementos de datos en clases o clústeres
para que los elementos de la misma clase sean lo más similares posible
y los elementos de las diferentes clases sean tan diferentes como sea
posible.
En el agrupamiento duro, los datos se dividen en clústeres nítidos, donde cada punto de datos pertenece exactamente a un clúster. En el agrupamiento fuzzy, los puntos de datos pueden pertenecer a más de un clúster. Hay muchos métodos de “clustering” hoy en día. En nuestro trabajo revisamos el método Fuzzy c-means clustering (fcm) en MATLAB (MathWorks, 2017) según (1):
Donde D es el número de puntos de datos, N es el número de grupos, m exponente de la matriz de participación difusa para controlar el grado de superposición difusa, con m > 1. La superposición difusa se refiere a cuán difusos son los límites entre clústeres, es decir, el número de puntos de datos que tienen una pertenencia significativa en más de un grupo; хi es el i-ésimo punto de datos, cj es el centro del j-ésimo clúster, μij es el grado de pertenencia de хi en el j-ésimo clúster.
Para un punto de datos dado, хi, la suma de los valores de pertenencia para todos los clústeres es uno.
Fcm realiza los siguientes pasos durante la agrupación:
1. Inicializa los valores de pertenencia de clúster μmij aleatoriamente,
2. Calcula los centros de clúster de acuerdo con (2),
3. Actualiza μij de acuerdo con la ecuación (3),
4. Calcular la función objetivo Jm,
5. Repite los pasos 2-4 hasta que Jm mejore en menos de un umbral mínimo especificado o hasta después de un número máximo especificado de iteraciones.
Como ejemplo se puede considerar los datos X e Y de la tabla 3, con el cual se realiza una clasificación de 03 “clúster” (grupos) y mediante la utilización del código “fcm” de MATLAB se obtiene la figura 4:
Tabla 3. Datos de ejemplo C-means.
Fuente: Elaboración propia.
Figura 4. Ejemplo reconocimiento de patrones con fuzzy C-means.
Fuente: Elaboración propia.
Luego
de la distribución de los puntos de acuerdo a la tabla 3, fcm
identifica los centroides (“centros”) de cada conjunto de datos
(representados con “x”). Para este caso, el algoritmo del fcm
identificó los clúster de acuerdo a tres niveles en la variable X.
Conjuntos difusos
Los conjuntos difusos fueron
formulados por (Zadeh, 1965) como una generalización de los conjuntos
clásicos en donde un elemento pertenece o no a un conjunto (denotándose
esto con el conjunto binario de valores de verdad {0,1} o {cierto,
falso}) y la lógica difusa permite adquirir valores de verdad
multivaluados, es decir, cualquier valor dentro del intervalo unitario
continuo {0,1} (Mugica, 1995).
Afirmaciones como alto, bajo,
lento, rápido, frío o caliente acerca de una variable son ambiguas
porque son afirmaciones del observador y pueden variar de un observador
a otro. Con conjuntos difusos se intenta modelar estas ambigüedades con
la que se percibe una variable y emular el pensamiento humano.
En suma, la lógica difusa es una
metodología que proporciona una manera simple y elegante de obtener una
conclusión a partir de información de entrada vaga, ambigua, imprecisa,
con ruido o incompleta (D´Negri & De Vito, 2015).
Definición:
Se tiene un posible rango de valores al cual llamaremos U, por ejemplo
U=Rn, donde Rn es un espacio de n dimensiones, a U se le denominará
Universo de Discurso (Set). En se tendrá un conjunto difuso (Set
difuso) de valores llamado F el cual es caracterizado por una función de pertenencia M embF : U → [0,1] como:
donde MembF (u) representa el grado de pertenencia de un u que pertenece a U en el conjunto difuso F (atributo).
Visto de otra manera la función MembF (u),
llamada función de pertenencia del atributo F, nos indica cual es el
grado de pertenencia de u (elemento) al atributo F (conjunto difuso)
definida por una “etiqueta” (variable lingüística) y tiene que ver con
un grado de ambigüedad sobre la característica de la variable que se
está midiendo
Variable lingüística:
Es una descripción simbólica constante utilizada para representar, en
general, una cantidad variable en el tiempo dentro del intervalo
definido por un universo de discurso. Los diferentes valores que esta
variable puede adquirir son conocidos como valores lingüísticos o
etiquetas lingüísticas.
Funciones de pertenencia10:
Las funciones de pertenencia representan el grado de pertenencia de un
elemento a un subconjunto definido por una etiqueta. Existe una gran
variedad de formas para las funciones de pertenencia, las más comunes
son del tipo trapezoidal, triangular, gaussiana y S, entre otras
utilizadas en MATLAB (MathWorks, 2017). Según (Fisher, 2006) no existe
una sola “mejor” forma de establecer parámetros en un modelo de lógica
difusa, esto podría implicar que la forma de función de pertenencia
puede comportarse favorablemente en ciertos casos, mientras que en
otros deberá cambiarse la forma hasta lograr un rendimiento aceptable
del modelo. Este enfoque heurístico se utilizó en el presente trabajo,
inicialmente con funciones de pertenencia de forma trapezoidal y luego
de forma gaussianas, destacando estas últimas sobre las primeras debido
a su mejor rendimiento evidente en el pronóstico de la demanda.
La función gaussiana depende de dos parámetros: Ʈ y μ y se puede calcular fácilmente con la ecuación (5):
donde х es la variable continua a ser codificada, i es la i-ésima clase del conjunto difuso F, μi es la media algebraica entre dos valores límite (“landmarks”) vecinos11, y Ʈi es determinada de tal forma que la función de pertenencia Membi, alcance el valor de 0.5 en los valores límite, tal como se muestra en la figura 9.
Como ejemplo se puede representar la variable lingüística ti = Temperatura interior en el rango Tint = [-10,50], tal que ti ∈ Tint,
que puede adquirir los valores lingüísticos (con sus respectivos
parámetros para forma gaussiana): Frío [10 0], agradable [10 20] y
caliente [10 40], tal como se muestra en la figura 5.
Con las definiciones de este
ejemplo se pueden construir expresiones lingüísticas del tipo: “La
temperatura está agradable”. Si la temperatura del termómetro marca
20°C, se puede representar como t = Tint,agradable con MembTint,agradable = 1.0.
A continuación, se describirá cada
una de las etapas que comprende todo sistema de lógica difusa, que en
este caso representa el conjunto de etapas final para el cálculo del
perfil de la demanda eléctrica.
Interfaz de fusificación12
Es el procedimiento matemático en
el que se convierte un elemento del universo de discurso (variable
medida del proceso) en un valor en cada función de pertenencia a las
cuales pertenece; es decir, convertir una cantidad “nítida” en difusa.
La figura 5 representa la fusificación de la variable lingüística “temperatura interior” del ejemplo de la sección 3.3.3:
Para un valor de la temperatura de 0 °C arroja los siguientes datos:
MembFrío (0) = 1.0000
MembAgradable (0) = 0.1353
MembCaliente (0) = 0.0000
El valor de la temperatura igual a 0 °C pertenece a tres conjuntos con distintos grados en cada uno.
A partir de ahora y durante el
resto de las operaciones en el interior del corazón difuso, estos datos
(1.0000, 0.1353 y 0.0000, son valores de las funciones de pertenencia)
representarán a las variables registradas en lo que corresponda al
proceso.
Figura 5. Ejemplo de fusificación de una variable.
Fuente: Elaboración propia.
Base de conocimiento
La Base de Conocimiento está
formada por dos componentes. 1) Base de Datos que mantiene los
parámetros y las características de cada una de las variables
lingüísticas. 2) Base de Reglas que almacena el conocimiento respecto a
la causalidad entre las variables de entrada y las variables de control.
Base de datos:
Proporciona información a la interfaz de fusificación al mecanismo de
inferencia y a la interfaz de defusificación. Asimismo, proporciona los
elementos del lenguaje para construir las reglas. Su contenido está
estructurado con respecto a cada variable lingüística y proporciona
para cada una: a) El número de valores lingüísticos, b) los parámetros
de la función de pertenencia correspondientes a cada valor lingüístico
y c) el factor de normalización y “desnormalización” aplicado al
universo de discurso (si lo hubiera).
Base de reglas:
Una vez definidas las variables difusas y sus respectivos valores
lingüísticos, es posible expresar el modelo cualitativo del sistema
difuso mediante el conjunto de reglas que las relacionan, pero al igual
que la base de datos, no existen métodos generales para obtener las
reglas adecuadas. (Sugeno & Murakami, 1985) presentaron cuatro
métodos para derivar las reglas de un sistema difuso: a) experiencia y
conocimiento de un experto, b) modelando de acciones de control que
ejerce el operador, c) modelando un proceso y d) auto organización.
Quizá la forma más común para representar el conocimiento humano es
formarlo en una expresión del lenguaje natural del tipo:
SI premisa (antecedente),
ENTONCES conclusión (consecuente)
(Timothy,
2010) establece que esta forma se conoce generalmente como la forma
deductiva. Típicamente expresa una inferencia tal que si conocemos un
hecho (premisa, hipótesis, antecedente), entonces podemos inferir, o
derivar, otro hecho llamado conclusión (consecuente).
En este estudio, se realizarán reglas intuitivas basadas en cada función de pertenencia hallada previamente con c-means. Por ejemplo: SI la potencia de entrada del día 01 es “baja”, ENTONCES el pronóstico será “bajo”.
Mecanismo de inferencia
El corazón de cualquier sistema
basado en lógica difusa es el mecanismo de inferencia. De acuerdo con
(Vesely, Klöckner, & Dohnal, 2016), el motor de inferencia busca en
la base de conocimiento disponible para predecir el valor de una
variable desconocida para un nuevo caso. Lo que sucede es que cada caso
nuevo se compara con la base de conocimiento de casos existentes y se
hace una predicción sobre la variable desconocida para el nuevo caso
basada en los valores de esta variable en casos similares incluidos en
la base de conocimientos. En otras palabras, las reglas difusas
representan el conocimiento y la estrategia de control, pero cuando se
asigna información específica a las variables de entrada en el
antecedente, la inferencia difusa es necesaria para calcular el
resultado de las variables de salida del consecuente, este resultado se
obtiene en términos difusos, es decir que se obtiene un conjunto difuso
de salida de cada regla, que posteriormente junto con las demás salidas
de reglas se obtendrá la salida del sistema.
De la gran cantidad de métodos de
inferencia difusa, existen cuatro que generan mejores resultados, estos
son (Patel & Mohan, 2004): a) Sistema de inferencia Mamdani, b)
método Larsen, c) inferencia basada en funciones monótonas y c) sistema
de inferencia Sugeno. En este artículo se utilizará el sistema de
inferencia Mamdani, propuesto en (Mamdani & Assilian, 1975).
Interfaz de defusificación
El proceso de defusificación es el
proceso matemático inverso de la fusificación, es decir, es el proceso
de convertir un conjunto o valor difuso (o una conclusión difusa) en
información concreta expresada mediante un escalar (número real).
El sistema de inferencia difusa
obtiene una conclusión a partir de la información de la entrada, pero
en términos difusos. Esta conclusión o salida difusa es obtenida por la
etapa de inferencia difusa, la cual genera un conjunto difuso pero el
dato de salida del sistema debe ser un número real y debe ser
representativo de todo el conjunto obtenido en la etapa de agregado. De
los diferentes métodos de defusificación existentes el más común y
ampliamente utilizado es el método del centroide o centro de gravedad.
Con este método se transforma la salida difusa en un número real el
cual es la coordenada equis (x) del centro de gravedad de tal conjunto
difuso de salida. En este artículo se utilizará este método ya
implementado en la herramienta Fuzzy Logic Toolbox de MATLAB. La figura 6 muestra un ejemplo de defusificación del ejemplo mostrado en la figura 5:
Figura 6. Defusificación con el método centroide. Salida = 19.2.
Fuente: Elaboración propia en Fuzzy Logic Toolbox de MATLAB.
Finalmente,
el sistema difuso será el mostrado en la figura 7, donde las entradas
corresponden a los datos de los días seleccionados de acuerdo a lo
mencionado en la sección 3.1, el sistema de inferencia mamdani con una
base de reglas intuitiva correspondiente a una relación directa uno a
uno de acuerdo con el preprocesamiento con c-means y los datos de salida correspondientes a los datos del pronóstico hallado.
Figura 7. Sistema difuso para el cálculo del pronóstico de demanda eléctrica.
Fuente: Elaboración propia en Fuzzy Logic Toolbox de MATLAB.
CASO DE ESTUDIO
En este estudio se realizará el
pronóstico de la demanda eléctrica para la semana 37 del presente año,
correspondiente a los días del lunes 11 al domingo 17 de Septiembre del
2017. De acuerdo a lo mencionado en la Base de datos, los días
seleccionados para iniciar con la metodología son los mostrados en la
tabla 4.
Con los datos de los 05 días seleccionados se realizará el ordenamiento ascendente con su correspondiente clasificación con fuzzy c-means como se muestra en la figura 8 (para el caso de pronosticar el día domingo):
Tabla 4. Selección de días (datos históricos).
Fuente: Elaboración propia.
Figura 8. Ordenamiento de la data y clasificación con c-means (04 clúster).
Fuente: Elaboración propia.
Esta clasificación permite obtener el centro de cada "clúster” e identificar el mínimo y máximo de los mismos. En este paso, los valores mínimos de cada “clúster” representarán las marcas de clase (landmarks), mediante las cuales luego se determina un nuevo centro para formar las funciones de pertenencia (FP13) como se puede identificar en la figura 9.
Figura 9. Funciones de pertenencia identificadas (04 FP).
Fuente: Elaboración propia.
En
este estudio se evaluarán los resultados obtenidos desde 01 hasta 24
funciones de pertenencia (FP) para la demanda eléctrica de cada día a
pronosticar y se elige como óptima aquella con la cual se obtiene el
menor error MAPE.
RESULTADOS
El estudio calcula el pronóstico de
la demanda eléctrica de cada día, realiza el cálculo del MAPE tanto con
la solución con lógica difusa y con el método tradicional. El cálculo
con lógica difusa comprende la realización del pronóstico con cada una
de las funciones de pertenencia halladas por medio de c-means
(24 FP) y se elige el resultado con menor error de pronóstico. La tabla
5 muestra los resultados encontrados para cada día, con el respectivo
cálculo donde el número de función de pertenencia óptimo (FPopt) es
aquel que brinda el menor error. La figura 10 muestra la variación del
error MAPE de acuerdo con el número de funciones de pertenencia
calculados en cada día.
Tabla 5. Selección de días (datos históricos).
Fuente: Elaboración propia.
Figura 10. Tendencia del MAPE de acuerdo al número de FP.
Fuente: Elaboración propia.
La
figura 10 muestra gráficamente que el número de funciones de
pertenencia influye directamente en la obtención del resultado óptimo
de pronóstico. Sin embargo, es evidente que las buenas aproximaciones
podrían obtenerse a partir de 6 funciones de pertenencia, mientras que
resultados inferiores a este número de FP producen pronósticos con MAPE
muy elevado para nuestro propósito.
La figura 11 muestra claramente una
mejor aproximación de pronóstico para el día 13 de septiembre del 2017
cuyo MAPE obtenido con 18 funciones de pertenencia con lógica difusa es
de 1.51%, mientras que con el método tradicional sobrepasa el 2% de
acuerdo con la tabla 5.
Figura 11. Perfil de demanda eléctrica miércoles 13 de septiembre del 2017.
Fuente: Elaboración propia.
De
la tabla 5, de todos los días pronosticados, el mejor rendimiento se
obtiene para el día 12 de septiembre del 2016 para el cálculo con 9
funciones de pertenencia con lógica difusa. Por otro lado, el método
difuso presenta dos días en los cuales el MAPE resulta mayor al del
método tradicional. Estos resultados corresponden a los días jueves 14
y viernes 15 de septiembre de 2017. Estos casos “extremos” se analizan
gráficamente según la figura 12 y figura 13.
Figura 12. Perfil de demanda eléctrica martes 12 de septiembre del 2017.
Fuente: Elaboración propia.
Figura 13. Perfil de demanda eléctrica jueves 14 de septiembre del 2017.
Fuente: Elaboración propia.
De
la figura 12 y figura 13, evidentemente el sistema difuso se
desenvuelve dentro del margen de los datos de entrada. El intervalo
horario del 1 al 17 y del 39 al 43 en la figura 13, muestra que la
demanda ejecutada fue un caso excepcional pues muestra datos atípicos
con respecto a la data histórica considerada para para el pronóstico de
ese día. Esto se puede considerar como limitación para el enfoque con
lógica difusa propuesto cuando se deben pronosticar casos que no tienen
un caso de referencia en la base de datos de conocimiento. Mientras una
regresión puede (al menos en teoría) ser extrapolada a valores
extremos, el modelo de lógica difusa falla si no se encuentra un caso
similar en la base de conocimiento (Vesely, Klöckner, & Dohnal,
2016).
Una alternativa para poder “forzar”
una mejor aproximación se puede lograr si se consideran parámetros
adicionales en la entrada del sistema difuso como el nivel de
temperatura en cada hora, humedad, cambios en la tasa de producción o
consumo.
Por otro lado, desde un punto de
vista general, el pronóstico difuso propuesto muestra una tendencia
similar al método convencional pero con la ventaja de una mayor
aproximación (MAPE <1.5% en muchos casos).
Por lo tanto, el pronóstico
convencional utilizado por los operadores del sistema eléctrico puede
ser reemplazado por este enfoque como un sistema moderno de
administración de energía en primera instancia.
CONCLUSIONES
El PDECP es una actividad básica
pero necesaria e imprescindible para estimar las necesidades de los
consumidores de energía eléctrica, por lo que la precisión del cálculo
juega un papel importante para una adecuada gestión operativa,
económica y técnica del sistema eléctrico.
Para este propósito, la lógica
difusa cuenta con ventajas al condensar gran cantidad de datos en
pequeños grupos de reglas variables, considerar la experiencia humana
para inferir el propósito deseado de un pronóstico preciso, mayor
rapidez y precisión que el método de pronóstico convencional que trata
con datos rígidos y requiere mayor tiempo de procesamiento.
Con estas ventajas a favor, este
enfoque propone tres contribuciones al estado del arte del PDECP: 1)
metodología no lineal basada en lógica difusa. 2) Reconocimiento de
patrones de demanda eléctrica con c-means
y 3) relevancia del número de FP; logrando de esta manera errores
inferiores a su correspondiente cálculo con la metodología tradicional.
Finalmente, nuestro modelo hace
referencia solo a demanda histórica como datos de entrada, por lo que
es posible mejorar la precisión (reducir el error) al agregar variables
de entrada como el clima, factores económicos y/o sociales, etc. O al
complementar la metodología con un proceso de optimización cuya función
objetivo sea la minimización del error.
REFERENCIAS
Ambalal, V. P. (2004).
Transformation Functions for Trapezoidal Membership Functions.
International Journal of Computational Cognition, 2(3), 115-135.
Badri, A., Ameli, Z., &
Birjandi, A. (2012). Application of artificial neural networks and
fuzzy logic methods for short term load forecasting. Energy Procedia,
14, 1883-1888.
COES-SINAC. (2011, Enero 15).
Procedimientos Técnicos: 03 Pronóstico de la Demanda a Corto Plazo del
Sistema Interconectado Nacional. Retrieved from Marco Normativo:
http://www.coes.org.pe/Portal/MarcoNormativo/Proce dimientos/Tecnicos
COES-SINAC. (s.f. ). IDCOS (Informe
Diario del Coordinador de la Operación del Sistema). Retrieved from
Post Operacion: http://www.coes.org.pe/Portal/PostOperacion/Reportes/
Idcos
D´Negri, C., & De Vito, E.
(2015). Sistema de Información Científica Redalyc. Retrieved from
Universidad Autónoma del Estado de México: http://www.redalyc.org/
html/3821/38213867007/
Feng, X., & Huang, H. (2005). A
Fuzzy-Set-Based Reconstructed Phase Space Method for Identification of
Temporal Patterns in Complex Time Series. IEEE Trans. on Knowledge and
Data Engineering, 17(5), 601-613.
Fisher, B. (2006). Fuzzy approaches
to environmental decisions: application to air quality. Environmental
Science & Policy, 9(1), 22-31.
Gonzales, S. (2014). Pronóstico
eficiente de la demanda diaria del Sistema Eléctrico Interconectado del
Perú mediante análisis estocástico ARIMA con sucesos externos. TECNIA,
24(1), 87-98.
Hong, T. (2010). Short term electric load forecasting. North Carolina State University.
Hong, T. (2014). Energy
forecasting: past, present, and future. Foresight: The International
Journal of Forecasting, 2014(32), 43-49.
Mamdani, E., & Assilian, S.
(1975). An experiment in linguistic synthesis with a fuzzy logic
controller. International journal of man-machine studies, 7(1), 1-13.
Mamlook, R., Badran, O., &
Abdulhadi, E. (2009). A fuzzy inference model for short-term load
forecasting. Energy Policy, 37, 1239-1248.
MathWorks. (2017). Foundations of
Fuzzy Logic. Retrieved from https://www.mathworks.com/help/fuzzy/founda
tions-of-fuzzy-logic.html#bp78l70-2
MathWorks. (2017). MathWorks. Retrieved from Documentation: https://www.mathworks.com/help/fuzzy /fcm.html
Mugica, F. (1995). Diseño
sistemático de controladores difusos usando razonamiento inductivo.
Tesis de disertación doctoral. Barcelona.
Pandian, S., Duraiswamy, K., Rajan,
C., & Kanagaraj, N. (2006). Fuzzy approach for short term load
forecasting. Electric Power Systems Research, 76(6), 541-548.
Patel, A., & Mohan, B. (2004).
Transformation functions for trapezoidal membership functions.
International Journal of Computational Cognition, 2(3), 115-135.
Povinelli, R. (1999). Time Series
Data Mining: Identifying Temporal Patterns for Characterization and
Prediction of Time Series Events. Ph.D. Dissertation. Marquette
University.
Song, K., Baek, Y., Hong, D., &
Jang, G. (2005). Short-term load forecasting for the holidays using
fuzzy linear regression method. IEEE transactions on power systems,
20(1), 96- 101.
Sugeno, M., & Murakami, M.
(1985). An Experimental Study on Parking Control Using a Model Car.
Industrial Applications of Fuzzy Control, 125-138.
Timothy, J. R. (2010). Fuzzy Logic with Engineering Applications. United Kingdom: WILEY.
Vesely, S., Klöckner, C., &
Dohnal, M. (2016). Predicting recycling behaviour: Comparison of a
linear regression model and a fuzzy logic model. Waste management, 49,
530- 536.
Ying, L.-C., & Pan, M.-C.
(2008). Using adaptive network based fuzzy inference system to forecast
regional electricity loads. Energy Conversion and Management, 49,
205-211.
Zadeh, L. (1965). Fuzzy sets. Information and Control, 8(3), 338-353.
Zuniga, K., Castilla, I., &
Aguilar, R. (2014). Using fuzzy logic to model the behavior of
residential electrical utility customers. Applied Energy, 115, 384-393.
------------
Pie de página:
1 Short Term Load Forecasting (STLF) en inglés.
2 Artificial Neural Network (Redes neuronales artificiales)
3 Autoregressive integrated moving average (Modelo autorregresivo integrado de media móvil)
4 Comité de Operación Económica del Sistema Eléctrico Interconectado Nacional
5 Mean absolute percentage error (Error porcentual absoluto medio)
6 Sistema Eléctrico Interconectado Nacional
7 Informe Diarios del Coordinador de la Operación del Sistema
8 “Boxplot” en inglés.
9 Según el Decreto Supremo
N°022-2009-EM, los Usuarios Libres son aquellos usuarios que no se
encuentran sujetos a regulación de precios.
10 Membership function para el término en inglés
11 En el caso de la función gaussiana, este valor es el centro de la función y a la vez toma el máximo valor.
12 No existe un término en idioma
Español que describa el proceso de transformar la información concreta
en información difusa. Por ello, para efectos del artículo, se define
el término “fusificación” como significado de: a) la codificación de un
valor expresado en forma ‘escalar’ en un(os) valor(es) ‘difuso(s)’ y b)
el proceso de representar la información concreta en información difusa.
13 Membership function (mf) por defecto en MATLAB