Ene-2-1-banner


PRONÓSTICO DE LA DEMANDA ELÉCTRICA A CORTO PLAZO CON LÓGICA DIFUSA


Jordan Blancas1, Julien Noel2

1Becario Maestría en Ciencias con Mención en Energética, Universidad Nacional de Ingeniería-Fondecyt, Ingeniero Mecánico Electricista (Perú)
jblancass@uni.pe

2Universidad de Ingeniería y Tecnología –UTEC, Ingeniería de la Energía (Perú)
jnoel@utec.edu.pe


Recibido: 14/05/2018 y Aceptado: 25/07/2018

ENERLAC. Volumen II. Número 1. Septiembre, 2018 (8-27).

Ene-2-1-a1-g1


RESUMEN

En este artículo, lógica difusa es aplicada al problema del pronóstico de la demanda eléctrica de corto plazo (día siguiente). Para lograrlo es necesario seleccionar los datos históricos de la demanda real ejecutada para el periodo de estudio y pre procesarlos con el método c-means agrupándolos de acuerdo a niveles de potencia (MW) para definir la cantidad de funciones de pertenencia del sistema difuso, el cual influye en el cálculo del menor error de pronóstico. Esta metodología es aplicada para pronosticar la demanda eléctrica diaria del Sistema Eléctrico peruano y mediante el cálculo del error MAPE se demuestra que brinda mejores resultados que la metodología tradicional utilizada.

Palabras Clave: Demanda Eléctrica, Lógica Difusa, Pronóstico, C-medios, Sistema Eléctrico Interconectado.

Abstract

In this paper, fuzzy logic is applied to the problem of short-term load forecasting (next day). To achieve this, it is necessary to select the historical data of the actual demand executed for the study period and to pre-process them using the c-means method, grouping them according to power levels (MW) to define the number of membership functions to the fuzzy system, which influences the calculation of the lowest forecast error. This methodology is applied to predict the daily electrical demand of the Peruvian Electricity System and by calculating the MAPE error it is shown that the fuzzy logic offers better results than the traditional methodology used.

Keywords: Electric Demand, Fuzzy Logic, Forecast, C-means, Interconnected Electrical System.


INTRODUCCIÓN

En todos los horizontes de tiempo, el pronóstico de la demanda eléctrica ha cumplido un rol importante en la industria eléctrica por más de un siglo (Hong, 2014) debido a su impacto tanto en la economía (previsión de precios en los mercados de energía) como en el planeamiento, la operación confiable y el mantenimiento de los sistemas eléctricos. Para el caso del horizonte de corto plazo (día siguiente) se puede mencionar que si la demanda eléctrica resulta ser más baja que los valores pronosticados, entonces la energía generada será más costosa e ineficiente y, por otra parte, si la demanda eléctrica es mayor de lo previsto, entonces las restricciones de seguridad como los márgenes de reserva, la frecuencia y la fiabilidad del sistema pueden estar en riesgo (Pandian, Duraiswamy, Rajan, & Kanagaraj, 2006).

Resulta entonces importante lograr la mejor aproximación posible a la demanda eléctrica a suministrar, puesto que un pronóstico preciso no sólo puede mejorar el rendimiento de gestión de la industria eléctrica, sino también disminuir la frecuencia de ocurrencia de interrupciones para aumentar el grado de satisfacción de los usuarios.

Con este propósito, hasta ahora se han desarrollado varios estudios para mejorar la exactitud del pronóstico de la demanda eléctrica. De acuerdo con (Ying & Pan, 2008), estos estudios se pueden dividir en cinco grandes categorías: modelos de series temporales, modelos basados en regresión, espacio de estados y tecnología de filtrado de Kalman, técnicas de inteligencia artificial y métodos de lógica difusa.

A pesar de los estudios realizados, el problema de predicción de la demanda de energía eléctrica aún es difícil de manejar debido al comportamiento no lineal y al azar de la variación del consumo eléctrico influido por factores como: (a) Clima, (b) tiempo, (c) data histórica e (c) incertidumbres (envejecimiento de las máquinas, las fluctuaciones, pérdidas en líneas de transmisión, inestabilidad de tensión y frecuencia, etc.).

Estas incertidumbres pueden ser tratadas con la implementación de lógica difusa (LD) en el cálculo del pronóstico de la demanda eléctrica de corto plazo (PDECP)1. La LD resulta un enfoque efectivo para tratar estas incertezas pues se caracteriza por generalizar la lógica clásica de dos valores (0, 1) para el razonamiento en condiciones no lineales e inciertas; por lo tanto, resulta el método más apropiado para describir el “conocimiento humano” (información) que contiene conceptos vagos y gran cantidad de datos.

Por otro lado, el sistema actual de PDECP en Perú está basado en técnicas de modelado estadístico (regresión lineal con mínimos cuadrados) y según lo mencionado y de acuerdo con (Mamlook, Badran, & Abdulhadi, 2009), estas técnicas tienen posibilidades limitadas de predecir cargas precisas para días anormales cuando ocurren algunos eventos irregulares, lo cual puede solucionarse con el uso de LD.

(Song, Baek, Hong, & Jang, 2005) utilizaron regresión lineal difusa para pronosticar las cargas para los días feriados en Corea del Sur. El modelo mostró un importante y prometedor nivel de precisión en comparación con un enfoque de inferencia difusa y redes neuronales, con errores promedio de 3.57% y 5.51%, respectivamente. El enfoque propuesto resalta porque pronosticaba la demanda eléctrica basada solamente la data histórica de la misma sin considerar la entrada de información meteorológica.

(Pandian et al., 2006) propuso un sistema de lógica difusa para el pronóstico de la demanda eléctrica para el caso de la central térmica de Neyveli Unit- II (NTPS-II) en la India. Se consideró funciones de pertenencia triangulares para las variables de entrada: Tiempo del pronóstico (media noche, amanecer, matutino, ante mediodía, post medio día, tarde, anochecer, noche) y temperatura (sub normal, normal, sobre normal y alto) y la variable de salida Pronóstico (Muy bajo, bajo, sub normal, normal, normal moderado, normal, sobre normal, alto, muy alto). Al igual que las funciones de pertenencia, las reglas difusas en la formulación de lógica difusa proporcionan una manera intuitiva y directa de incluir heurísticas en la previsión de carga. Al comparar el error de pronóstico entre el método convencional (utilizado en ese estudio) y el método difuso, en este último caso el error porcentual resulta inferior a ± 3%, lo cual resulta de carácter significativo para este caso.

(Mamlook et al., 2009) modeló un sistema de LD con funciones de pertenencia de formas gaussianas considerando las variables de entrada: consumo del último día, consumo de la última semana, temperatura del último día, temperatura pronosticada, clima y el día. La data fue tomada la Compañía de Energía Eléctrica Nacional (NEPCO en inglés) de Jordania y los resultados con el modelo de LD arrojaron errores promedio de 1.3%, 3.2%, 2.2% y 1.2% frente a 2%, 7.6%, 4.6% y 2.8%, respectivamente, para cuatro días diferentes en el año 2007.

(Hong, 2010) consideró que, para muchas técnicas que se basan en variables explicativas, un paso importante es determinar qué variables explicativas utilizar y sus formas funcionales; de esta manera propuso un mecanismo de “selección de variables” (como método) y lo aplicó a tres técnicas diferentes para PDECP: regresión lineal, ANN2 y regresión difusa. Los resultados mostraron que, para cada una de las tres técnicas, el mecanismo propuesto fue capaz de reducir gradualmente los errores de predicción.

(Gonzales, 2014) propuso el análisis estocástico con ARIMA3 como metodología para el pronóstico de la demanda eléctrica en el Perú. En el estudio se realiza el pronóstico de cada una de las áreas operativas consideradas por el COES-SINAC4 (operador del sistema eléctrico peruano) y se logra pasar de un MAPE5 de 2.3% con la metodología tradicional a 1.3% en el Área Centro con la metodología propuesta, de 2.1% a 1.5% en el Área Sur y de 2.7% a 1.6% en el Área Norte.

(Zuniga, Castilla, & Aguilar, 2014) realizaron dos modelos en LD para modelar los perfiles de consumo de energía eléctrica para electrodomésticos e iluminación basadas en el comportamiento de usuarios residenciales. En este caso la LD permite la inclusión de características clave del comportamiento humano que afectan el uso de varios aparatos e iluminación en el hogar. Como resultado se muestran gráficos donde la propuesta es una herramienta que, al combinar pocos datos de entrada y conocimiento experto, puede aproximarse de cerca a la forma de los perfiles de consumo de los aparatos y la iluminación.

(Vesely, Klöckner, & Dohnal, 2016) demostraron que la lógica difusa puede proporcionar una mejor herramienta de predicción que una regresión lineal. Este estudio se centró en la predicción del comportamiento de reciclaje de los estudiantes de pregrado de cuatro universidades noruegas.

Se compararon los valores absolutos medios de los residuos en las predicciones de la variable dependiente (comportamiento de reciclaje) proporcionada por el modelo de lógica difusa (0.48) y el modelo de regresión lineal (0.96).

El objetivo de este artículo es utilizar lógica difusa para lograr un error menor en el pronóstico de la demanda eléctrica diaria en comparación con el método tradicional en Perú. El enfoque está dividido en 5 sub etapas enmarcadas dentro de 2 grandes etapas: 1) Pre procesamiento: Selección de la data según la mecánica usada por el COES-SINAC, ordenamiento ascendente, agrupación de datos con c-means y 2) Pronóstico: Fusificación, inferencia, defusificación. La sub etapa de agrupación y la etapa de pronóstico se repite para los casos de 01 hasta 24 “clústers” (grupos) que definen el número de funciones de pertenencia, de cuya evaluación y resultados con cada una de ellas elige el aquella con la cual se obtenga el mínimo error.

La organización del artículo se presenta de la siguiente manera: La primera sección detalla las características más importantes de la demanda eléctrica del SEIN6; la siguiente sección describe la metodología difusa propuesta, posteriormente se presenta el caso de estudio aplicando la metodología difusa, se muestran los resultados de la aplicación y finalmente se presenta algunas conclusiones.


CARACTERÍSTICAS DE LA DEMANDA

La demanda eléctrica en el SEIN considera los tres periodos horarios mostrados en la tabla 1, de acuerdo con el nivel de potencia consumida durante un día completo:

Tabla 1. Periodos horarios SEIN.

Ene-2-1-a1-g2
Fuente: Elaboración propia con información del PR-03 (COES-SINAC, 2011).


En la figura 1(a) se muestran los perfiles de demanda eléctrica típicas para cada día de una semana. En este caso se consideró los días del lunes 04 al domingo 10 de septiembre del 2017.

Figura 1. Demanda eléctrica del 04 al 10 de septiembre del 2017.

Ene-2-1-a1-g3
Fuente: Elaboración propia con datos de IDCOS7 (COES-SINAC, s.f.).


La figura 1 muestra la existencia de una particularidad de la demanda eléctrica propia de cada día, con variaciones evidentes y muy representativas como en el caso de los días sábado y domingo.

Para denotar de mejor forma esta variación, en la figura 2 se ha tomado datos de 05 días lunes anteriores al lunes 11 y 05 días domingos anteriores al domingo 17 de septiembre del 2017 y se ha realizado diagramas de caja8 en los intervalos de tiempo correspondientes (cada 30 minutos) para ilustrar la importante variación en la demanda eléctrica entre los días lunes (magenta) y domingos (azul).

Figura 2. Demanda eléctrica del 04 al 10 de septiembre del 2017.

Ene-2-1-a1-g4
Fuente: Elaboración propia con datos de IDCOS (COES-SINAC, s.f.).


Por otro lado, actualmente el COES-SINAC se encarga del cálculo del perfil de la demanda eléctrica del día siguiente utilizando una metodología de cálculo que implica la selección de la data histórica de acuerdo a la tabla 2, depuración de datos atípicos y el pronóstico mediante regresión lineal por mínimos cuadrados. Este procedimiento se realiza a la demanda vegetativa de cada área operativa del SEIN considerada por el COES-SINAC (Sur, Norte, Centro y Electroándes) que luego es sumada con la demanda industrial (Usuarios Libres9 con demanda mayor o igual a 10 MW) de cada área operativa obteniendo así la demanda total por áreas. Finalmente se realiza la suma de las demandas totales de las cuatro áreas operativas y se halla la demanda total del SEIN (COES-SINAC, 2011).

Tabla 2. Selección de data histórica para el pronóstico de demanda eléctrica diaria.

Ene-2-1-a1-g5
Fuente: PR-03 (COES-SINAC, 2011).


METODOLOGÍA DIFUSA PROPUESTA

La figura 3 ilustra la metodología propuesta en este artículo para el cálculo del perfil de la demanda eléctrica del SEIN, la misma que será descrita con mayores detalles.

Figura 3. Metodología propuesta basada en reconocimiento de patrones y lógica difusa.

Ene-2-1-a1-g6
Fuente: Elaboración propia.


Base de datos

Este enfoque consta de una selección de las series temporales históricas de la demanda eléctrica del SEIN disponibles en el portal web del COES (COES-SINAC, s.f. ). Se considera la selección de los días conforme a lo establecido en la tabla 2. Por otra parte, la figura 1 y figura 2, demuestran la importancia de considerar un análisis diario para la demanda eléctrica, por lo que resulta también importante una clasificación más amplia de los niveles de demanda eléctrica diaria, para ello es preferible tratar con la “duración de la carga” de acuerdo al nivel de potencia (MW), la cual consiste en ordenar los datos de la demanda diaria en forma ascendente, tal como se muestra en la figura 1(b), la cual será importante para la clasificación de “clústers” (grupos) mediante reconocimiento de patrones (c-means) de acuerdo a su nivel de potencia para poder determinar las correspondientes “funciones de pertenencia”.

Dado que los métodos basados en la técnica de minería de datos en series temporales son capaces de caracterizar y predecir con éxito series temporales complejas, no periódicas, irregulares y caóticas (Povinelli, 1999), a continuación se considera el estudio de “fuzzy c-means” como una técnica de descubrimiento de patrones útiles en datos que están ocultos y desconocidos en circunstancias normales.

Reconocimiento de patrones con fuzzy c-means

El agrupamiento de datos es el proceso de dividir los elementos de datos en clases o clústeres para que los elementos de la misma clase sean lo más similares posible y los elementos de las diferentes clases sean tan diferentes como sea posible.

En el agrupamiento duro, los datos se dividen en clústeres nítidos, donde cada punto de datos pertenece exactamente a un clúster. En el agrupamiento fuzzy, los puntos de datos pueden pertenecer a más de un clúster. Hay muchos métodos de “clustering” hoy en día. En nuestro trabajo revisamos el método Fuzzy c-means clustering (fcm) en MATLAB (MathWorks, 2017) según (1):


Ene-2-1-a1-g7

Donde D es el número de puntos de datos, N es el número de grupos, m exponente de la matriz de participación difusa para controlar el grado de superposición difusa, con m > 1. La superposición difusa se refiere a cuán difusos son los límites entre clústeres, es decir, el número de puntos de datos que tienen una pertenencia significativa en más de un grupo; хi es el i-ésimo punto de datos, cj es el centro del j-ésimo clúster, μij es el grado de pertenencia de хi  en el j-ésimo clúster.

Para un punto de datos dado, хi, la suma de los valores de pertenencia para todos los clústeres es uno.

Fcm realiza los siguientes pasos durante la agrupación:
1. Inicializa los valores de pertenencia de clúster μmij aleatoriamente,
2. Calcula los centros de clúster de acuerdo con (2),
3. Actualiza μij de acuerdo con la ecuación (3),
4. Calcular la función objetivo Jm,
5. Repite los pasos 2-4 hasta que
Jm mejore en menos de un umbral mínimo especificado o hasta después de un número máximo especificado de iteraciones.

Ene-2-1-a1-g8

Como ejemplo se puede considerar los datos X e Y de la tabla 3, con el cual se realiza una clasificación de 03 “clúster” (grupos) y mediante la utilización del código “fcm” de MATLAB se obtiene la figura 4:

Tabla 3. Datos de ejemplo C-means.

Ene-2-1-a1-g9
Fuente: Elaboración propia.


Figura 4. Ejemplo reconocimiento de patrones con fuzzy C-means.

Ene-2-1-a1-g10
Fuente: Elaboración propia.


Luego de la distribución de los puntos de acuerdo a la tabla 3, fcm identifica los centroides (“centros”) de cada conjunto de datos (representados con “x”). Para este caso, el algoritmo del fcm identificó los clúster de acuerdo a tres niveles en la variable X.

Conjuntos difusos

Los conjuntos difusos fueron formulados por (Zadeh, 1965) como una generalización de los conjuntos clásicos en donde un elemento pertenece o no a un conjunto (denotándose esto con el conjunto binario de valores de verdad {0,1} o {cierto, falso}) y la lógica difusa permite adquirir valores de verdad multivaluados, es decir, cualquier valor dentro del intervalo unitario continuo {0,1} (Mugica, 1995).

Afirmaciones como alto, bajo, lento, rápido, frío o caliente acerca de una variable son ambiguas porque son afirmaciones del observador y pueden variar de un observador a otro. Con conjuntos difusos se intenta modelar estas ambigüedades con la que se percibe una variable y emular el pensamiento humano.

En suma, la lógica difusa es una metodología que proporciona una manera simple y elegante de obtener una conclusión a partir de información de entrada vaga, ambigua, imprecisa, con ruido o incompleta (D´Negri & De Vito, 2015).

Definición: Se tiene un posible rango de valores al cual llamaremos U, por ejemplo U=Rn, donde Rn es un espacio de n dimensiones, a U se le denominará Universo de Discurso (Set). En se tendrá un conjunto difuso (Set difuso) de valores llamado F el cual es caracterizado por una función de pertenencia M embF : U → [0,1] como:

Ene-2-1-a1-g11

donde MembF (u) representa el grado de pertenencia de un u que pertenece a U en el conjunto difuso F (atributo).

Visto de otra manera la función MembF (u), llamada función de pertenencia del atributo F, nos indica cual es el grado de pertenencia de u (elemento) al atributo F (conjunto difuso) definida por una “etiqueta” (variable lingüística) y tiene que ver con un grado de ambigüedad sobre la característica de la variable que se está midiendo

Variable lingüística: Es una descripción simbólica constante utilizada para representar, en general, una cantidad variable en el tiempo dentro del intervalo definido por un universo de discurso. Los diferentes valores que esta variable puede adquirir son conocidos como valores lingüísticos o etiquetas lingüísticas.

Funciones de pertenencia10: Las funciones de pertenencia representan el grado de pertenencia de un elemento a un subconjunto definido por una etiqueta. Existe una gran variedad de formas para las funciones de pertenencia, las más comunes son del tipo trapezoidal, triangular, gaussiana y S, entre otras utilizadas en MATLAB (MathWorks, 2017). Según (Fisher, 2006) no existe una sola “mejor” forma de establecer parámetros en un modelo de lógica difusa, esto podría implicar que la forma de función de pertenencia puede comportarse favorablemente en ciertos casos, mientras que en otros deberá cambiarse la forma hasta lograr un rendimiento aceptable del modelo. Este enfoque heurístico se utilizó en el presente trabajo, inicialmente con funciones de pertenencia de forma trapezoidal y luego de forma gaussianas, destacando estas últimas sobre las primeras debido a su mejor rendimiento evidente en el pronóstico de la demanda.

La función gaussiana depende de dos parámetros: Ʈ y μ y se puede calcular fácilmente con la ecuación (5):

Ene-2-1-a1-g12

donde х es la variable continua a ser codificada, i es la i-ésima clase del conjunto difuso F, μi es la media algebraica entre dos valores límite (“landmarks”) vecinos11, y Ʈi es determinada de tal forma que la función de pertenencia Membi, alcance el valor de 0.5 en los valores límite, tal como se muestra en la figura 9.

Como ejemplo se puede representar la variable lingüística ti = Temperatura interior en el rango Tint = [-10,50], tal que tiTint, que puede adquirir los valores lingüísticos (con sus respectivos parámetros para forma gaussiana): Frío [10 0], agradable [10 20] y caliente [10 40], tal como se muestra en la figura 5.

Con las definiciones de este ejemplo se pueden construir expresiones lingüísticas del tipo: “La temperatura está agradable”. Si la temperatura del termómetro marca 20°C, se puede representar como t = Tint,agradable con MembTint,agradable = 1.0.

A continuación, se describirá cada una de las etapas que comprende todo sistema de lógica difusa, que en este caso representa el conjunto de etapas final para el cálculo del perfil de la demanda eléctrica.

Interfaz de fusificación12

Es el procedimiento matemático en el que se convierte un elemento del universo de discurso (variable medida del proceso) en un valor en cada función de pertenencia a las cuales pertenece; es decir, convertir una cantidad “nítida” en difusa.

La figura 5 representa la fusificación de la variable lingüística “temperatura interior” del ejemplo de la sección 3.3.3:

Para un valor de la temperatura de 0 °C arroja los siguientes datos:

MembFrío (0) = 1.0000
MembAgradable (0) = 0.1353
MembCaliente (0) = 0.0000

El valor de la temperatura igual a 0 °C pertenece a tres conjuntos con distintos grados en cada uno.

A partir de ahora y durante el resto de las operaciones en el interior del corazón difuso, estos datos (1.0000, 0.1353 y 0.0000, son valores de las funciones de pertenencia) representarán a las variables registradas en lo que corresponda al proceso.

Figura 5. Ejemplo de fusificación de una variable.

Ene-2-1-a1-g13
Fuente: Elaboración propia.


Base de conocimiento

La Base de Conocimiento está formada por dos componentes. 1) Base de Datos que mantiene los parámetros y las características de cada una de las variables lingüísticas. 2) Base de Reglas que almacena el conocimiento respecto a la causalidad entre las variables de entrada y las variables de control.

Base de datos: Proporciona información a la interfaz de fusificación al mecanismo de inferencia y a la interfaz de defusificación. Asimismo, proporciona los elementos del lenguaje para construir las reglas. Su contenido está estructurado con respecto a cada variable lingüística y proporciona para cada una: a) El número de valores lingüísticos, b) los parámetros de la función de pertenencia correspondientes a cada valor lingüístico y c) el factor de normalización y “desnormalización” aplicado al universo de discurso (si lo hubiera).

Base de reglas: Una vez definidas las variables difusas y sus respectivos valores lingüísticos, es posible expresar el modelo cualitativo del sistema difuso mediante el conjunto de reglas que las relacionan, pero al igual que la base de datos, no existen métodos generales para obtener las reglas adecuadas. (Sugeno & Murakami, 1985) presentaron cuatro métodos para derivar las reglas de un sistema difuso: a) experiencia y conocimiento de un experto, b) modelando de acciones de control que ejerce el operador, c) modelando un proceso y d) auto organización. Quizá la forma más común para representar el conocimiento humano es formarlo en una expresión del lenguaje natural del tipo:

SI premisa (antecedente),
ENTONCES conclusión (consecuente)

(Timothy, 2010) establece que esta forma se conoce generalmente como la forma deductiva. Típicamente expresa una inferencia tal que si conocemos un hecho (premisa, hipótesis, antecedente), entonces podemos inferir, o derivar, otro hecho llamado conclusión (consecuente).

En este estudio, se realizarán reglas intuitivas basadas en cada función de pertenencia hallada previamente con c-means. Por ejemplo: SI la potencia de entrada del día 01 es “baja”, ENTONCES el pronóstico será “bajo”.

Mecanismo de inferencia

El corazón de cualquier sistema basado en lógica difusa es el mecanismo de inferencia. De acuerdo con (Vesely, Klöckner, & Dohnal, 2016), el motor de inferencia busca en la base de conocimiento disponible para predecir el valor de una variable desconocida para un nuevo caso. Lo que sucede es que cada caso nuevo se compara con la base de conocimiento de casos existentes y se hace una predicción sobre la variable desconocida para el nuevo caso basada en los valores de esta variable en casos similares incluidos en la base de conocimientos. En otras palabras, las reglas difusas representan el conocimiento y la estrategia de control, pero cuando se asigna información específica a las variables de entrada en el antecedente, la inferencia difusa es necesaria para calcular el resultado de las variables de salida del consecuente, este resultado se obtiene en términos difusos, es decir que se obtiene un conjunto difuso de salida de cada regla, que posteriormente junto con las demás salidas de reglas se obtendrá la salida del sistema.

De la gran cantidad de métodos de inferencia difusa, existen cuatro que generan mejores resultados, estos son (Patel & Mohan, 2004): a) Sistema de inferencia Mamdani, b) método Larsen, c) inferencia basada en funciones monótonas y c) sistema de inferencia Sugeno. En este artículo se utilizará el sistema de inferencia Mamdani, propuesto en (Mamdani & Assilian, 1975).

Interfaz de defusificación

El proceso de defusificación es el proceso matemático inverso de la fusificación, es decir, es el proceso de convertir un conjunto o valor difuso (o una conclusión difusa) en información concreta expresada mediante un escalar (número real).

El sistema de inferencia difusa obtiene una conclusión a partir de la información de la entrada, pero en términos difusos. Esta conclusión o salida difusa es obtenida por la etapa de inferencia difusa, la cual genera un conjunto difuso pero el dato de salida del sistema debe ser un número real y debe ser representativo de todo el conjunto obtenido en la etapa de agregado. De los diferentes métodos de defusificación existentes el más común y ampliamente utilizado es el método del centroide o centro de gravedad. Con este método se transforma la salida difusa en un número real el cual es la coordenada equis (x) del centro de gravedad de tal conjunto difuso de salida. En este artículo se utilizará este método ya implementado en la herramienta Fuzzy Logic Toolbox de MATLAB. La figura 6 muestra un ejemplo de defusificación del ejemplo mostrado en la figura 5:

Figura 6. Defusificación con el método centroide. Salida = 19.2.

Ene-2-1-a1-g14
Fuente: Elaboración propia en Fuzzy Logic Toolbox de MATLAB.


Finalmente, el sistema difuso será el mostrado en la figura 7, donde las entradas corresponden a los datos de los días seleccionados de acuerdo a lo mencionado en la sección 3.1, el sistema de inferencia mamdani con una base de reglas intuitiva correspondiente a una relación directa uno a uno de acuerdo con el preprocesamiento con c-means y los datos de salida correspondientes a los datos del pronóstico hallado.

Figura 7. Sistema difuso para el cálculo del pronóstico de demanda eléctrica.

Ene-2-1-a1-g15
Fuente: Elaboración propia en Fuzzy Logic Toolbox de MATLAB.


CASO DE ESTUDIO

En este estudio se realizará el pronóstico de la demanda eléctrica para la semana 37 del presente año, correspondiente a los días del lunes 11 al domingo 17 de Septiembre del 2017. De acuerdo a lo mencionado en la Base de datos, los días seleccionados para iniciar con la metodología son los mostrados en la tabla 4.

Con los datos de los 05 días seleccionados se realizará el ordenamiento ascendente con su correspondiente clasificación con fuzzy c-means como se muestra en la figura 8 (para el caso de pronosticar el día domingo):

Tabla 4. Selección de días (datos históricos).

Ene-2-1-a1-g16
Fuente: Elaboración propia.


Figura 8. Ordenamiento de la data y clasificación con c-means (04 clúster).

Ene-2-1-a1-g17
Fuente: Elaboración propia.


Esta clasificación permite obtener el centro de cada "clúster” e identificar el mínimo y máximo de los mismos. En este paso, los valores mínimos de cada “clúster” representarán las marcas de clase (landmarks), mediante las cuales luego se determina un nuevo centro para formar las funciones de pertenencia (FP13) como se puede identificar en la figura 9.

Figura 9. Funciones de pertenencia identificadas (04 FP).

Ene-2-1-a1-g18
Fuente: Elaboración propia.


En este estudio se evaluarán los resultados obtenidos desde 01 hasta 24 funciones de pertenencia (FP) para la demanda eléctrica de cada día a pronosticar y se elige como óptima aquella con la cual se obtiene el menor error MAPE.


RESULTADOS

El estudio calcula el pronóstico de la demanda eléctrica de cada día, realiza el cálculo del MAPE tanto con la solución con lógica difusa y con el método tradicional. El cálculo con lógica difusa comprende la realización del pronóstico con cada una de las funciones de pertenencia halladas por medio de c-means (24 FP) y se elige el resultado con menor error de pronóstico. La tabla 5 muestra los resultados encontrados para cada día, con el respectivo cálculo donde el número de función de pertenencia óptimo (FPopt) es aquel que brinda el menor error. La figura 10 muestra la variación del error MAPE de acuerdo con el número de funciones de pertenencia calculados en cada día.

Tabla 5. Selección de días (datos históricos).

Ene-2-1-a1-g19
Fuente: Elaboración propia.


Figura 10. Tendencia del MAPE de acuerdo al número de FP.

Ene-2-1-a1-g20
Fuente: Elaboración propia.


La figura 10 muestra gráficamente que el número de funciones de pertenencia influye directamente en la obtención del resultado óptimo de pronóstico. Sin embargo, es evidente que las buenas aproximaciones podrían obtenerse a partir de 6 funciones de pertenencia, mientras que resultados inferiores a este número de FP producen pronósticos con MAPE muy elevado para nuestro propósito.

La figura 11 muestra claramente una mejor aproximación de pronóstico para el día 13 de septiembre del 2017 cuyo MAPE obtenido con 18 funciones de pertenencia con lógica difusa es de 1.51%, mientras que con el método tradicional sobrepasa el 2% de acuerdo con la tabla 5.

Figura 11. Perfil de demanda eléctrica miércoles 13 de septiembre del 2017.

Ene-2-1-a1-g21
Fuente: Elaboración propia.


De la tabla 5, de todos los días pronosticados, el mejor rendimiento se obtiene para el día 12 de septiembre del 2016 para el cálculo con 9 funciones de pertenencia con lógica difusa. Por otro lado, el método difuso presenta dos días en los cuales el MAPE resulta mayor al del método tradicional. Estos resultados corresponden a los días jueves 14 y viernes 15 de septiembre de 2017. Estos casos “extremos” se analizan gráficamente según la figura 12 y figura 13.

Figura 12. Perfil de demanda eléctrica martes 12 de septiembre del 2017.

Ene-2-1-a1-g22
Fuente: Elaboración propia.


Figura 13. Perfil de demanda eléctrica jueves 14 de septiembre del 2017.

Ene-2-1-a1-g23
Fuente: Elaboración propia.


De la figura 12 y figura 13, evidentemente el sistema difuso se desenvuelve dentro del margen de los datos de entrada. El intervalo horario del 1 al 17 y del 39 al 43 en la figura 13, muestra que la demanda ejecutada fue un caso excepcional pues muestra datos atípicos con respecto a la data histórica considerada para para el pronóstico de ese día. Esto se puede considerar como limitación para el enfoque con lógica difusa propuesto cuando se deben pronosticar casos que no tienen un caso de referencia en la base de datos de conocimiento. Mientras una regresión puede (al menos en teoría) ser extrapolada a valores extremos, el modelo de lógica difusa falla si no se encuentra un caso similar en la base de conocimiento (Vesely, Klöckner, & Dohnal, 2016).

Una alternativa para poder “forzar” una mejor aproximación se puede lograr si se consideran parámetros adicionales en la entrada del sistema difuso como el nivel de temperatura en cada hora, humedad, cambios en la tasa de producción o consumo.

Por otro lado, desde un punto de vista general, el pronóstico difuso propuesto muestra una tendencia similar al método convencional pero con la ventaja de una mayor aproximación (MAPE <1.5% en muchos casos).

Por lo tanto, el pronóstico convencional utilizado por los operadores del sistema eléctrico puede ser reemplazado por este enfoque como un sistema moderno de administración de energía en primera instancia.


CONCLUSIONES

El PDECP es una actividad básica pero necesaria e imprescindible para estimar las necesidades de los consumidores de energía eléctrica, por lo que la precisión del cálculo juega un papel importante para una adecuada gestión operativa, económica y técnica del sistema eléctrico.

Para este propósito, la lógica difusa cuenta con ventajas al condensar gran cantidad de datos en pequeños grupos de reglas variables, considerar la experiencia humana para inferir el propósito deseado de un pronóstico preciso, mayor rapidez y precisión que el método de pronóstico convencional que trata con datos rígidos y requiere mayor tiempo de procesamiento.

Con estas ventajas a favor, este enfoque propone tres contribuciones al estado del arte del PDECP: 1) metodología no lineal basada en lógica difusa. 2) Reconocimiento de patrones de demanda eléctrica con c-means y 3) relevancia del número de FP; logrando de esta manera errores inferiores a su correspondiente cálculo con la metodología tradicional.

Finalmente, nuestro modelo hace referencia solo a demanda histórica como datos de entrada, por lo que es posible mejorar la precisión (reducir el error) al agregar variables de entrada como el clima, factores económicos y/o sociales, etc. O al complementar la metodología con un proceso de optimización cuya función objetivo sea la minimización del error.


REFERENCIAS

Ambalal, V. P. (2004). Transformation Functions for Trapezoidal Membership Functions. International Journal of Computational Cognition, 2(3), 115-135.

Badri, A., Ameli, Z., & Birjandi, A. (2012). Application of artificial neural networks and fuzzy logic methods for short term load forecasting. Energy Procedia, 14, 1883-1888.

COES-SINAC. (2011, Enero 15). Procedimientos Técnicos: 03 Pronóstico de la Demanda a Corto Plazo del Sistema Interconectado Nacional. Retrieved from Marco Normativo: http://www.coes.org.pe/Portal/MarcoNormativo/Proce dimientos/Tecnicos

COES-SINAC. (s.f. ). IDCOS (Informe Diario del Coordinador de la Operación del Sistema). Retrieved from Post Operacion: http://www.coes.org.pe/Portal/PostOperacion/Reportes/ Idcos

D´Negri, C., & De Vito, E. (2015). Sistema de Información Científica Redalyc. Retrieved from Universidad Autónoma del Estado de México: http://www.redalyc.org/ html/3821/38213867007/

Feng, X., & Huang, H. (2005). A Fuzzy-Set-Based Reconstructed Phase Space Method for Identification of Temporal Patterns in Complex Time Series. IEEE Trans. on Knowledge and Data Engineering, 17(5), 601-613.

Fisher, B. (2006). Fuzzy approaches to environmental decisions: application to air quality. Environmental Science & Policy, 9(1), 22-31.

Gonzales, S. (2014). Pronóstico eficiente de la demanda diaria del Sistema Eléctrico Interconectado del Perú mediante análisis estocástico ARIMA con sucesos externos. TECNIA, 24(1), 87-98.

Hong, T. (2010). Short term electric load forecasting. North Carolina State University.

Hong, T. (2014). Energy forecasting: past, present, and future. Foresight: The International Journal of Forecasting, 2014(32), 43-49.

Mamdani, E., & Assilian, S. (1975). An experiment in linguistic synthesis with a fuzzy logic controller. International journal of man-machine studies, 7(1), 1-13.

Mamlook, R., Badran, O., & Abdulhadi, E. (2009). A fuzzy inference model for short-term load forecasting. Energy Policy, 37, 1239-1248.

MathWorks. (2017). Foundations of Fuzzy Logic. Retrieved from https://www.mathworks.com/help/fuzzy/founda tions-of-fuzzy-logic.html#bp78l70-2

MathWorks. (2017). MathWorks. Retrieved from Documentation: https://www.mathworks.com/help/fuzzy /fcm.html

Mugica, F. (1995). Diseño sistemático de controladores difusos usando razonamiento inductivo. Tesis de disertación doctoral. Barcelona.

Pandian, S., Duraiswamy, K., Rajan, C., & Kanagaraj, N. (2006). Fuzzy approach for short term load forecasting. Electric Power Systems Research, 76(6), 541-548.

Patel, A., & Mohan, B. (2004). Transformation functions for trapezoidal membership functions. International Journal of Computational Cognition, 2(3), 115-135.

Povinelli, R. (1999). Time Series Data Mining: Identifying Temporal Patterns for Characterization and Prediction of Time Series Events. Ph.D. Dissertation. Marquette University.

Song, K., Baek, Y., Hong, D., & Jang, G. (2005). Short-term load forecasting for the holidays using fuzzy linear regression method. IEEE transactions on power systems, 20(1), 96- 101.

Sugeno, M., & Murakami, M. (1985). An Experimental Study on Parking Control Using a Model Car. Industrial Applications of Fuzzy Control, 125-138.

Timothy, J. R. (2010). Fuzzy Logic with Engineering Applications. United Kingdom: WILEY.

Vesely, S., Klöckner, C., & Dohnal, M. (2016). Predicting recycling behaviour: Comparison of a linear regression model and a fuzzy logic model. Waste management, 49, 530- 536.

Ying, L.-C., & Pan, M.-C. (2008). Using adaptive network based fuzzy inference system to forecast regional electricity loads. Energy Conversion and Management, 49, 205-211.

Zadeh, L. (1965). Fuzzy sets. Information and Control, 8(3), 338-353.

Zuniga, K., Castilla, I., & Aguilar, R. (2014). Using fuzzy logic to model the behavior of residential electrical utility customers. Applied Energy, 115, 384-393.




------------
Pie de página:

1 Short Term Load Forecasting (STLF) en inglés.

2 Artificial Neural Network (Redes neuronales artificiales)

3 Autoregressive integrated moving average (Modelo autorregresivo integrado de media móvil)

4 Comité de Operación Económica del Sistema Eléctrico Interconectado Nacional

5 Mean absolute percentage error (Error porcentual absoluto medio)

6 Sistema Eléctrico Interconectado Nacional

7 Informe Diarios del Coordinador de la Operación del Sistema

8 “Boxplot” en inglés.

9 Según el Decreto Supremo N°022-2009-EM, los Usuarios Libres son aquellos usuarios que no se encuentran sujetos a regulación de precios.

10 Membership function para el término en inglés

11 En el caso de la función gaussiana, este valor es el centro de la función y a la vez toma el máximo valor.

12 No existe un término en idioma Español que describa el proceso de transformar la información concreta en información difusa. Por ello, para efectos del artículo, se define el término “fusificación” como significado de: a) la codificación de un valor expresado en forma ‘escalar’ en un(os) valor(es) ‘difuso(s)’ y b) el proceso de representar la información concreta en información difusa.

13 Membership function (mf) por defecto en MATLAB