Aprendizaje híbrido de la base de conocimiento de un sistema basado en reglas difusas mediante algoritmos genéticos y colonias de hormigas

Please download to get full document.

View again

of 6
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Categories
Published
Resumen En muchos ejemplos de modelado difuso lingüıstico se hace necesario un aprendizaje automático de la base de conocimiento a partir de datos numéricos. En este trabajo, se propone un método para aprender la totalidad de la base de conocimiento
  APRENDIZAJE H´IBRIDO DE LA BASE DE CONOCIMIENTODE UN SISTEMA BASADO EN REGLAS DIFUSAS MEDIANTEALGORITMOS GEN´ETICOS Y COLONIAS DE HORMIGAS J. Casillas, O. Cord´on, F. Herrera Dept. Ciencias de la computaci´on e inteligencia artificialE.T.S. Ing. Inform´aticaUniversidad de Granada, 18071 - Granadacasillas,ocordon,herrera@decsai.ugr.es P. Villar Dept. Inform´aticaE.S. de Ing. Inform´aticaUniversidade de Vigo, 32004 - Ourensepvillar@uvigo.es Resumen En muchos ejemplos de modelado difusoling¨u´ıstico se hace necesario un aprendizajeautom´atico de la base de conocimiento a par-tir de datos num´ericos. En este trabajo, sepropone un m´etodo para aprender la totali-dad de la base de conocimiento (particionesdifusas y reglas difusas), que combina un al-goritmo gen´etico y un algoritmo de optimi-zaci´on mediante colonias de hormigas. Estosdos mecanismos trabajan de forma coordina-da para conseguir modelos con buen equili-brio entre precisi´on y interpretabilidad. Palabras Clave: Aprendizaje autom´atico,sistemas basados en reglas difusas, algoritmosgen´eticos, optimizaci´on mediante colonias dehormigas. 1. INTRODUCCI´ON Actualmente, el modelado difuso ling¨u´ıstico es unaaplicaci´on importante de los Sistemas Basados en Re-glas Difusas (SBRDs). En este tipo de modelos, la in-terpretabilidad es un requisito fundamental, junto conla precisi´on. Para esta tarea, se utilizan los SBRDsLing¨u´ısticos (SBRDLs), donde las reglas difusas tomanvalores de un conjunto de t´erminos con una interpre-taci´on en el mundo real (variables ling¨u´ısticas).La Base de Conocimiento (BC) de un SBRDL est´a for-mada por dos componentes: 1) la Base de Reglas (BR),constituida por el conjunto de reglas difusas, y 2) laBase de Datos (BD), que incluye las funciones de per-tenencia de cada uno de los t´erminos ling¨u´ısticos (oetiquetas) de las particiones difusas asociadas a las 0 Trabajo parcialmente soportado por el Ministerio deCiencia y Tecnolog´ıa en el marco de los proyectos TIC2002-04036-C05-01, TIC2003-00877 (con fondos FEDER) y dela Red HEUR TIC2002-10866-E. variables. La BC de un SBRDL depende del problemaque se intente resolver, por tanto, se hace necesarioalg´un mecanismo de derivaci´on autom´atica de dicha BC. Dentro de la literatura especializada existen nu-merosos m´etodos de aprendizaje de la BR a partir deuna BD previamente definida.En la mayor´ıa de esosm´etodos, se consideran particiones difusas uniformescon el mismo n´umero de etiquetas para todas las va-riables. Sin embargo, la elecci´on de la BD tiene unadecisiva influencia en el comportamiento del SBRDLresultante[5].Teniendo en cuenta la fuerte interrelaci´on entre los doscomponentes de la BC, ser´ıa muy aconsejable un ma-yor grado de cooperaci´on entre las tareas de aprendi-zaje de la BR y la BD, que permitiese obtener modeloscon un buen equilibrio entre interpretabilidad y pre-cisi´on. Bas´andonos en esta idea, se propone un m´eto-do de aprendizaje de la BC que mantiene una pobla-ci´on de posibles definiciones de la BD al mismo tiem-po que busca un conjunto compacto de reglas (BR).M´as concretamente, para la derivaci´on de las reglasdifusas utilizaremos un mecanismo basado en la meto-dolog´ıa COR junto con un algoritmo de optimizaci´onmediante colonias de hormigas (proceso COR-OCH).Para la definici´on de la BD se emplear´a un AlgoritmoGen´etico que incluye sus principales componentes paracada variable: dominio, n´umero de etiquetas y parti-ci´on difusa. En este documento, describiremos primeroel mecanismo de aprendizaje COR-OCH. A continua-ci´on, se presenta el m´etodo propuesto y finalmente,se muestran unos resultados experimentales y algunasconclusiones. 2. PROCESO DE APRENDIZAJECOR-OCH El proceso seguido para integrar el aprendizaje de labase de reglas dentro de un meta-algoritmo de dise˜node la base de datos debe ser r´apido y eficaz. Paraello, basaremos el aprendizaje en la metodolog´ıa COR(Cooperaci´on entre Reglas) propuesta en [1] y exten- XII CONGRESO ESPAÑOL SOBRE TECNOLOGÍAS Y LÓGICA FUZZY 357  dida en [2] usando un algoritmo de optimizaci´on me-diante colonias de hormigas (OCH) [7]. La reducci´ondel espacio de b´usqueda e inducci´on de cooperaci´on entre reglas realizada por la metodolog´ıa COR, juntocon el uso de informaci´on heur´ıstica y de una b´usque-da eficaz de la t´ecnica OCH, permiten que el algoritmopropuesto sea r´apido y genere bases de reglas con bue-na precisi´on y alta interpretabilidad. Las siguientes dossubsecciones describen la metodolog´ıa de aprendizajeCOR y el algoritmo de OCH basado en ella. 2.1. Metodolog´ıa COR En los ´ultimos a˜nos se ha propuesto en la literatura es-pecializada una familia de m´etodos simples y eficientesde extracci´on de reglas difusas guiados por criterios decobertura de los datos del conjunto de ejemplos. Susimplicidad, adem´as de su velocidad y f´acil compren-si´on, hace a estos m´etodos muy adecuados para tareasde aprendizaje. Sin embargo, estos m´etodos general-mente buscan reglas difusas con el mejor comporta-miento individual (por ejemplo, [11]) y, por tanto, nose considera la interacci´on global entre las reglas de-bida al razonamiento interpolado realizado por los sis-temas difusos, provocando as´ı una mala precisi´on enalgunos casos.Con la intenci´on de paliar estos inconvenientes man-teniendo las interesantes ventajas de estos m´etodos,en [1] se propone la metodolog´ıa COR. En lugar de se-leccionar el consecuente con el mejor comportamientoen cada subespacio, esta metodolog´ıa considera la po-sibilidad de usar otro consecuente, diferente del mejor,si as´ı se mejora el comportamiento global del sistemadifuso gracias a tener una base de reglas con mejorcooperaci´on.COR se compone de los siguientes pasos: (1) construc-ci´ on del espacio de b´ usqueda  , se obtiene un conjunto deconsecuentes candidatos para cada regla; y (2) selec-ci´ on del conjunto de reglas m´ as cooperativo , se realizauna b´usqueda combinatoria entre los conjuntos paraencontrar la combinaci´on de consecuentes con el me- jor comportamiento global. En la figura 1 se muestrauna descripci´on m´as detallada del proceso de genera-ci´on de reglas basado en COR. 2.2. Algoritmo de OCH basado en COR Dado que el espacio de b´usqueda manejado en el pa-so 2. es grande, resulta necesario usar t´ecnicas deb´usqueda aproximadas. En [1] se obtuvieron modelosling¨u´ısticos con buena precisi´on utilizando enfriamien-to simulado. Sin embargo, dado que una de las res-tricciones de nuestro problema es que el proceso deaprendizaje debe ser r´apido, en este art´ıculo se propo-ne el uso de OCH [7]. Esta es una t´ecnica de b´usque-da bio-inspirada que considera informaci´on heur´ısticapara permitir obtener buenas soluciones con rapidez.Esta secci´on describe los componentes del algoritmopropuesto. Representaci´on del problema Para aplicar OCHen la metodolog´ıa COR es conveniente verla como unproblema de optimizaci´on combinatoria con la capa-cidad de ser representado en un grafo ponderado. Deesta forma, se puede afrontar el problema considerandoun n´umero fijo de subespacios e interpretando el pro-ceso de aprendizaje como la forma de asignar vectoresde consecuentes —es decir, etiquetas de las particionesdifusas de las variables de salida— a estos subespaciosseg´un un criterio de optimalidad (esto es, siguiendo lametodolog´ıa COR).Por tanto, de acuerdo con la figura 1, cada nodo S  h ∈ S  + se asigna a cada consecuente candidato( B k h 1 ,...,B k h m ) ∈ C  ( S  h ) y al s´ımbolo especial “no con-siderar” ( R ∅ ) que indica la ausencia de reglas en elcorrespondiente subespacio. Informaci´on heur´ıstica La informaci´on heur´ısticasobre la preferencia potencial de elegir un vector deconsecuentes espec´ıfico, B k h , en cada combinaci´on deantecedentes (subespacio) se determina de la siguienteforma para B k h = ( B k h 1 ,...,B k h m ) ∈ C  ( S  h ): η hk h = m´ax e l ∈ E  + ( S  h ) Min  µ A h ( x l ) ,µ B khj ( y l )  . Si B k h / ∈ C  ( S  h ), hacer η hk h = 0.Posteriormente, para el s´ımbolo “no considerar”, hacerlo siguiente: η h, |B 1 |· ... ·|B m | +1 =1m´ax k h ∈{ 1 ,..., | C  ( S  h ) |} η hk h . Inicializaci´on de la feromona El valor inicial dela feromona para cada asignaci´on se obtiene de la si-guiente forma: τ  0 =1 | S  + |  S  h ∈ S  + m´ax B kh ∈ C  ( S  h ) η hk h . As´ı, la feromona inicial ser´a el valor medio del caminoconstruido tomando el mejor consecuente en cada reglade acuerdo con la informaci´on heur´ıstica (se trata, portanto, de una asignaci´on voraz). Esquema de OCH: sistema de la mejor-peorhormiga Una vez dise˜nados los componentes pre-vios, se debe definir un algoritmo OCH para resolver elproblema. En esta contribuci´on consideramos el algo-ritmo Sistema de la Mejor-Peor Hormiga (SMPH) [3],que ha demostrado tener un buen comportamiento envarios problema de optimizaci´on. Su esquema global semuestra en la figura 2, para m´as detalle refi´erase a [3]. 358 XII CONGRESO ESPAÑOL SOBRE TECNOLOGÍAS Y LÓGICA FUZZY  Entradas : Un conjunto de datos entrada-salida  — E  = { e 1 ,...,e l ,...,e N  } , donde e l = ( x l 1 ,...,x ln ,y l 1 ,...,y lm ) , l ∈ { 1 ,...,N  } ,siendo N  el tama˜no del conjunto de datos, y n ( m ) el n´umero de variables de entrada (salida)— que represente el comportamiento del problema a resolver  . Una partici´ on difusa de los espacios de las variables  . En nuestro caso, consideramos conjuntos difusos con distribuci´onequidistante. Sea A i el conjunto de t´erminos ling¨u´ısticos de la i -´esima variable de entrada, siendo i ∈ { 1 ,...,n } , y B  j elconjunto de t´erminos ling¨u´ısticos de la j -´esima variable de salida, siendo j ∈ { 1 ,...,m } , donde |A i | ( |B  j | ) es el n´umerode etiquetas de la i -´esima (  j -´esima) variable de entrada (salida). Algoritmo :1. Construcci´ on del espacio de b´ usqueda  :1.1. Definir los subespacios de entrada difusos que contengan ejemplos positivos  : Para ello, debemos definir el conjuntode ejemplos positivos ( E  + ( S  s ) ) para cada subespacio de entrada difuso S  s = ( A s 1 ,...,A si ,...,A sn ) , donde A si ∈ A i es una etiqueta, s ∈ { 1 ,...,N  S } , y N  S =  ni =1 |A i | es el n´umero de subespacios de entrada difusos. En este art´ıculorealizamos lo siguiente: E  + ( S  s ) = { e l ∈ E tal que ∀ i ∈ { 1 ,...,n } , ∀ A  i ∈ A i , µ A si ( x li ) ≥ µ A  i ( x li ) } , siendo µ A si ( · ) la funci´on de pertenencia asociada a la etiqueta A si .Entre todos los N  S subespacios de entrada difusos posibles, considerar s´olo aquellos que contengan al menos unejemplo. Para ello, el conjunto de subespacios con ejemplos positivos se define como S  + = { S  h | E  + ( S  h )  = ∅} .1.2. Generar el conjunto de reglas candidatas en cada subespacio con ejemplos positivos  : En primer lugar se define elconjunto de consecuentes candidatos asociado con cada subespacio que contenga al menos un ejemplo, S  h ∈ S  + .En este art´ıculo realizamos lo siguiente: C  ( S  h ) = { ( B k h 1 ,...,B k h m ) ∈ B  1 × ... ×B  m tal que ∃ e l ∈ E  + ( S  h ) donde ∀  j ∈ { 1 ,...,m } , ∀ B  j ∈ B  j , µ B khj ( y lj ) ≥ µ B  j ( y lj ) } . A continuaci´on se define el conjunto de reglas candidatas para cada subespacio como CR ( S  h ) = { R k h =[ SI X  1 es A h 1 y ... y X  n es A hn ENTONCES Y   1 es B k h 1 y ... y Y   m es B k h m ] tal que ( B k h 1 ,...,B k h m ) ∈ C  ( S  h ) } .Para permitir a la metodolog´ıa COR reducir el n´umero inicial de reglas difusas, se a˜nade el elemento especial R ∅ (quesignifica “no considerar”) a cada conjunto de reglas candidatas, es decir, CR ( S  h ) = CR ( S  h ) ∪ R ∅ . Si se seleccionaeste elemento, no se generar´a ninguna regla en el correspondiente subespacio de entrada difuso.2. Selecci´ on del conjunto de reglas difusas m´ as cooperativo  — Esta fase se realiza ejecutando un algoritmo de b´usquedacombinatoria para encontrar la combinaci´on RB = { R 1 ∈ CR ( S  1 ) ,...,R h ∈ CR ( S  h ) ,...,R | S + | ∈ CR ( S  | S + | ) } con elmejor comportamiento. Dado que el espacio de b´usqueda manejado suele ser grande, se deben usar t´ecnicas de b´usquedaaproximadas.Se considera un´ındice f  ( RB ) para medir la calidad global del conjunto de reglas codificada en cada soluci´on. En nuestrocaso, el algoritmo usa la funci´on de error global basada en el error cuadr´atico medio  (ECM), definido comoECM =12 · N  N   l =1 ( F ( x l 1 ,...,x ln ) − y l ) 2 , donde F ( x l 1 ,...,x ln ) es el vector de salida obtenido a partir del SBRD cuando se usa el ejemplo e l como entrada, y y l esel vector de salida deseado. Cuanto m´as cercano a cero sea la medida, mejor comportamiento global y, por tanto, mejorcooperaci´on entre reglas. Figura 1: Algoritmo COR 3. M´ETODO DE APRENDIZAJEDE LA BC DE UN SBRDL En este apartado describiremos nuestra propuesta pa-ra el aprendizaje autom´atico de la BC de un SBRDL,compuesta por dos mecanismos:Un proceso de aprendizaje de la BD mediante unAlgoritmo Gen´etico (AG) que nos va a definir: • Dominio de cada variable que interviene enel modelo. • N´umero de etiquetas de cada variable. • Sem´antica de cada etiqueta considerandoparticiones difusas no uniformes. Para cons- XII CONGRESO ESPAÑOL SOBRE TECNOLOGÍAS Y LÓGICA FUZZY 359  1. Dar un valor inicial de la feromona, τ  0 , para cada arco.2. Mientras ( condici´ on terminaci´ on no se cumpla) hacer: a  ) Realizar el camino de cada hormiga mediante el proceso de construcci´on de la soluci´on . b ) Aplicar el mecanismo de evaporaci´on de fero-mona . c  ) Aplicar el proceso de b´usqueda local sobre la me- jor soluci´on actual. d  ) Actualizar S  mejor global y S  peor actual . e  ) Aplicar la regla de actualizaci´on de feromonaMejor-Peor .  f  ) Aplicar la mutaci´on de feromona . g  ) Si ( condici´ on estancado  se cumple), aplicar reini-cializaci´on . Figura 2: Algoritmo SMPH truir dichas particiones se emplea una funci´onde escala no lineal que define ´areas con mayoro menor “sensibilidad”.el algoritmo e aprendizaje de reglas COR-OCH,que deriva la BR tomando como punto de partidala BD previamente obtenida en el paso anterior.De esta manera, el m´etodo h´ıbrido propuesto ob-tiene una definici´on completa de la BC mediantela acci´on cooperativa de ambos procesos.Ya que todos los componentes de la BD ir´an evolu-cionando mediante un AG, ser´ıa aconsejable reducirla dimensi´on del espacio de b´usqueda. Por tanto, eluso de una funci´on de escala no lineal deber´ıa estarcondicionado a escoger una funci´on parametrizada conun reducido n´umero de par´ametros. Para este traba- jo, hemos considerado la funci´on propuesta en [8], quesolamente tiene un par´ametro denominado a  ( a ∈ IR).La funci´on es: f  : [ − 1 , 1] → [ − 1 , 1] f  ( x ) = sign ( x ) · | x | a , con a > 0El resultado final es un valor entre [ − 1 , 1]. La acci´ondel par´ametro a  en la partici´on difusa depende de suvalor: sensibilidad uniforme ( a = 1), mayor sensibili-dad en los valores centrales ( a > 1), o mayor sensibili-dad en los valores extremos ( a < 1). En este trabajo sehan considerado funciones de pertenencia triangulares,por tanto, la funci´on de escala no lineal s´olo se aplica alos tres puntos que definen la funci´on de pertenencia.Es importante destacar que esa funci´on produce efec-tos sim´etricos alrededor del punto central del dominio.Con una peque˜na modificaci´on se puede generar ma-yor sensibilidad ´unicamente en uno de los extremos (elproceso completo de construcci´on de la partici´on difu-sa se puede consultar en [4]). La figura 3 muestra unarepresentaci´on gr´afica de esas cinco posibilidades parala partici´on difusa. 00.20.40.60.81-1 -0.5 0 0.5 100.20.40.60.81-1 -0.5 0 0.5 100.20.40.60.81-1 -0.5 0 0.5 1 00.20.40.60.81-1 -0.5 0 0.5 1   00.20.40.60.81-1 -0.5 0 0.5 1 Figura 3: “Formas” de la partici´on difusa A continuaci´on, se describir´a el proceso evolutivo quemonitoriza el aprendizaje de la BC. Los AGs[9] sont´ecnicas de optimizaci´on y b´usqueda basadas en unaformalizaci´on del proceso evolutivo de los seres vivos.Cuando se trabaja con AGs, los aspectos importantesson c´omo codificar cada soluci´on (en este caso, la BDde un SBRDL), como evaluar esa soluci´on y como crearnuevas soluciones: Codificaci´on de la BD. Para un modelo con N  variables, cada individuo o cromosoma est´a compuestode cuatro partes:N´umero de etiquetas ( C  1 ): codificados en un vec-tor de valores enteros de longitud N  . Para estetrabajo, el rango considerado es E  ∈ { 2 ,..., 7 } .Par´ametros de “forma”: ( C  2 ): codificados en unvector de enteros de longitud N  , que puede tomarlos valores S  ∈ { 0 , 1 , 2 , 3 , 4 } , que representan lascinco posibilidades mostradas en la figura 3.Par´ametros de sensibilidad ( C  3 ): codificados enun vector de valores reales de longitud N  , donde sealmacena el valor del par´ametro ( a  ) de la funci´onde escala no lineal para cada variable. El rangoconsiderado es el intervalo (0 , 10).Dominios ( C  4 ): codificados en un vector de N  × 2valores reales que almacenan el dominio de cadavariable ([ v min ,v max ]). Si el dominio inicial de unavariable es [ v iinf  ,v isup ], y d  es la dimensi´on del in-tervalo ( d = v isup − v iinf  ), el rango para el l´ımite in-ferior del dominio es [ v iinf  − (1 / 4 ∗ d ) ,v iinf  ], y el ran-go para el l´ımite superior es [ v isup ,v isup +(1 / 4 ∗ d )]. 360 XII CONGRESO ESPAÑOL SOBRE TECNOLOGÍAS Y LÓGICA FUZZY  Una representaci´on gr´afica del cromosoma ser´ıa: C  1 = ( E  1 ,...,E  N  ) C  2 = ( S  1 ,...,S  N  ) C  3 = ( a 1 ,...,a N  ) C  4 = ( v 1 min ,v 1 max ,...,v N min ,v N max ) Evaluaci´on de los cromosomas. El c´alculo de lafunci´on de evaluaci´on consta de tres pasos:Construir las particiones difusas de cada variable,utilizando la informaci´on contenida en el cromo-soma. Primero, el dominio de cada variable ( C  4 )es normalizado al intervalo [ − 1 , 1]. A continua-ci´on, se crea una partici´on difusa uniforme consi-derando su n´umero de etiquetas ( C  1 ). Despu´es, lafunci´on de escala no lineal, con su “forma” ( C  2 )y su par´ametro de sensibilidad ( C  3 ) se aplica alos tres puntos que definen cada etiqueta. Final-mente, la partici´on es trasladada de nuevo a sudominio srcinal ( C  4 ).Generar la BR mediante COR-OCH, consideran-do la BD obtenida en el paso previo.Calcular el error cuadr´atico medio (ECM) sobre elconjunto de datos de entrenamiento usando la BCobtenida (BD + BR). Para mejorar la capacidadde generalizaci´on del SBRD resultante, intentan-do evitar el posible sobreaprendizaje, penalizare-mos los SBRDLs con un n´umero de reglas (NR)excesivo. As´ı, la funci´on de evaluaci´on es: F  = ω 1 · ECM  + ω 2 · NR siendo ω 1 y ω 2 porcentajes de peso de cada com-ponente ( ω 1 + ω 2 = 1). Para los experimentos,hemos considerado ω 1 = 0 , 9. Operadores gen´eticos. Como operador de selec-ci´on, hemos utilizado el muestreo universal estoc´asti-co. Respecto a los operadores de recombinaci´on gen´eti-ca, y dada la especial estructura de los cromosomas,con cuatro partes fuertemente relacionadas, es necesa-rio dise˜nar operadores espec´ıficos que act´uen de formacoordinada. Se han utilizado dos operadores de mu-taci´on, uno para codificaci´on entera ( C  1 y C  2 ) y otropara codificaci´on real ( C  3 y C  4 ). para el primer caso,se emplea el esquema propuesto por Thrift en [10] ypara el segundo se utiliza el operador de mutaci´on nouniforme de Michalewicz [9].Respecto al operador de cruce, se emplean dos pro-cesos diferentes dependiendo de las caracter´ısticas delos cromosomas implicados. Si ambos progenitores tie-nen los mismos valores en C  1 y C  2 (para todas lasvariables), el AG ha localizado una zona del espaciode b´usqueda que debe ser explotada. Para eso, aplica-mos el operador de cruce parent centric  [6] en C  3 y C  4 manteniendo los valores de C  1 y C  2 en los descendien-tes. En el otro caso, se utiliza un operador de crucecl´asico en un punto sobre las cuatro partes del cromo-soma. Es decir, se selecciona aleatoriamente un puntode cruce p (  p ∈ { 1 ,...,N  } ) y los dos padres se cruzanpor la variable p en C  1 , C  2 , C  3 y C  4 , produciendo dosdescendientes que mantienen la correlaci´on que hab´ıaentre los distintos componentes de cada variable en losprogenitores. 4. EXPERIMENTOS El m´etodo propuesto se ha probado con un problemade estimaci´on del coste de mantenimiento de la redel´ectrica de una ciudad, basado en datos simulados dela red ´optima para 1059 ciudades, con cuatro variablesde entrada y una de salida. Para los experimentos, seha realizado una validaci´on cruzada con 5 particionesdistintas. Es decir, el conjunto de datos se divide en 5subconjuntos de igual tama˜no (aproximadamente) y elm´etodo es ejecutado 5 veces, dejando en cada una deellas uno de esos subconjuntos como conjunto de datosde prueba y utilizando los otros cuatro como conjuntode datos de entrenamiento 1 . Para cada una de las cincoparticiones de datos, se ha ejecutado el AG seis vecescon diferentes valores para la semilla de inicio de lasecuencia de n´umeros aleatorios. Los par´ametros delAG son: tama˜no de poblaci´on= 64, probabilidad decruce= 0.6, probabilidad de mutaci´on= 0.1 y condici´onde parada= 2000 evaluaciones.Los resultados obtenidos por el m´etodo propuesto(AG+COR-OCH) se han comparado con otros dos me-canismos: uno de ellos comprende el AG propuestoen este trabajo pero utilizando el m´etodo de Wangy Mendel [11] para aprender la BR (AG+WM) y elotro considera ´unicamente el m´etodo COR-OCH conuna partici´on difusa uniforme y el mismo n´umero deetiquetas en todas las variables (5 etiquetas, al ser elvalor con el que se ha obtenido el modelo m´as preciso).Los resultados se muestran en la tabla 1. Las colum-nas numeradas de 1 a 5 en la primera fila representanlas cinco particiones utilizadas. En cada una de esascolumnas aparecen los valores medios de las seis eje-cuciones del AG realizadas. Las ´ultimas tres columnasrepresentan: la media aritm´etica (¯ x ) sobre las cincocolumnas anteriores, la varianza de esos mismos cin-co valores ( σ ¯ x i ) y la media aritm´etica de las varianzasobtenidas entre las seis ejecuciones de cada partici´on( ¯ σ x i ). Mientras que σ ¯ x i representa las diferencias en-tre las cinco particiones, ¯ σ x i representa las diferenciasentre las distintas ejecuciones de una misma partici´on.Es decir, el primer valor es una medida de la dependen-cia que tiene el m´etodo de la partici´on considerada, y 1 los conjuntos de datos utilizados se pueden obtener en http://decsai.ugr.es/ ∼ casillas/FMLib/ XII CONGRESO ESPAÑOL SOBRE TECNOLOGÍAS Y LÓGICA FUZZY 361
Similar documents
View more...
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks
SAVE OUR EARTH

We need your sign to support Project to invent "SMART AND CONTROLLABLE REFLECTIVE BALLOONS" to cover the Sun and Save Our Earth.

More details...

Sign Now!

We are very appreciated for your Prompt Action!

x