{"id":82539,"date":"2017-06-22T12:57:14","date_gmt":"2017-06-22T10:57:14","guid":{"rendered":"http:\/\/www.agendaempresa.com\/?p=82539"},"modified":"2017-06-22T15:57:34","modified_gmt":"2017-06-22T13:57:34","slug":"el-uso-del-machine-learning-para-la-deteccion-de-fraude-en-el-sector-energetico","status":"publish","type":"post","link":"https:\/\/www.agendaempresa.com\/82539\/el-uso-del-machine-learning-para-la-deteccion-de-fraude-en-el-sector-energetico\/","title":{"rendered":"El uso del Machine Learning para la detecci\u00f3n de fraude en el sector energ\u00e9tico"},"content":{"rendered":"

Permite usar datos y sacar el m\u00e1ximo rendimiento a los mismos para aplicarlos con la premisa de reducci\u00f3n de tiempo y de costes operativos<\/h3>\n

\"machinelearning\"<\/a>El fraude el\u00e9ctrico en Espa\u00f1a se ha convertido en un quebradero de cabeza para las compa\u00f1\u00edas suministradoras de energ\u00eda el\u00e9ctrica. Seg\u00fan la CNMC, y a partir de los datos recabados por las principales operadoras, el fraude el\u00e9ctrico en nuestro pa\u00eds ronda los 150 millones de euros anuales s\u00f3lo durante el 2016. Conocemos la cuant\u00eda, y tambi\u00e9n el perfil del defraudador -los grandes consumidores de medianas empresas y las viviendas con gran consumo el\u00e9ctrico- pero a\u00fan no se ha resuelto la r\u00e1pida detecci\u00f3n y recuperaci\u00f3n de energ\u00eda.<\/p>\n

Las grandes operadoras est\u00e1n destinando ya inversiones hac\u00eda este objetivo, con m\u00e1s motivo desde que, en el 2013, la CNMC las se\u00f1alara como titulares de las redes y, por lo tanto, responsables de atajar el fraude y minimizar el impacto en las p\u00e9rdidas de la red, con el foco puesto tambi\u00e9n, como es natural, en disminuir el impacto en sus cuentas de resultados. Una problem\u00e1tica que no han podido atajar, ya que los departamentos de recuperaci\u00f3n de fraude vienen usando procedimientos excesivamente lentos y manuales, poco eficaces a la hora de manejar un gran volumen de informaci\u00f3n y realizar c\u00e1lculos complejos.<\/p>\n

Posibles soluciones al problema<\/strong><\/p>\n

Como en otros sectores, las operadoras del sector energ\u00e9tico cuentan con una ingente cantidad de informaci\u00f3n sobre el comportamiento de sus clientes respecto al servicio o producto prestado que, hasta ahora, no estaba siendo valorada ni aprovechada. Una informaci\u00f3n que hoy d\u00eda puede ser crucial en un mercado global muy competitivo, donde priman los servicios y productos adaptados a las necesidades y gustos de cada cliente. Hablamos de hacer de los datos que atesoramos una ventaja respecto de la competencia a la hora de controlar el negocio y tomar decisiones estrat\u00e9gicas. Es lo que en el sector tecnol\u00f3gico llamamos data driven decisions<\/em>, decisiones basadas en el an\u00e1lisis de los datos.<\/p>\n

Una de las aproximaciones al problema ha sido realizar lo que se denomina el balanceo de carga, es decir, sumar y restar las inyecciones y el consumo en ciertas ramas de la jerarqu\u00eda de la red; de este modo, se localizan ramas desbalanceadas haciendo c\u00e1lculos sencillos. Este tipo de t\u00e9cnicas permiten unas mediciones muy fiables, pero con un alto coste en tiempo y dinero. Teniendo en cuenta la escalada del fraude en los \u00faltimos a\u00f1os y su impacto econ\u00f3mico, existe un amplio margen de mejora en este \u00e1mbito.<\/p>\n

La soluci\u00f3n XFraud <\/strong>permite usar la informaci\u00f3n a nuestro alcance al m\u00ednimo coste posible para realizar unos an\u00e1lisis que nos permitan tomar decisiones que tengan un alto impacto en la recuperaci\u00f3n de energ\u00eda (como es el caso que nos ocupa), de forma que consigamos un retorno de la inversi\u00f3n (ROI) muy alto.<\/p>\n

Nuevas tecnolog\u00edas para datos<\/strong><\/p>\n

\"Especial<\/a>El desarrollo de nuevas tecnolog\u00edas es imparable en este tipo de procesos, con grandes oportunidades para la mejora de los costes operativos, de alta complejidad t\u00e9cnica y que manejan gran volumen de datos. En el contexto, descrito anteriormente, el Machine Learning tiene mucho que aportar, ya que permite usar datos y sacar el m\u00e1ximo rendimiento a los mismo para aplicarlos a con la premisa de reducci\u00f3n de tiempo y de costes operativos: es lo que se denomina la inteligencia operacional<\/em>.<\/p>\n

El Machine Learning permite encontrar patrones en los datos de forma relativamente sencilla y, adem\u00e1s, puede adaptarse a nuevos patrones seg\u00fan las necesidades. Ya est\u00e1 dando resultados excelentes en el campo de la visi\u00f3n artificial, pero su aplicaci\u00f3n puede hacerse extensible a cualquier conjunto de datos.<\/p>\n

Tomando como objetivo el problema de la energ\u00eda defraudada, podemos aplicar el Machine Learning y las capacidades de las herramientas actuales para el an\u00e1lisis de datos.<\/p>\n

El punto de partida l\u00f3gico en una operadora de energ\u00eda son las curvas de carga de los clientes finales. Estas curvas condensan todos los efectos \u201catmosf\u00e9ricos\u201d, tarifas seleccionadas, patrones de consumo, deficiencias, y un largo etc. En base a estos datos, podemos discriminar si existe un \u201ccomportamiento normal\u201d o, por el contrario, es un cliente que est\u00e1 aplicando \u201cmalas pr\u00e1cticas\u201d. Aclarar que, dentro del concepto \u201ccomportamiento normal\u201d, hay una gran cantidad de casos que son legales, aunque difieran del comportamiento est\u00e1ndar de consumo, una diferencia que es dif\u00edcil detectar con los procesos de detecci\u00f3n tradicionales que se vienen aplicando actualmente.<\/p>\n

Poniendo el foco en usar datos que nos permitan \u201ccomprender\u201d el comportamiento de los clientes, se trata de realizar un an\u00e1lisis profundo que nos permita mayor control y decisi\u00f3n; en definitiva, extraer informaci\u00f3n \u00fatil a partir del procesamiento inteligente de los datos, esto es, Smart Data<\/em>.<\/p>\n

Adem\u00e1s, podemos estudiar otros efectos que despreciaremos en un primer an\u00e1lisis, pero que pueden servir para refinar las soluciones ya obtenidas, enriqueciendo la informaci\u00f3n con otras fuentes de datos, o enfocando el an\u00e1lisis en la reducci\u00f3n de ruido provocado por efectos como el n\u00famero de personas que habitan la vivienda, el efecto \u201catmosf\u00e9rico\u201d, casas vac\u00edas, etc.<\/p>\n

Soluci\u00f3n XFraud<\/strong><\/p>\n

La soluci\u00f3n XFraud<\/strong> se basa en unos principios sencillos: obtener resultados \u00fatiles para el negocio partiendo de un m\u00ednimo de informaci\u00f3n, y encontrando un procesado de datos los m\u00e1s generalista posible. De esa forma, puede adaptarse a otros casos de negocio (como puede ser el fraude en operadoras de agua, donde el nivel de fraude est\u00e1 alrededor del 6%).<\/p>\n

XFraud<\/strong> es una soluci\u00f3n de negocio donde se ha primado la simplicidad, permitiendo una integraci\u00f3n con los sistemas del cliente basado en el uso de API\u00b4s, conectores con base de datos o el uso de ficheros de intercambio, cualquier fuente es susceptible de inyectarse en el sistema. XFraud <\/strong>se puede implantar on-premise<\/em> en el CPD del cliente o usar la soluci\u00f3n en Cloud. El resultado son las predicciones de fraude a partir de la cartera de clientes<\/strong>, permitiendo realizar estudios de forma r\u00e1pida, continuada y bajo demanda.<\/p>\n

\"especial<\/a>Las aplicaciones de XFraud <\/strong>son variadas. Por ejemplo, podemos analizar la cartera de clientes uno a uno, inyectando sus curvas de carga en XFraud<\/strong> y prediciendo qu\u00e9 clientes est\u00e1n realizando fraude, obteniendo el porcentaje de exactitud de predicci\u00f3n asociado a cada cliente, as\u00ed como la cantidad de energ\u00eda recuperada. Otra opci\u00f3n es crear mapas de intensidad del fraude. Esto nos aporta un conocimiento previo automatizado de zonas de concentraci\u00f3n de fraude, de modo que podemos enfocar un\u00a0 an\u00e1lisis m\u00e1s exhaustivo en dichas \u00e1reas.<\/p>\n

La soluci\u00f3n de negocio, permite el an\u00e1lisis de millones de clientes<\/strong> en tiempos realmente bajos. Podemos analizar una cartera de varios millones de clientes en cuesti\u00f3n de 24-48 horas<\/strong>. Si a esto le a\u00f1adimos la posibilidad de aumentar el tama\u00f1o del cl\u00faster hardware, podemos hablar de minutos, aunque con coste m\u00e1s elevado en infraestructura.<\/p>\n

Implantaci\u00f3n de la soluci\u00f3n<\/strong><\/p>\n

La implantaci\u00f3n de la soluci\u00f3n es comparativamente m\u00e1s sencilla que otras soluciones actuales. Puede ser implantada on-premise<\/em>, es decir, en el CPD de la operadora, de forma que sea la operadora quien se ocupa del mantenimiento del hardware, seguridad, backups<\/em>, etc. O tambi\u00e9n existe la posibilidad de pago por uso de la soluci\u00f3n en la nube, de forma que el cliente s\u00f3lo se tiene que preocupar por \u201cconectar\u201d sus sistemas a la soluci\u00f3n. En ambos casos, se deben configurar o desarrollar los conectores, que permiten un f\u00e1cil entendimiento con el resto de los sistemas del cliente, para asegurar un flujo coherente de la informaci\u00f3n.<\/p>\n

Contemplamos, asimismo, otro tipo de mejoras factibles que ya tienen su propio roadmap<\/em>. Por ejemplo, conseguir que la soluci\u00f3n funcione en casi tiempo real, esto es, poder analizar millones de cliente en cuesti\u00f3n de minutos, lo que requerir\u00eda una modificaci\u00f3n de la soluci\u00f3n a modo de plugin<\/em>. Tambi\u00e9n puede plantearse una aplicaci\u00f3n para monitorizar la soluci\u00f3n, que a\u00f1adir\u00eda un plus de control de la operadora a la hora de gestionar la soluci\u00f3n.<\/p>\n

 <\/p>\n

Alejandro Revuelta<\/strong><\/p>\n

Business Development Director de Ximdex<\/p>\n

 <\/p>\n

ART\u00cdCULO INCLUIDO EN EL ESPECIAL\u00a0\u2018DIGITALIZACI\u00d3N DE LA ENERG\u00cdA\u2019<\/a>\u00a0DEL N\u00daMERO DE JUNIO DE\u00a0AGENDA DE LA EMPRESA<\/a><\/h6>\n","protected":false},"excerpt":{"rendered":"

Permite usar datos y sacar el m\u00e1ximo rendimiento a los mismos para aplicarlos con la premisa de reducci\u00f3n de tiempo y de costes operativos El fraude el\u00e9ctrico en Espa\u00f1a se ha convertido en un quebradero de cabeza para las compa\u00f1\u00edas suministradoras de energ\u00eda el\u00e9ctrica. Seg\u00fan la CNMC, y a partir de los datos recabados por […]<\/p>\n","protected":false},"author":2,"featured_media":82540,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":[],"categories":[5],"tags":[8285,48041,6769,3502,48042],"wps_subtitle":"","_links":{"self":[{"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/posts\/82539"}],"collection":[{"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/comments?post=82539"}],"version-history":[{"count":0,"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/posts\/82539\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/media\/82540"}],"wp:attachment":[{"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/media?parent=82539"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/categories?post=82539"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.agendaempresa.com\/wp-json\/wp\/v2\/tags?post=82539"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}