¿Entendemos hoy día todo lo que engloba el Machine Learning?

Creo que no, que todavía estamos en esa fase un poco de desconcierto. Se ha generado muchísimo ruido alrededor del Machine Learning sobre todo cuando se han generalizado los resultados que se han tenido con Machine Learning a lo que se conoce como Inteligencia Artificial. El Machine Learning es una subárea de la Inteligencia Artificial y por unas razones u otras, desde el ánimo de atención de determinados investigadores o la falta de exigencia en la prensa a la hora de filtrar las noticias y demás, y el hecho de que en las películas de Hollywood lo han hecho muy bien con los robots y ciencia ficción, todos pensamos que la Inteligencia Artificial está a la vuelta de la esquina y está muchísimo más lejos de lo que nos parece. Cada vez que haces un sistema de Machine Learning, sí que hay una parte en la que un ordenador, mucho más rápido, va a hacer toda la computación estadística para encontrar patrones en los datos de forma automática muy fácil, en comparación en como se hacía hace cinco o diez años. Pero lo que es preparar los datos, analizarlos luego a posteriori, todavía requiere muchísima cantidad de intervención humana y estamos muy muy lejos de ver algo mínimamente inteligente. Estamos pasando un proceso donde, en los próximos meses, la gente va a sentirse muy desilusionada con el tema de la Inteligencia Artificial, y va a aprender mucho más sobre el ámbito de la practicidad que tiene el Machine Learning y para qué sirve y para qué no sirve.

¿Para qué no sirve?

Para programas que se pueden generar ya con experiencia. Si yo quiero hacer un programa, por ejemplo, para distinguir entre perros y gatos, y escribo las reglas para hacer un programa que diga esto es un perro o un gato, diría, por ejemplo, animal con cuatro patas, o con cola, elementos que tienen en común ambos. Por ello, el número de reglas es muy complejo, y es muy difícil para un programador escribir esas reglas, y muy difícil de mantener luego ese programa. La otra forma de hacerlo es darle imágenes de perros y de gatos al ordenador, y el sistema de Machine Learning del ordenador es capaz de aprender las reglas de forma automática.

¿La base de todo entonces es el dato?

Efectivamente. Hay una necesidad de ingenieros de datos, de gente que sepa preparar bien los datos para que los sistemas de aprendizaje de Machine Learning sean capaces de funcionar. El dato es la moneda de cambio, es lo que compañías como Google, Microsoft, Facebook están apostando mucho. Si calculas el valor de las cinco empresas de tecnología mas grandes del mundo, es de 3,7 trillones de dólares americanos. ¿Sabes cuánto valen el Ibex 35, las 35 compañías mas grandes de España? 900 billones de dólares. Si no hay una conciencia de que el dato es importante y de que me tengo que centrar en eso, que tengo que aprender a utilizar Machine Learning, la separación, la simetría que se crea entre las compañías de tecnología, -todas concentradas en Estados unidos y no hay ninguna en Europa ni tampoco en España-, va a provocar un cataclismo, por lo que necesitamos hacer algo para tener algo de valor en el futuro.

¿Qué podríamos hacer?

Creo que parte esencial es la educación, tanto a nivel individual, de universidad, como a nivel Estado. Debería haber una especie de programa general, por ejemplo: “hemos decidido que de aquí a 10 años estos van a ser los cuatro pilares de educación y aquí todo el mundo va a aprender el Machine Learning cuando está en la guardería y va a seguir haciéndolo en 10 años, y cuando salga la gente del instituto va a ser increíblemente eficaz en este tipo de cosas”. Puede ser eso, o biotecnología… áreas en las que la gente realmente se especialice ya desde muy pequeños y trascienda luego a más empresas que sean capaces de crear tecnologías alrededor. Eso va a traer más empresas internacionales que quieran tener sus sedes aquí, porque hay mucha buena gente formada en esas cosas, y va a haber gente que cree aplicaciones que permitan en otras partes del mundo aprovecharlas…

Si todos son datos, la máquina aprende, ¿dónde quedamos nosotros?

Nosotros somos increíblemente inteligentes, mucho mas de lo que pensamos. Un ordenador solo va a aprender, por ejemplo, qué es una grabadora, cuando ha visto millones de ellas. Los humanos somos capaces de generalizar muy bien y de resolver problemas de forma general muy muy bien. Las máquinas, de momento, porque en el futuro no sabremos cómo serán, saben resolver problemas de forma específica muy bien, pueden hacer en milisegundos cosas que a nosotros nos cuestan horas y de forma más eficiente, pero no son capaces de generalizar. Para una tarea específica muy bien, pero para una tarea general, están todavía muy lejos de ello.

¿Alguna desventaja del Machine Learning?

Como comentaba antes, hay problemas que no son necesariamente resolubles con Machine Learning. Luego hay problemas que requieren grandes volúmenes de información, y el Machine Learning aprende de los datos tal y como están: si no tienen la calidad adecuada, o se han creado por humanos que han tenido cierto nivel de discriminación, va a aprender a discriminar tal y como lo hacen las personas. Todavía se necesitan técnicas para evitar que se produzca esa discriminación porque no sabe distinguir, y se tiene que trabajar mucho para estar seguros de que no se producen determinados tipos de sesgos.

¿Hay un gap de profesionales del dato?

Creo que en España hay un gap en el sentido de que es más fácil el tema de ponerte al día en el Machine Learning, pero en lo que es la parte más interna somos muy generalistas en España en la educaciónn y en la parte de posgrado. EE. UU. es mucho más especialista: en los últimos años, ha formado a mucha gente especialista en Machine Learning mientras que en España se ha hecho de forma más generalista. Haberlos haylos, pero hay muy pocos especialistas, y llevo algunos años señalando que alguna universidad española debería plantearse en hacer un máster muy muy serio de Machine Learning. Desde Big ML hacemos lo que podemos: hacemos una escuela en Valencia, en Praga…

¿La futura supervivencia de las empresas pasa por el Machine Learning?

Sin lugar a dudas, porque conseguirán un nivel de optimización increíble. Las empresas no tendrán más obligación que utilizarlo para poder ser competitivas, es como el email. Recuerdo muchas empresas que se planteaban que para qué iban a dar el email, o que lo daban inicialmente a cinco empleados, y ahora no te planteas que no te lo den al entrar en una compañía, o que no te den acceso a Internet -que también se planteó en su momento-. Ahora mucha gente se pregunta, ¿tengo que darle acceso a Machine Learning? Pues claro, porque va a ser más inteligente, va a poder procesar más datos para ti y si vas a poder optimizar va a ser mejor para tu negocio.

¿Cuál el primer paso que debe dar una empresa que quiera empezar a emplear Machine Learning?

Encontrar, dentro de la propia empresa, a la persona que esto le llame la atención, el innovador. Este se lo va explicando a los demás y se crea esa conciencia colectiva sobre la importancia que tiene el dato y cómo le puedo sacar partido, y claro, te vas a equivocar la primera vez, pero pasas esa curva de aprendizaje y la empresa empieza a optimizarse. Una vez sabes cómo funciona, optimizar tu empresa en base al análisis de datos.

 

Inma Sánchez