El Aprendizaje Máquina como mejora de los modelos estadísticos y econométricos

El aprendizaje máquina es un tipo de inteligencia artificial que se define como el sistema capaz de aprender del pasado para predecir el futuro. Esta definición es demasiado simple para la dificultad que entraña. Para entender qué significa que una máquina sea capaz de aprender, es necesario recurrir a las definiciones por separado de “aprendizaje” y “máquina”.

Aprendizaje (RAE)

  1. Acción y efecto de aprender algún arte, oficio u otra cosa.

La acepción de la RAE no clarifica si esta capacidad es humana o puede ser relativa a otros entes. Sabemos que los animales son capaces de aprender conductas mediante métodos de recompensa. De forma similar, se puede hacer que una computadora reciba algún tipo de premio por predecir de forma correcta un estadístico. Acogiéndonos a la definición, es correcto decir que el algoritmo está aprendiendo. Sin embargo, el método por el cual se produce esta capacidad en una computadora es tan diferente a lo conocido en términos neurológicos que el término “aprendizaje máquina” podría tener algún matiz adicional. La computadora comprende el lenguaje de las matemáticas. La recompensa por una predicción bien hecha se basa en reducir el error que ha cometido con respecto de la realidad. Este concepto, denominado optimización, es el premio que la máquina necesita para aprender.

Máquina (RAE)

  1. Conjunto de aparatos combinados para recibir cierta forma de energía y transformarla en otra más adecuada, o para producir un efecto determinado.

Según la definición, la máquina es capaz de recibir una entrada y transformarla en una salida teóricamente útil. Obviando el funcionamiento básico de los componentes que conforman un ordenador, y al respecto de lo que nos interesa, podemos decir que nuestra máquina recibe datos y los transforma en predicciones. En todo caso, se asume que nuestra máquina es capaz de hacer esta labor, ya sea por su diseño o por cualquier otro motivo. La motivación del aprendizaje máquina es precisamente evitar la tarea de diseñar a mano un modelo matemático-estadístico para predecir el futuro en base a la información pasada. La posible modificación de los datos de entrada convertiría en obsoleto este modelo muy fácilmente. Además de que en la literatura, los modelos o reglas matemáticas suelen tener un propósito general, por lo que ajustarse perfectamente a la tipología de la información manejada puede llegar a ser imposible. No quiero decir que se deba ignorar la matemática. Los ingenieros debemos ser expertos en ella. Nuestra habilidad de diseño de algoritmos debe comenzar en la matemática y terminar en la inteligencia artificial, y nunca al revés. Podríamos caer en errores básicos de concepto con demasiada facilidad (de hecho se dan, incluso en la literatura), pero este no es el tema de esta entrada.

Los modelos econométricos y estadísticos tradicionales buscan aproximar la causalidad de los resultados en base al histórico de los datos conocidos. Sin embargo, el aprendizaje máquina analiza automáticamente cada tipo de variable, evalúa las relaciones de estas entre sí, las categoriza por significancia en base a lo que se pretende predecir y genera una estructura matemática interna muy compleja capaz de lanzar una predicción a futuro, y en algunos casos, conocer su tasa de error. Aparentemente, una persona podría realizar un estudio similar. La experiencia es en sí mismo un aprendizaje, que produce conexiones neuronales todavía más complejas que las diseñadas por la computadora. No obstante, habitualmente se manejan cientos de datos diferentes al mismo tiempo. Para una persona es demasiado complejo llevar toda esta información al día. Este es uno de los motivos por los que el aprendizaje máquina es una herramienta de tanto poder. Datos caóticos con demasiada complejidad se convierten en valiosas revelaciones en cuestión de pocas horas.

En conclusión, estamos en un momento histórico en el que por primera vez se ha conseguido que las computadoras sean capaces de ajustarse a los datos y no al revés. La unión entre la experiencia y la visión general del impacto de los datos en una predicción se convierte, como expliqué en una entrada anterior, en el mayor aliado de las empresas. En un momento en el que la demanda de información es tan elevada, la tecnología está acorde con la necesidad. Es el trabajo de los ingenieros ponerlo a disposición de todo aquel que quiera extraer este potencial para sus propios intereses.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *