Hola de nuevo Hoy continuamos una serie de publicaciones dedicadas al lanzamiento del curso
Big Data para gerentes . Entonces comencemos.
"La IA está cerca". Esto es lo que hemos estado escuchando desde 2017 y, muy probablemente, continuaremos escuchando más. Para las empresas establecidas que no son Google o Facebook, surge una pregunta natural: ¿qué tenemos que nos permita sobrevivir a esta transición?
En nuestra experiencia, la respuesta es "datos". La prensa empresarial también se adhiere a este punto de vista. Se han escrito cientos de artículos que afirman que
"los datos son petróleo nuevo", lo que significa que es el combustible el que impulsará la economía de la IA.

Si es así, puede suponer que su empresa tiene suerte. Recopiló todos estos datos y cuando finalmente apareció la IA, resultó que estaba sentado en las reservas de petróleo. Pero si eres realmente tan afortunado, tal vez deberías preguntarte: "¿Somos realmente tan afortunados?"
En la analogía "los datos son petróleo" hay algo de verdad. Como combustible para un motor de combustión interna, se necesitan datos para que AI funcione. La IA toma datos sin procesar y los convierte en algo útil para la toma de decisiones. ¿Quieres saber el clima para mañana? Usemos los datos meteorológicos del período anterior. ¿Quieres saber las ventas de yogurt la próxima semana? Usemos datos sobre ventas pasadas de yogurt. AI es una máquina de pronóstico basada en datos.
¿Pero la IA necesita
tus datos? Hoy en día, se cree que todos los datos pueden ser útiles para la IA, pero en realidad no es así. Sí, se necesitan datos para el funcionamiento diario de su máquina de pronóstico. Pero lo más probable es que estos no sean los datos que tiene ahora. En cambio, su empresa está acumulando datos que se utilizarán para
construir una máquina de pronóstico, y no para su funcionamiento.
Ahora tienes datos de entrenamiento. Se pueden usar como material para aprender el algoritmo. Y ya este algoritmo se usa para generar pronósticos de acciones.
Es decir, sí, significa que sus datos son valiosos. Pero esto no significa que su negocio sobrevivirá a la tormenta. Una vez que los datos se utilizan para entrenar la máquina de predicción, se deprecia y se vuelve inútil para este tipo de predicción. Continuando la analogía con el petróleo, los datos pueden agotarse. Se pierden después de su uso. Los científicos son conscientes de esto. Pasan años recopilando datos, pero tan pronto como producen resultados, comienzan a acumular polvo en un estante o una unidad flash olvidada. Su negocio puede estar sentado en un pozo petrolero, pero sus reservas son limitadas. Esto no le garantiza nada más en la economía de IA que solo un valor de reventa más rentable.
Independientemente de cuán valiosos puedan ser sus datos, la capacidad de beneficiarse puede ser limitada. ¿Cuántas fuentes de datos comparativos hay? Si es uno de los muchos proveedores de yogurt, sus bases de datos que contienen información sobre la venta de yogurt en los últimos 10 años y datos relacionados (precio, temperatura, ventas de productos relacionados, por ejemplo, helados) tendrán menos valor de mercado que si usted sería el único propietario de estos datos. En otras palabras, como con el petróleo, cuantos más proveedores tengan datos similares a los suyos, menor será el valor de sus datos de capacitación. El valor de sus datos de entrenamiento se ve influenciado por el valor obtenido a través de una mayor precisión de los pronósticos. Sus datos de capacitación serán más valiosos si la precisión de predicción mejorada aumenta las ventas de yogurt en $ 100 millones, no solo 10.
Además, el valor actual de los datos generalmente depende de las acciones tomadas en los negocios cotidianos: nuevos datos recibidos todos los días que le permiten usar su máquina para pronosticar después del entrenamiento. También ayuda a mejorarlo a través del entrenamiento. Los 10 años de datos de ventas de yogurt son útiles para entrenar el modelo de IA para predecir las ventas futuras de yogurt, pero las predicciones reales utilizadas para administrar la cadena de suministro requieren datos continuos de manera continua. Y este es un punto importante para las empresas de hoy.
Una startup de IA que adquiere datos de ventas de yogurt anteriores puede entrenar el modelo de IA para predecir ventas futuras. No podrá usar el modelo para la toma de decisiones a menos que reciba datos operativos actuales para capacitación. A diferencia de las startups, las grandes corporaciones generan datos operativos todos los días. Esto es valioso Cuantas más operaciones, más datos. Además, el propietario de la operación puede usar la predicción para mejorar aún más las operaciones futuras.
En la economía de IA, el valor de sus datos acumulados se limita al beneficio único de aprender el modelo de IA. Y el valor de los datos de entrenamiento, como el petróleo, depende de la cantidad total: cuantas más personas lo posean, menos valiosos serán. Por el contrario, el valor de sus datos operativos actuales no se limita a una ganancia única, sino que proporciona un beneficio permanente en la operación y la mejora posterior de la máquina predictiva. Por lo tanto, a pesar de todo lo que se dice que los datos son nuevos, sus datos acumulados antiguos no son lo principal. Sin embargo, pueden conducir a lo principal. Su valor para sus prospectos es bajo, pero si puede encontrar formas de generar un flujo de datos nuevo y constante que proporcione una ventaja funcional en términos de la capacidad predictiva de su IA, esto le dará una ventaja estable cuando aparezca.
Haga preguntas, escriba sus comentarios y no olvide que mañana, 10 de abril, será una
jornada de puertas abiertas , que tendrá lugar
Denis Afanasyev , CEO, CleverDATA.