Les données de votre entreprise sont-elles précieuses à l'ère de l'IA?

Bonjour encore! Aujourd'hui, nous continuons une série de publications dédiées au lancement du cours Big Data for Managers . Commençons donc.

"L'IA est proche." C'est ce que nous entendons depuis 2017 et, très probablement, nous continuerons à en entendre davantage. Pour les entreprises établies qui ne sont pas Google ou Facebook, une question naturelle se pose: qu'est-ce que nous avons qui nous permettra de survivre à cette transition?

D'après notre expérience, la réponse est «données». La presse économique adhère également à ce point de vue. Des centaines d'articles ont été écrits affirmant que «les données sont du nouveau pétrole», ce qui signifie que c'est le carburant qui stimulera l'économie de l'IA.



Si oui, alors vous pouvez supposer que votre entreprise a de la chance. Vous avez collecté toutes ces données et lorsque l'IA est finalement apparue, il s'est avéré que vous étiez assis sur des réserves de pétrole. Mais si vous êtes vraiment si chanceux, vous devriez peut-être vous demander: "Sommes-nous vraiment si chanceux?"

Dans l'analogie «les données, c'est du pétrole», il y a une part de vérité. En tant que carburant pour un moteur à combustion interne, les données sont nécessaires au fonctionnement de l'IA. L'IA prend des données brutes et les transforme en quelque chose d'utile pour la prise de décision. Vous voulez connaître la météo de demain? Utilisons les données météorologiques de la période précédente. Vous voulez connaître les ventes de yaourts la semaine prochaine? Utilisons les données sur les ventes passées de yaourt. L'IA est une machine de prévision basée sur les données.

Mais l'IA a-t-elle besoin de vos données? Aujourd'hui, on pense que toutes les données peuvent potentiellement être utiles pour l'IA, mais en fait ce n'est pas le cas. Oui, des données sont nécessaires pour le fonctionnement quotidien de votre machine de prévision. Mais ce ne sont probablement pas les données dont vous disposez actuellement. Au lieu de cela, votre entreprise accumule des données qui seront utilisées pour construire une machine de prévision et non pour son fonctionnement.

Vous disposez maintenant de données d'entraînement. Ils peuvent être utilisés comme matériel d'apprentissage de l'algorithme. Et déjà cet algorithme est utilisé pour générer des prévisions d'actions.

Autrement dit, cela signifie que vos données sont précieuses. Mais cela ne signifie pas que votre entreprise survivra à la tempête. Une fois que les données sont utilisées pour former la machine de prédiction, elles se déprécient et deviennent inutiles pour ce type de prédiction. Poursuivant l'analogie avec le pétrole, les données peuvent s'épuiser. Ils sont perdus après utilisation. Les scientifiques en sont conscients. Ils passent des années à collecter des données, mais dès qu'ils produisent des résultats, ils commencent à collecter de la poussière sur une étagère ou un lecteur flash oublié. Votre entreprise est peut-être assise sur un puits de pétrole, mais ses réserves sont limitées. Cela ne vous garantit rien de plus dans l'économie de l'IA qu'une valeur de revente plus rentable.

Quelle que soit la valeur de vos données, la possibilité d'en bénéficier peut être limitée. Combien de sources de données comparatives existe-t-il? Si vous êtes l'un des nombreux fournisseurs de yogourt, vos bases de données contenant des informations sur la vente de yogourt au cours des 10 dernières années et des données connexes (prix, température, ventes de produits connexes, par exemple, crème glacée) auront moins de valeur marchande que si vous seriez le seul propriétaire de ces données. En d'autres termes, comme c'est le cas pour le pétrole, plus il y a de fournisseurs qui ont des données similaires aux vôtres, plus la valeur de vos données de formation est faible. La valeur de vos données d'entraînement est en outre influencée par la valeur obtenue grâce à une précision accrue des prévisions. Vos données d'entraînement seront plus utiles si l'amélioration de la précision des prévisions augmente les ventes de yaourts de 100 millions de dollars, et pas seulement de 10.

De plus, la valeur actuelle des données dépend généralement des actions entreprises au quotidien - de nouvelles données obtenues chaque jour qui vous permettent d'utiliser votre machine pour effectuer des prévisions après la formation. Il contribue également à l'améliorer grâce à la formation. 10 ans de données sur les ventes de yaourt sont utiles pour former le modèle d'IA à prédire les ventes futures de yaourt, mais les véritables prédictions utilisées pour gérer la chaîne d'approvisionnement nécessitent des données continues sur une base continue. Et c'est un point important pour les entreprises d'aujourd'hui.

Une startup d'IA qui acquiert des données de ventes de yaourt passées peut entraîner le modèle d'IA à prédire les ventes futures. Il ne pourra pas utiliser le modèle pour la prise de décision à moins qu'il ne reçoive les données opérationnelles actuelles pour la formation. Contrairement aux startups, les grandes entreprises génèrent quotidiennement des données opérationnelles. C'est précieux. Plus il y a d'opérations, plus il y a de données. De plus, le propriétaire de l'opération peut réellement utiliser la prédiction pour améliorer encore les opérations futures.

Dans l'économie de l'IA, la valeur de vos données accumulées est limitée à l'avantage unique d'apprendre le modèle de l'IA. Et la valeur des données de formation, comme le pétrole, dépend de la quantité totale - plus les gens en possèdent, moins ils deviennent précieux. En revanche, la valeur de vos données d'exploitation actuelles n'est pas limitée à un gain ponctuel, mais offre plutôt un avantage permanent dans le fonctionnement et l'amélioration ultérieure de la machine prédictive. Par conséquent, malgré tous les discours selon lesquels les données sont du nouveau pétrole, vos anciennes données accumulées ne sont pas la chose principale. Cependant, ils peuvent conduire à l'essentiel. Leur valeur pour vos prospects est faible, mais si vous pouvez trouver des moyens de générer un nouveau flux de données constant qui fournit un avantage fonctionnel en termes de capacité prédictive de votre IA, cela donnera un avantage stable lorsqu'il apparaîtra.

Posez des questions, écrivez vos commentaires et n'oubliez pas que demain, le 10 avril, sera une journée portes ouvertes , qui sera organisée par Denis Afanasyev , PDG de CleverDATA.

Source: https://habr.com/ru/post/fr447396/


All Articles