Contrairement à une idée très répandue, les méthodes d'analyse des données ont été élaborées depuis fort longtemps. H. Hotelling, dans les années trente, posait les fondements de l'analyse en composantes principales et de l'analyse canonique en développant les travaux de C. Spearman et de K. Pearson qui dataient du début du siècle.
Jusqu'aux années soixante, ces méthodes étaient perfectionnées et s'enrichissaient de variantes, mais toutes restaient inabordables pour les praticiens, car elles nécessitaient une masse considérable de calculs. C'est l'apparition, puis l'extraordinaire développement des ordinateurs qui permirent la vulgarisation des techniques statistiques d'analyse des données.
Mais qu'entend-on par « analyse des données » ?
L'analyse des données est le processus de collecte, de modélisation et d'analyse des données afin d'en extraire des informations qui facilitent la prise de décision. Il existe plusieurs méthodes et techniques pour effectuer une analyse, selon le secteur d'activité et l'objectif de l'enquête.
L'analyse des données est en bref une méthodologie permettant de mettre en relation des faits et des figures pour résoudre un problème de recherche. Elle est essentielle pour décrire et parfois expliquer des phénomènes. Une autre partie importante de la recherche est l'interprétation des données, qui découle de l'analyse des données et permet de faire des déductions et de tirer des conclusions ou décisions. Il est souvent difficile de déduire les données brutes, il faut alors analyser les données et en déduire le résultat de l'analyse.
Pourquoi avons-nous besoin de l'analyse des données ?
L'analyse des données est importante dans la recherche, car elle rend l'étude des données beaucoup plus simple et plus précise. Elle aide les chercheurs à interpréter les données de manière directe, afin qu'ils n'oublient rien qui pourrait les aider à en tirer des enseignements.
L'analyse des données est un moyen d'étudier et d'analyser d'énormes quantités de données (massive ou big data). La recherche comprend fréquemment l'examen de tas de données, qui deviennent de plus en plus difficiles à gérer pour les chercheurs à chaque minute qui passe. Par conséquent, les connaissances en matière d'analyse de données constituent un avantage considérable pour les chercheurs à l'heure actuelle, car elles les rendent très efficaces et très productifs.
Ce cours intitulé "Techniques d'analyse des données ou TADD" vous permet de vous familiariser avec les techniques nécessaires à l'analyse de données réelles massives (Big Data) à l'aide d'outils analytiques ou statistiques (tels que R, MATLAB, Python, etc.) afin de prendre de meilleures décisions commerciales.
Figure 1 montre la définition du « TADD »
Figure 1 : définition du TADD
- Créateur de cours: Alaeddine Benrazek