Définition

Données et informations

  • DonnĂ©es : Toute observation recueillie Ă  propos d’une caractĂ©ristique ou d’un Ă©vĂ©nement s’appelle une donnĂ©e.
  • Information
  • Les donnĂ©es brutes n’ont que peu de sens lorsqu’elles sont considĂ©rĂ©es isolĂ©ment.
  • Les donnĂ©es sont minimisĂ©es : traitĂ©es/analysĂ©es, puis prĂ©sentĂ©es de manière systĂ©matique.
  • Elles sont converties en informations.
  • Les donnĂ©es qui ne sont pas converties en informations ont peu de valeur pour l’évaluation et la planification et ne peuvent pas ĂŞtre utilisĂ©es par les personnes impliquĂ©es dans la prise de dĂ©cision. ĂŞtre utilisĂ©es par les personnes impliquĂ©es dans la prise de dĂ©cision.

Les données de classification peuvent être divisées en deux types

  • Les donnĂ©es quantitatives (numĂ©riques → (intervalle, ratio)) ;
  • les donnĂ©es qualitatives (descriptives → (), catĂ©goriques/comptes de frĂ©quence → (nominales, ordinales)).

Nettoyage des données La qualité des données est un problème majeur qui se pose partout dans les systèmes d’information. Ces problèmes peuvent être résolus par le nettoyage des données :

  • est un processus utilisĂ© pour dĂ©terminer les donnĂ©es inexactes, incomplètes ou dĂ©raisonnables
  • et d’en amĂ©liorer la qualitĂ© en corrigeant les erreurs dĂ©tectĂ©es.
  • ⇒ rĂ©duit les erreurs et amĂ©liore la qualitĂ© des donnĂ©es. Le nettoyage des donnĂ©es peut ĂŞtre un processus long et fastidieux, mais il ne peut ĂŞtre ignorĂ©. Critères de qualitĂ© des donnĂ©es :
  • exactitude, intĂ©gritĂ©, exhaustivitĂ©, validitĂ©, cohĂ©rence, unicitĂ©

Analyse en python