Chapitre 2 : Les outils d’analyse
Exemple : Aujourd’hui, nous sommes le xx/xx/2007, la température est de 18°C et nous faisons le cours de SI.
Une entité est une chose concrète ou abstraite appartenant au réel perçu à propos duquel nous voulons enregistrer les informations. Exemple : Etudiant (concret) ; Module (Abstrait).
Les caractéristiques d’une entité sont :
Une association est définie par une correspondance (une relation) entre deux ou plusieurs entités. Une association peut posséder une ou plusieurs propriétés.
CLIENT (Entité 1) passer (Association) COMMANDE (Entité2)
Etudiant (Mat, nom, prénom, date-naissance)
→Occurrence de l’Entité. (81/200/01, Benali, sami,22/10/1989).
Notion de fichier
Un fichier est un ensemble d’informations se rapportant à un même sujet.
Exemple : Mat Type Taille
99/0145 Caractère 07
Chaque fichier est identifié par son nom et chaque élément de fichier ‘enregistrement’ est identifié grâce à une zone particulière appelée Clé d’accès ou Index ou Indicatif.
Cette clé d’accès doit avoir une valeur unique (qui ne doit pas être partagée par les autres enregistrements). Le champ matricule du fichier étudiant est sa clé d’accés.
La codification
Les informations saisies par les organisations se présentent parfois sous des formes difficiles à exploiter : elles sont volumineuses, verbeuses, la même information peut apparaître sous des présentations différentes. La codification permet dans de nombreux cas, en réduisant et en normalisant la forme de ces données, d’en faciliter l’utilisation, d’éviter un coût de traitement prohibitif et de limiter les erreurs. Elle consiste à associer un ensemble de symboles aux informations.
Exemple : Dans une entreprise, les clients réguliers peuvent se voir attribuer un numéro de code. Un code est représenté par une ou plusieurs tables de codage
- Introduction
- Notion d’information
- Définition
Exemple : Aujourd’hui, nous sommes le xx/xx/2007, la température est de 18°C et nous faisons le cours de SI.
- Rôle de l’information
- Classe de l’information
- Information de nature hiérarchique : représente les ordres ou les instructions qui sont destinées vers les subordonnées de la part d’un supérieur (Inventaire).
- Informations de conseils : certains postes de travail ne reçoivent pas uniquement des ordres mais aussi des informations destinées à l’idée d’accomplissement des tâches.
- Informations d’interactions : c’est lorsqu’il y’a échange d’informations entre les services.
- Informations de représentation : sont généralement des résultats ou réponses aux informations de décision. Exemple : L’état d’inventaire.
- Représentation de l’information
- Notion d’entité
- Représentation de l’information
Une entité est une chose concrète ou abstraite appartenant au réel perçu à propos duquel nous voulons enregistrer les informations. Exemple : Etudiant (concret) ; Module (Abstrait).
Les caractéristiques d’une entité sont :
- Elle possède une existence autonome.
- Elle est distinguée des autres entités.
- Elle peut posséder des propriétés.
- Elle possède une durée de vie.
Une association est définie par une correspondance (une relation) entre deux ou plusieurs entités. Une association peut posséder une ou plusieurs propriétés.
CLIENT (Entité 1) passer (Association) COMMANDE (Entité2)
- Notion de propriété
- Notion d’occurrence
Etudiant (Mat, nom, prénom, date-naissance)
→Occurrence de l’Entité. (81/200/01, Benali, sami,22/10/1989).
Notion de fichier
Un fichier est un ensemble d’informations se rapportant à un même sujet.
- Structure d’un fichier : c’est un ensemble d’informations, il est à vrai dire un ensemble d’ensembles d’informations. Le deuxième ensemble est un groupe de propriétés relatives à une même entité. Ce groupe de propriétés constitue ce que l’on appelle un enregistrement. Nous pouvons dire qu’un fichier est un ensemble d’enregistrements. Exemple : Soit le fichier étudiant constitué d’un ensemble d’informations relatives aux étudiants. « Matricule, nom, prénom, date-naissance, adresse, année-cursus, année-Bac ». Cette suite d’informations constitue la structure de l’enregistrement du fichier étudiant. La structure d’un fichier est la structure de l’enregistrement qui le constitue.
- Notion de champ : chaque information constitue l’enregistrement du fichier qui s’appelle champ (zone, rubrique, propriété). Exemple : Mat est un champ, nom est un champ.
Exemple : Mat Type Taille
99/0145 Caractère 07
Chaque fichier est identifié par son nom et chaque élément de fichier ‘enregistrement’ est identifié grâce à une zone particulière appelée Clé d’accès ou Index ou Indicatif.
Cette clé d’accès doit avoir une valeur unique (qui ne doit pas être partagée par les autres enregistrements). Le champ matricule du fichier étudiant est sa clé d’accés.
La codification
Les informations saisies par les organisations se présentent parfois sous des formes difficiles à exploiter : elles sont volumineuses, verbeuses, la même information peut apparaître sous des présentations différentes. La codification permet dans de nombreux cas, en réduisant et en normalisant la forme de ces données, d’en faciliter l’utilisation, d’éviter un coût de traitement prohibitif et de limiter les erreurs. Elle consiste à associer un ensemble de symboles aux informations.
Exemple : Dans une entreprise, les clients réguliers peuvent se voir attribuer un numéro de code. Un code est représenté par une ou plusieurs tables de codage
Les qualités possibles d’un code
Les qualités d’un code doivent s’apprécier selon les circonstances de création du code. Nous citerons les qualités suivantes :
- La non-ambiguité : à un code correspond alors un renseignement et un seul ;
- La concision : un code de dimension réduite permet un gain de place sur les supports d’enregistrement.
- La durabilité : il devra répondre au besoin sur une durée suffisante pour éviter la modification des supports où il apparaît déjà. A cet effet, il permettra, sans modification de la codification existante, la représentation de nouvelles entités. Ceci peut se traduire par l’insertion de symboles entre ceux qui existent déjà, ou par l’extension de la liste des codes après son dernier élément.
- L’adaptation au problème à traiter : notamment aux moyens utilisés pour le codage et le décodage de l’information.
- La facilité de contrôle qu’il présente : la validité d’un code contrôlable peut être en partie vérifiée grâce à son propre contenu afin de limiter les erreurs de codage, de retranscription. Exemple : un numéro minéralogique tel que 203RZ802 sera immédiatement réputé faux dans notre pays.
- La logique : la correspondance établie entre symboles et entités représentées doit être naturelle. Exemple : pour représenter des masses de 10, 20, 30 kg, mieux vaut choisir des codes 1, 2,3 que 4, 6,1.
- La transparence : dans le cas où le code peut être décodé sans recours à une table de codage.
- Les différents modes de codification
- Code séquentiel compact
- Code séquentiel à trous
- Code séquentiel par tranches
- Code significatif : descriptif articulé et mnémonique
- Code à niveaux
- Code combiné
- Code contrôlable par clé
- Les contrôles
Comment contrôler les informations ?
Le contrôle comporte la détection des erreurs et la correction des erreurs détectées. Il existe deux types de contrôles : directe et indirecte.
- Les contrôles directes : mettre en jeux uniquement l’information à contrôler. Les principaux types de contrôles directs : contrôle de présence, contrôle de cadrage de l’information, contrôle de type, contrôle sur la plage de valeur.
- Les contrôles indirectes : ils sont réalisés en comparant ou en rapprochant les valeurs de plusieurs informations. Les opérateurs de comparaison (=, >, >) peuvent être utilisés pour les contrôles indirectes pour détecter les erreurs. Les opérations de calcul peuvent être utilisées aussi.
Un fichier est un ensemble structuré d’informations décrivant des entités de même nature à l’aide de renseignements similaires. Chaque entité est décrite par un article du fichier regroupant les informations indivisibles qui s’y rapportent, et que l’on appelle rubriques de l’article. Une ou plusieurs rubriques, permettant de différentier les articles, constituant l’indicatif du fichier.
Exemple
Un fichier « personnel » rassemble autant d’articles que d’employés, chaque article décrit une personne à l’aide des données utiles : nom, prénom, adresse, date de naissance, matricule, emploi,… : le matricule peut constituer l’indicatif de ce fichier.
2.7 Opérations sur les fichiers
- Création d’un fichier : cette opération consiste à stocker les informations sur un support pour une futur utilisation.
- Annulation (destruction) d’un fichier : cette opération consiste à supprimer un fichier qui ne sera plus utilisé.
- Tri (classement) d’un fichier : cette opération consiste à mettre de l’ordre dans un fichier : ordonner les enregistrements du fichier suivant un critère de tri. Un fichier peut être trié suivant plusieurs critères.
- La fusion (réunion) de plusieurs fichiers : la réunion de deux ou plusieurs fichiers consiste à rassembler les enregistrements de ces fichiers pour en constituer un seul fichier. La fusion consiste à réunir deux ou plusieurs fichiers triés suivant un critère.
- Eclatement d’un fichier : cette opération consiste à diviser un fichier initial
Les opérations qui vont suivre ne vont pas manipuler la totalité des enregistrements du fichier comme les précédents mais quelques enregistrements du fichier.
Typologie des fichiers
On distingue deux types de fichiers:
Fichier historique de la paie des employés d’une entreprise contenant les situations mensuelles pour l’année 2006.
2.9 Caractéristiques des fichiers
Durant sa vie un fichier peut être sujet à plusieurs évènements qui vont affecter les caractéristiques des fichiers. Les principales caractéristiques d’utilisation des fichiers sont :
Les caractéristiques des unités de disque sont : la densité d’enregistrement, la vitesse de rotation, le temps de positionnement d’un bras, la vitesse de transfert, le temps de lecture et d’écriture.
Le facteur de blocage représente le nombre d’enregistrements bloqués dans un enregistrement physique (voir enregistrement logique)
2.10 Méthodes d’organisation des fichiers
- Ajout d’article : cette opération consiste à ajouter des articles à un fichier.
- Suppression d’article : cette opération consiste à supprimer un article du fichier.
- Modification d’article : cette opération consiste à modifier le contenu de un ou plusieurs champs de l’article.
- Consultation d’articles : cette opération consiste à lire certains articles du fichier.
Typologie des fichiers
On distingue deux types de fichiers:
- Fichiers de textes : Les données sont stockées sous forme de code ascii. Ex : 35 -> (63c est le code ascii de ‘3’, 65C est le code ascii de ‘5’). On peut lire et écrire les fichiers de textes avec un éditeur de textes. Il y a la notion de fin de ligne: elle est indiquée par la présence du caractère de contrôle EOL (36C)
- Fichiers binaires : Les données sont stockées dans un format interne. Ex: 35 -> (3510=438). Lecture et écriture des fichiers binaires par programme uniquement.
- Les fichiers permanents ou de base : contiennent des informations de base pour l’application considérée et qui sont conservés de manière permanente.
- Les fichiers de situation : il représente la copie d’un fichier permanent à un instant donné.
- Les fichiers archives : ce sont des fichiers de situation qui sont conservés pour une durée indéterminée.
- Les fichiers historiques : ils contiennent des informations permanentes prises à des intervalles de temps réguliers.
Fichier historique de la paie des employés d’une entreprise contenant les situations mensuelles pour l’année 2006.
- Les fichiers mouvement : ils contiennent des informations destinées à mettre à jour des fichiers permanents (ou d’autres fichiers mouvement). Ils ont une durée de vie courte.
2.9 Caractéristiques des fichiers
Durant sa vie un fichier peut être sujet à plusieurs évènements qui vont affecter les caractéristiques des fichiers. Les principales caractéristiques d’utilisation des fichiers sont :
- Le taux d’activité du fichier : c’est le nombre d’enregistrements traités pendant une période donnée pour une opération donnée.
- Le taux de consultation : c’est le rapport entre le nombre d’enregistrements consultés ou modifiés pendant une durée donnée et le nombre d’enregistrements total du fichier.
- Volume d’un fichier (taille d’un fichier) : c’est le nombre d’enregistrements multiplié par la taille de l’enregistrement. La taille de l’enregistrement est égale à la somme des longueurs des champs.
- Le taux de renouvellement d’un fichier : c’est le nombre d’enregistrements ajoutés dans le fichier pendant une durée donné.
- Fréquence de consultation : c’est le nombre d’enregistrements consultés pendant une durée donné.
- Stabilité d’un fichier : un fichier est stable si le nombre d’enregistrements ajouté est approximativement égal au nombre d’enregistrements supprimés.
- La capacité de stockage : qui donne la taille exprimée en caractère que l’on peut utiliser sur un support donné.
- Le temps d’accès : c’est le temps qui s’écoule entre une requête de lecture d’un enregistrement et la lecture proprement dite.
- Le mode d’accès : une caractéristique fondamentale d’un fichier est la manière dont il est possible d’accéder à son contenu. Trois possibilités d’accès doivent être envisagés :
- Accès séquentiel : dans lequel les enregistrements sont rangés dans un ordre logique où il est nécessaire de balayer tous ceux qui le précède pour atteindre l’un d’entre eux. Exemple : Accès à un paragraphe d’un livre sans sommaire.
- Accès direct (ou sélectif) : dans lequel les enregistrements sont accessibles tous de suite grâce à un repérage approprié, pour une caractéristique qui lui est propre : sa clé d’accès. Exemple : Accès à une personne dont le nom commence par une lettre donné à l’aide d’un répertoire alphabétique.
- Accès semi-direct : où seul un groupe d’articles est repéré et accessible directement, un balayage séquentiel reste nécessaire dans ce groupe pour isoler un enregistrement. Exemple : Dans le répertoire précédemment cité, si l’on s’intéresse à une personne précise et non plus à l’ensemble de celles dont le nom commence par une lettre.
- Les différents supports des fichiers : Les supports de fichiers ont évolué durant ces dernières années de la bande magnétique aux mémoires adressables : disquettes, disque dur, CD ROM, Clé USB, Disque externe,….Dans les supports de type disque, les informations sont enregistrés sur la surface du disque le long des pistes concentriques. En plus des données la piste doit contenir un certain nombre d’informations supplémentaires nécessaires au système d’exploitation, tel que l’adresse de la piste, l’adresse et la position de chaque enregistrement, la marque de secteur et l’espace entre enregistrements. L’adresse de la piste comporte les informations suivantes :
Les caractéristiques des unités de disque sont : la densité d’enregistrement, la vitesse de rotation, le temps de positionnement d’un bras, la vitesse de transfert, le temps de lecture et d’écriture.
Le facteur de blocage représente le nombre d’enregistrements bloqués dans un enregistrement physique (voir enregistrement logique)
2.10 Méthodes d’organisation des fichiers
- Organisation séquentielle : un fichier est organisé en séquentiel si lorsqu’il est crée les enregistrements sont disposées les uns après les autres. Lorsqu’il est utilisé, l’accès à l’i ème enregistrement ne se fait qu’après passage par les i-1 enregistrements. Les différents supports que nous avons vus supportent l’organisation séquentielle. Les opérations que nous pouvons effectuer sur fichiers à organisation séquentielle sont la mise à jour et la consultation. L’organisation séquentielle est conseillée dans le cas des fichiers permanents triés suivant le même critère que les fichiers mouvement qui servent à le mettre à jour. Elle est conseillée pour les fichiers dont le taux de mise à jour est important lors de chaque traitement.
- Organisation directe : un fichier a une organisation directe lorsqu’il est possible d’accéder directement à l’enregistrement recherché. L’accès est possible grâce à une clé de recherche ou indicatif. Les supports qui supportent l’organisation directe sont le disque et la disquette. Les opérations que nous pouvons faire sur les fichiers à organisation directe sont l’adjonction et la consultation et la modification. La suppression reste toutefois logique. L’organisation directe est conseillée dans le cas où les fichiers permanents et mouvement ne sont pas triés suivant le même critère. Aussi lorsque le taux de mise à jour est réduit lors de chaque traitement.
- Organisation séquentielle indexée : lorsque les enregistrements sont disposés les uns après les autres et chaque enregistrement a son indicatif. Le fichier organisé en séquentielle indexé doit être crée de la manière suivante : les enregistrements seront classés suivant l’ordre croissant des clés et disposés de manière séquentielle sur le support. Les supports qui permettent cette organisation sont les mémoires adressables. L’avantage de cette organisation est que le fichier peut être utilisé en accès direct et séquentiel et le taux de mise à jour est faite pour une opération donnée.