1-X75-LDB

Session 1 : Introduction aux bases de donnees

1 Introduction aux bases de données

1.1. Pourquoi étudier l’histoire des bases de données ?**

Comprendre l’évolution des bases de données, c’est comprendre comment l’humanité structure l’information pour administrer, compter, prévoir, décider.

Chaque étape historique répond à une même tension :

L’histoire des bases de données n’est donc pas technique au départ : elle est sociale, économique et cognitive.


1.2. Préhistoire : de la marque à la donnée (–20 000 → –3 000)

1.2.1. Les premières traces

Les humains utilisent :

Counting Token

Ishango

Ces systèmes permettent de représenter des quantités ou des différences. Ce ne sont pas encore des “données” : ce sont des indices stabilisés.

1.2.2. La logique sous-jacente

C’est la fonction fondamentale de toute base de données.


1.1.3. Antiquité : écriture, comptabilité, administration (–3 300 → 500)

1.3.1. Les tokens sumériens → le cunéiforme

Les jetons d’argile (compter le grain, le bétail, les dettes) deviennent des pictogrammes pressés dans l’argile. La comptabilité invente l’écriture.

Summerian tablet

1.3.2. Les registres impériaux

Égypte, Mésopotamie, Chine, Rome :

Les premiers “systèmes d’information” étaient administratifs, pas littéraires.

1.3.3. La table comme principe

On voit apparaître : lignes, colonnes, cases. Structure + répétition = base de données rudimentaire.


1.4. Moyen Âge → Lumières : systèmes comptables (1200 → 1800)

1.4.1. La comptabilité en partie double

Introduction des colonnes “débit” / “crédit”. C’est une forme primitive de relation entre opérations.

1.4.2. Standardisation du tableau

Les livres de comptes deviennent :

Le tableau devient outil de fiabilité.


1.5. Mécanisation du calcul (1642 → 1900)

1.5.1. Premières machines

Elles calculent, mais ne “stockent” pas. Le stockage reste sur papier.

Pascaline

1.5.2. Les cartes perforées

Jacquard (1801) → instructions sur cartes.

Jacquard (1801)

Hollerith (1890) → recensement américain par cartes. Hollerith (1890) IBM naît de cette révolution.

Les cartes perforées sont la première base de données mécanisée.

Et voici le clavier:

Card Puncher


1.6. Naissance de l’informatique et premières bases (1945 → 1969)

1.6.1. Le concept d’information (Shannon)

Claude Shannon (1948) transforme l’information en quelque chose de mesurable, comme on mesure la distance ou le poids. Avant, “information” était un concept vague. Il en fait une quantité mathématique précise: le bit. L’unité de base. Un bit = une réponse oui/non. Pile ou face = 1 bit d’information.

Shannon prouve que l’information peut être stockée, transmise et mesurée comme n’importe quelle grandeur physique, posant les fondations de l’ère numérique.

1.6.2. Ordinateurs à mémoire

Machines capables de :

1.6.3. Bases hiérarchiques et navigables

Ces systèmes sont performants mais peu flexibles.

Les données sont prisonnières de la structure.


1.7. 1970 : Le modèle relationnel (Codd)

Moment fondateur.

1.7.1. Les principes

1.7.2. Les avantages

Le relationnel sépare la façon de stocker de la façon d’interroger. C’est une révolution conceptuelle, pas seulement technique.


1.8. L’ère des SGBDR industriels (1979 → 2000)

1.8.1. Les pionniers

1.8.2. SQL devient normatif

Le langage unifie l’industrie. Les SGBDR deviennent le cœur des systèmes financiers, administratifs, logistiques.

1.8.3. Le data warehouse

Naissance de l’analytique moderne :


1.9. Rupture : Big Data & NoSQL (2005 → 2015)

1.9.1. Explosion des volumes

Google, Amazon, Facebook dépassent les limites des SGBDR centralisés.

1.9.2. Les nouveaux modèles

Chaque modèle privilégie un usage. On renonce volontairement à certaines garanties pour scaler.


1.10. NewSQL & systèmes distribués relationnels (2012 → …)

1.10.1. Retour au relationnel, mais distribué

Objectif : réunir cohérence + scalabilité horizontale.

1.10.2. Convergence

On garde le SQL, on change l’architecture.


1.11. Aujourd’hui : écosystèmes polyglottes

Les entreprises combinent plusieurs types de bases selon les besoins :

Il n’y a plus une vérité : il y a une adéquation.


Synthèse — Points à retenir pour le cours

  1. La donnée est d’abord un outil administratif avant d’être numérique.
  2. Les structures tabulaires existent bien avant l’informatique.
  3. Les premiers systèmes informatiques étaient hiérarchiques ou réseau.
  4. Le relationnel (Codd) reste la pierre angulaire de la discipline.
  5. SQL est un standard industriel depuis les années 80.
  6. Les modèles NoSQL répondent à des besoins de scalabilité et de flexibilité.
  7. Les systèmes modernes sont hybrides et spécialisés selon l’usage.

2. Données tabulées

2.1 Qu’est-ce qu’une donnée tabulée ?

Les données tabulées sont des informations organisées sous forme de tableau. Cette structure bidimensionnelle (lignes × colonnes) rend l’information lisible, comparable et exploitable.

Caractéristiques principales

Données tabulées

Table


2.2. Exemples concrets dans la vie quotidienne

Les tableaux répondent à des principes universels de rangement, déjà présents dans le monde matériel. Ils apparaissent dans des contextes familiers, souvent sans qu’on les nomme “tableaux”.

2.2.1. Étagères

Alors quand on voit tout, et qu’on a de la place: OrgaNourriture Tout va bien.

Mais si on ne voit pas dedans, et qu’on a beaucoup: OrgaArchive Ca devient vite insurmontable.

Et ca pourrait etre pire: OrgaPas

Mais avec un peu de bon sens et des etiquettes: OrgaCraft

L’organisation reflete la realite qu’elle occupe: OrgaPharmacy

Ou le debut de la maladie mentale: OrgaPharmacy

2.2.2. Tiroir à couverts

Tiroir à couverts

2.2.3. Gestion du quotidien

Liste de tâches (Todo list)

Ici, 2 colonnes:

  1. Checkbox: la tache est effectuee (oui/non)
  2. Intitule: la tache en question (texte)

Maintenant, si on duplique le format d’un jour:

TODO

Combien de colonnes ?

Calendrier mensuel

Question: combien de semaine dans un mois ?

Calendar

Description

Calendar

Vous avez (et vous serez encore) confronte a des questions comme celle la. Apres ce cours, vous y repondrez differement.

2.2.4. Données historiques : liste des rois mérovingiens

Rois partiel Description Rois complet


2.3. Pourquoi utiliser des tableaux ?

2.3.1. Comparaison facilitée

2.3.2. Recherche rapide

2.3.3. Vue d’ensemble

2.3.4. Organisation logique

2.3.5. Exemples

Planning de cours

Planning cours

Table de multiplication

Principe commun : Organisation cohérente, répétitive et optimisée pour la recherche.


2.5. Structure formelle des données tabulées

2.5.1. Terminologie

Terme Description Synonymes Exemple
Enregistrement Ligne représentant une entité complète Tuple, row Un étudiant
Attribut Colonne représentant une caractéristique Champ, field La colonne “Âge”
Valeur Donnée dans une cellule Cellule 18
Clé Attribut identifiant de manière unique ID Numéro étudiant

2.5.2. Exemple : tableau des étudiants

ID_Etudiant Nom Prénom Âge Classe
001 Dupont Jean 18 Terminale A
002 Martin Marie 17 Première B
003 Bernard Luc 18 Terminale A

Analyse :


2.6. Principes fondamentaux des données tabulées

2.6.1. Organisation bidimensionnelle

2.6.2. Cohérence des types

2.6.3. Atomicité

2.6.4. Accès par coordonnées

2.6.5. Analyse verticale et horizontale

2.6.6. Intégrité


2.7. Limites des tableaux simples

Ces limites expliquent la naissance des bases de données relationnelles :

  1. Redondance (informations répétées)
  2. Difficultés de mise à jour (modification à plusieurs endroits)
  3. Absence de relations (liens difficiles à gérer)
  4. Volume (les tableurs ne passent pas à grande échelle)

Ce cours est distribué sous licence Creative Commons. Toute reproduction ou distribution à but commercial est interdite sans l’accord préalable de l’auteur.