Ce n’est pas courant, mais parfois les grandes découvertes technologiques ne se produisent pas dans les laboratoires de R&D, mais dans des entrepôts oubliés et poussiéreux. Et c'est dans l'un d'eux, plus précisément celui de l'Université de l'Utah, pendant que le personnel le nettoyait, qu'une bobine de bande magnétique à 9 pistes est apparue avec une étiquette manuscrite :
« UNIX Original de Bell Labs V4 (voir le manuel pour le format) ».
La découverte, rendue publique par le professeur Robert Ricci, du École d'informatique Kahlerta fait sensation dans la communauté informatique… car il pourrait s'agir de la seule copie complète connue d'UNIX Quatrième Édition (V4), une version de 1973 développée dans les légendaires Laboratoires Bell qui a marqué un avant et un après dans l'histoire du logiciel.
Qu'est-ce qu'UNIX V4 et pourquoi est-il si important ?
UNIX V4, sorti en novembre 1973, est considéré comme l'une des grandes étapes de l'histoire de l'informatique. Il s'agissait de la première version d'UNIX écrite en langage C, ce qui en a fait un tournant permettant la portabilité des systèmes d'exploitation (une idée révolutionnaire pour l'époque).
Jusqu'à cette découverte, seuls des fragments de ce système d'exploitation étaient conservés : quelques manuels de programmation, quelques pages de documentation et le code source incomplet d'un noyau expérimental appelé nsys. On pensait que la version complète du système d’exploitation était perdue à jamais.
UNIX V4 a été conçu pour le PDP-11/45un mini-ordinateur DEC qui, dans les années 1970, symbolisait la pointe de la recherche sur les systèmes d'exploitation. À partir de ces lignes de code C écrites aux Bell Labs, de nombreuses branches de l’arborescence des systèmes modernes surgiront plus tard : BSD, System V, Solaris et macOS ou Linux, leurs descendants les plus célèbres.
En recourant à des métaphores généalogiques, UNIX V4 serait l'arrière-arrière-grand-père des deux systèmes.
D'un entrepôt à un musée
L’histoire de la découverte a des connotations d’aventure académique. Selon Ricci, la bobine a été trouvée alors que le personnel passait au crible les matériaux accumulés au fil des décennies. L'écriture manuscrite sur l'étiquette a été identifiée comme étant celle de feu Jay Lepreau, chercheur en systèmes distribués et figure clé du département de l'Utah dans les années 1980.
Plus tard, un autre chercheur a retracé sa provenance et a découvert que la bande avait été initialement envoyée à Martin Newell, un chercheur en infographie célèbre pour avoir créé la mythique « théière de l'Utah », un modèle 3D devenu une icône dans l'histoire du rendu.
Autrement dit, le même laboratoire qui a donné naissance à la théière la plus célèbre du monde numérique pourrait désormais nous restituer une partie perdue du logiciel qui a façonné Internet.
Une restauration millimétrée
La cassette sera remise en main propre à Musée de l'histoire de l'informatique (CHM) à Mountain View, en Californie, à plus de 1 200 kilomètres de l'Utah, où Al Kossow, archiviste du projet Économiseurs de bitsdirigera le processus de récupération.
Kossow a expliqué que la tâche nécessitera une combinaison de technologies analogiques et numériques :
« Nous utiliserons un convertisseur analogique-numérique à grande vitesse qui sauvegarde environ 100 Go de données en mémoire. Ensuite, le programme lire la bande de Len Shustek analysera les signaux magnétiques pour reconstruire les bits. »
La bande, un 3M de 1 200 pieds, a de bonnes chances d'être dans un état lisible, même s'il n'est pas exclu de devoir appliquer des techniques de « cuisson » pour stabiliser l'oxyde magnétique. Il s’agit littéralement d’un cas d’archéologie des données, où chaque élément qu’elles parviennent à récupérer peut contribuer à changer ce que nous savons sur la façon dont les fondations des logiciels modernes ont été construites.
Ce que cette cassette pourrait révéler
Si les données peuvent être récupérées, les chercheurs espèrent pouvoir reconstruire complètement le code source d'UNIX V4, ses outils d'origine, et peut-être le recompiler dans un environnement émulé. Ce serait une étape comparable au sauvetage des premières versions d'UNIX V1 et V2, restaurées il y a des années.
De plus, cela permettrait d’étudier la transition exacte entre les UNIX écrits en assembleur et ceux qui ont adopté le langage C – une évolution qui a ouvert la voie à la portabilité logicielle, concept qui a inspiré la naissance de Linux en 1991.