Interessanter sind die Mechanismen, die Archie benutzt,
um die Inhaltsverzeichnisse
der Anonymous-FTP-Server zu verwalten und zugänglich zu machen. In
Abbildung werden die wichtigsten
Systemkomponenten von Archie dargestellt.
Figure: Die Archie Systemkomponenten
Die wesentlichen drei Hauptkomponenten des Archie Systems werden im folgenden kurz erklärt.
Die Data Gathering Component ist für die Datenbeschaffung zuständig.
Datenbeschaffung Sie arbeitet mit
dem Cron-Mechanismus von Unix und
wird alle 24 Stunden automatisch gestartet. Die DGC holt sich über
FTP die rekursiven Listings von Anonymous-FTP-Servern. Die Adressen
der Server und weitere erforderliche Informationen, z.B. welches
Betriebssystem auf dem Server eingesetzt wird, werden in der
Site Description Database verwaltet. Es wird immer nur
ein Teil der Site Description Database abgearbeitet, so daß das
Inhaltsverzeichnis eines Servers im Prinzip etwa
jeden Monat einmal abgeholt wird. Im Umfang der Site Description Database,
aber auch in der Strategie, in welchem Zeitabstand die
rekursiven Listings eines Servers geholt werden, können sich die
einzelnen Archie-Server jedoch unterscheiden.
Die rekursiven Listings bilden zusammen die raw listing files, welche nun von der Database Maintenance Component (DMC) ausgewertet werden.
Die Database Maintenance Component ist verantwortlich für die Konsistenzprüfung und Konvertierung der Raw Listing Files in ein passendes Datenformat für die Filenames Database. Prüfen, Konvertieren, Eintragen Hier müssen Fehler erkannt und beseitigt werden, die z.B. bei der Generierung der Inhaltsverzeichnisse oder bei der Übertragung auftreten können. Dazu werden die rekursiven Listings an den Site Listings Filter übergeben und so von eventuell aufgetretenen Fehlermeldungen bereinigt. Anschließend bearbeitet sie ein Parserprogramm, das Verify and Enter Program (VAEP). Das VAEP rekonstruiert die Verzeichnishierarchie, um so die Datenkonsistenz zu prüfen; d.h. es wird überprüft, ob keine wichtigen Informationen bei Korrekturen usw. verlorengegangen sind. Abschließend werden die aufbereiteten Daten vom VAEP in die Filenames Database eingetragen.
Die User Access Component bildet die Benutzerschnittstelle für Anfragen an die Filenames Database. Hier stehen an Schnittstellen nach außen Telnet und E-Mail zur Verfügung. Über die Prospero-Schnittstelle kann im Client/Server-Betrieb auf Archie zugegriffen werden.