Aufbau des Systems



next up previous contents index
Next: Benutzerschnittstellen Up: Archieder Archiv-Server Previous: Die Anfänge

Aufbau des Systems

          Entsprechend der zwei Dienste, die Archie realisiert, verwaltet Archie im wesentlichen zwei unterschiedliche Datenbestände, die Filenames-Database und die Whatis-Database [ED92]. Filenames- und Whatis-Database Die Filenames-Database enthält die Daten, die gebraucht werden, um die Suche in den Verzeichnissen der Anonymous-FTP-Server zu realisieren. Sie ist von ihrer Struktur her komplexer als die Whatis-Database, die nur aus Stichwörtern und Kurzbeschreibungen besteht. Die Information für die Whatis-Database wird nicht automatisch generiert und eingetragen, sie stammt aus sekundären Quellen wie z.B. Usenet-Artikeln oder Autorenangaben.

Interessanter sind die Mechanismen, die Archie benutzt, um die Inhaltsverzeichnisse der Anonymous-FTP-Server zu verwalten und zugänglich zu machen. In Abbildung gif werden die wichtigsten Systemkomponenten von Archie dargestellt.

  
Figure: Die Archie Systemkomponenten

Die wesentlichen drei Hauptkomponenten des Archie Systems werden im folgenden kurz erklärt.

Data Gathering Component (DGC)

      Die Data Gathering Component ist für die Datenbeschaffung zuständig. Datenbeschaffung Sie arbeitet mit dem Cron-Mechanismusgif von Unix und wird alle 24 Stunden automatisch gestartet. Die DGC holt sich über FTP die rekursiven Listings von Anonymous-FTP-Servern. Die Adressen der Server und weitere erforderliche Informationen, z.B. welches Betriebssystem auf dem Server eingesetzt wird, werden in der Site Description Database verwaltet. Es wird immer nur ein Teil der Site Description Database abgearbeitet, so daß das Inhaltsverzeichnis eines Servers im Prinzip etwa jeden Monat einmal abgeholt wird. Im Umfang der Site Description Database, aber auch in der Strategie, in welchem Zeitabstand die rekursiven Listings eines Servers geholt werden, können sich die einzelnen Archie-Server jedoch unterscheiden.

Die rekursiven Listings bilden zusammen die raw listing files, welche nun von der Database Maintenance Component (DMC) ausgewertet werden.

Database Maintenance Component (DMC)

      Die Database Maintenance Component ist verantwortlich für die Konsistenzprüfung und Konvertierung der Raw Listing Files in ein passendes Datenformat für die Filenames Database. Prüfen, Konvertieren, Eintragen Hier müssen Fehler erkannt und beseitigt werden, die z.B. bei der Generierung der Inhaltsverzeichnisse oder bei der Übertragung auftreten können. Dazu werden die rekursiven Listings an den Site Listings Filter übergeben und so von eventuell aufgetretenen Fehlermeldungen bereinigt. Anschließend bearbeitet sie ein Parserprogramm, das Verify and Enter Program (VAEP). Das VAEP rekonstruiert die Verzeichnishierarchie, um so die Datenkonsistenz zu prüfen; d.h. es wird überprüft, ob keine wichtigen Informationen bei Korrekturen usw. verlorengegangen sind. Abschließend werden die aufbereiteten Daten vom VAEP in die Filenames Database eingetragen.

User Access Component (UAC)

  Die User Access Component bildet die Benutzerschnittstelle für Anfragen an die Filenames Database. Hier stehen an Schnittstellen nach außen Telnet und E-Mail zur Verfügung. Über die Prospero-Schnittstelle kann im Client/Server-Betrieb auf Archie zugegriffen werden.



next up previous contents index
Next: Benutzerschnittstellen Up: Archieder Archiv-Server Previous: Die Anfänge



Aus: Internet: Werkzeuge und Dienste
Copyright Springer-Verlag Berlin Heidelberg 1994