Volkszählung per e-census: Ein Blick hinter die Kulissen
Artikel erschienen in Swiss IT Magazine 2000/43
Singapur und die Vereinigten Staaten haben es bereits vor Jahresfrist vorgemacht: Das Zählen von Bevölkerungsdaten übers Internet funktioniert. Seit Montag dieser Woche ist es nun auch in der Schweiz soweit. Mit einer Parforce-Leistung hat es das Bundesamt für Statistik (BFS) mit dem Projekt e-census ermöglicht, dass die Fragebogen der Volkszählung 2000 von rund 90 Prozent der Bevölkerung auch im Internet ausgefüllt werden können.
Die Idee zu dieser Europa-Premiere entstand aus dem Auftrag zur Modernisierung der Volkszählung, den das Bundesamt für Statistik nach der letzten Zählung von 1990 von der parlamentarischen Geschäftsprüfungskommission erhalten hat. Damals gab es einige Proteste von Gemeinden, die mit der Durchführung der Zählung - Rekrutierung und Ausbildung der Zähler, Kontrolle der Fragebogen - einen riesigen Zusatzaufwand zu bewältigen hatten.
Unter zahlreichen anderen Ideen zur Modernisierung entstand so auch die Vision der Volkszählung per Internet, die damals allerdings aus technischen, organisatorischen und vor allem auch politischen Gründen noch nicht durchführbar erschien: In der Schweiz gibt es rund 3000 Gemeinden, die im Unterhalt ihrer Einwohnerregister weitgehend autonom sind. Während die einen noch mit Karteikasten arbeiten, verfügen andere über modernste Informatiksysteme. Ein weiteres Problem war die Kontrolle: Man musste einerseits sicherstellen, dass jeder Einwohner ein Formular ausfüllt, dass gleichzeitig aber auch keiner mehr als einen Fragebogen einreicht.
Um in diesem Umfeld eine modernisierte Volkszählung zu ermöglichen, müsste man zunächst zentral über alle Daten verfügen, diese auf den Formularen vordrucken und die von der Bevölkerung ausgefüllten Fragebogen den Gemeinden zur Kontrolle zustellen. Von da müssten die Fragebogen korrigiert an die Zentrale zurück. Dieser Weg beinhaltet aber massive organisatorische Probleme.
Eine andere Möglichkeit - der Vordruck der Formulare durch die Gemeinden - stiess auf technische Probleme, weil kaum eine Gemeinde über die nötige Infrastruktur (A3-Drucker etc.) verfügt und die Register darüber hinaus nicht harmonisiert sind.
Die nun gewählte Lösung besteht aus einem Mittelweg zwischen diesen beiden Möglichkeiten: Das Bundesamt für Statistik hat nach einer Bedürfnisabklärung bei den Gemeinden ein externes Dienstleistungszentrum (DLZ) geschaffen, durch das die Kommunen einen grossen Teil der Arbeiten gegen Bezahlung erledigen lassen können. Betrieben wird das DLZ von der DCL Data Care AG in Kriens, einer Tochtergesellschaft der schweizerischen Post und des Mediengiganten Bertelsmann.
Erst aufgrund dieser Infrastruktur mit zentraler Datenhaltung kam man auf die Idee mit der Volksbefragung per Internet zurück. Gegner des Projekts - etwa aus Bedenken um die Sicherheit - gab es dabei keine, wie Urs Germann, Projektverantwortlicher des BFS, festhält: "Für uns war e-census eine Herausforderung. Wir wollten einfach wissen, ob wir das schaffen. Gleichzeitig gab es keinen Zwang: Die Internet-Befragung war immer bloss eine mögliche Alternative zum klassischen Papierformular. Wir haben deshalb zuerst intern Prototypen entwickelt und Abklärungen betreffend der Sicherheit getroffen. Erst als wir sicher waren, dass es funktioniert, gingen wir damit an die Öffentlichkeit. Wir haben so bewusst eine öffentliche Diskussion vermieden, denn wir wollten eine zu grosse Erwartungshaltung vermeiden. Auch intern war Skepsis bloss hinsichtlich der Machbarkeit vorhanden."
Ein wirkliches Problem war dagegen der Zeitrahmen, wie Andreas Binggeli, Projektleiter Informatik, erklärt. Erst vor rund anderthalb Jahren hat man im BSF erste konkrete Überlegungen zum Konzept gemacht und Prototypen zu entwickeln begonnen. In bloss rund 12 Monaten wurde die Lösung schliesslich entwickelt.
Leidet unter dieser schnellen Entwicklungszeit nicht die Sicherheit des Systems? "Nein", ist Andreas Binggeli überzeugt, "wir haben genügend Zeit gehabt, um die Lösung sowohl in technischer als auch in ergonomischer Hinsicht ausführlich zu testen." Sämtliche Verbindungen werden über eine SSL-Leitung geführt, die Kommunikation erfolgt ausschliesslich über eine von Verisign zertifizierte 128-Bit-Verschlüsselung.
Das System merkt sich auch selbständig, auf welcher Seite des Formulars sich ein User gerade befindet, und speichert bei jedem Seitenwechsel die bereits eingegebenen Daten. Damit hat der Surfer jederzeit die Möglichkeit, die Sitzung zu unterbrechen, ohne dass er das Ausfüllen noch einmal von vorne beginnen müsste. Auch ein unfreiwilliger Verbindungsabbruch - wenn etwa das Modem die Connection zum Provider verliert - führt so nicht zu grösseren Datenverlusten.
Zwischengespeichert werden die Daten nach dem Abschluss oder einem Unterbruch auf einem Rechner, der durch Firewalls geschützt wird. Nach der Bereinigung werden die Daten auf den (nicht ans Internet angeschlossenen) Zentralrechner des DLZ transferiert; gleichzeitig werden auch der Benutzername und das Passwort gesperrt.
Die Daten, die der Surfer in sein Webformular einträgt, sind damit zu jedem Zeitpunkt sicher. Probleme könnte es dagegen geben, wenn ein Server oder der ganze Cluster ausfällt, sei es wegen Hard- oder Softwareproblemen oder wegen gezielter Attacken von aussen. Aber auch gegen solche Ereignisse ist das BFS so gut als möglich gerüstet. Das Entwickler-Team wurde von Andreas Binggeli kurzerhand zum Support-Team umfunktioniert, das zusammen mit weiteren Technikern während der beiden Volkszählungs-Wochen für Notfälle bereitsteht. Gegen potenzielle Eindringlinge auf den Servern hat man sich mit mehrstufigen Firewalls geschützt, so dass es unwahrscheinlich erscheint, dass diese während der zwei Wochen geknackt werden.
Negative Überraschungen versucht das BFS auf diese Weise weitgehend zu verhindern. Ein hundertprozentiger Schutz ist allerdings wie immer in der Informatik auch hier nicht möglich. Offen bleibt etwa, was im Fall einer DDoS-Attacke (Distributed Denial of Service) passiert, oder - wahrscheinlicher - bei einem nicht erwarteten Ansturm von Surfern, die ihre Formulare online ausfüllen wollen. Obwohl die Server auf rund 30'000 gleichzeitige Zugriffe ausgelegt sind und mit Stress-Tools getestet wurden, mangelt es diesen Tests doch zwangsläufig an Realismus: Die Zugriffe kommen stets vom selben Ort über die selbe Leitung, und auch die Bandbreite, die während der Volkszählung zur Verfügung stehen wird, war für die Tests noch nicht erhältlich. Die Zuverlässigkeit und Stabilität des Servers wird sich deshalb erst im laufenden Betrieb zeigen, wenn mehrere zehntausend Surfer aus den unterschiedlichsten Richtungen auf die Server zugreifen.
Das BFS steht damit vor einer vergleichsweise einzigartigen Ausgangslage, wie Urs Germann erklärt: "Wir haben für unser Produkt keine Einführungszeit, was für uns nicht unbedingt angenehm ist. Wir haben den Stichtag am 5. Dezember, und an diesem Tag sowie in den Wochen davor und danach muss das System laufen. Und kaum ist diese Einführung des Produkts beendet, ist auch die Durchführung der Volkszählung abgeschlossen. Während des laufenden Betriebs kann man vielleicht noch minimalste Kleinigkeiten verbessern, aber grundsätzlich muss das Produkt von Anfang an perfekt laufen."
Sollte der Super-GAU - der Ausfall aller Server - tatsächlich eintreffen, ist das allerdings auch nicht wirklich katastrophal. Im schlimmsten Fall müssten Anwender, die ihr Formular im Web ausfüllen wollten, auf den Offline-Fragebogen umsteigen - von der Auskunftspflicht sind sie jedenfalls auch bei einem Serverausfall nicht enthoben.
Die gesamte e-census-Lösung ist eine Eigenentwicklung des Bundesamtes für Statistik. Das Web-Frontend basiert auf HTML/DHTML und JavaScript und ist unter Windows auf Browsern der neueren Generationen lauffähig, insbesondere auf dem Internet Explorer ab Version 4.0 und Navigator ab Version 4.61. Die Middleware besteht aus COM/DCOM-Komponenten, die mit Visual C++ und Visual Basic entwickelt wurden. Im Backend befindet sich SQL Server 2000, wobei die Entwicklung noch unter SQL Server 7 vorgenommen und die Lösung nachher portiert wurde.
Hardwareseitig kommt ein Cluster aus insgesamt neun Netfinity-6000R-Servern von IBM zum Einsatz, die mit je vier Pentium III/700 Xeon-Prozessoren sowie 1 GB RAM bestückt sind. Darauf läuft Windows 2000 Advanced Server mit dem Internet Information Server 5.0. Die Connection zum Internet schliesslich erfolgt über eine Doppelanbindung mit zwei 34-Mbps-Mietleitungen an den IP-Plus Backbone der Swisscom.
Der Entscheid für die - als nicht besonders sicher geltende - Microsoft-Plattform wurde dem BFS leicht gemacht: Der Bund hat in seiner strategischen Informatik-Planung festgelegt, dass man bei Internet-Projekten auf Microsoft-Produkte als Architektur-Plattform setzt. Eine Evaluation von anderen Plattformen stand damit zu keinem Zeitpunkt zur Debatte, sagt Andreas Binggeli. Andererseits sei das auch nicht so wichtig, letztlich zähle allein die Lösung.
Insgesamt ist das System so dimensioniert, dass rund 20 Prozent der befragten Personen (1,5 Mio. Personen in 0,7 Mio. Haushalten) die Fragebogen übers Internet ausfüllen können. Während Spitzenzeiten zu Beginn und am Ende der Zählungsperiode wird ein Ansturm von bis zu 30'000 gleichzeitigen Usern erwartet, die das System allerdings problemlos verkraften sollte - nach Herstellerangaben sollte jeder einzelne Server bis zu 23'000 gleichzeitige Anwender bewältigen können.
Damit erscheint das System bloss auf den ersten Blick überdimensioniert, erläutert Urs Germann: "Nach ersten, konservativen Schätzungen ist das BFS von rund 5 Prozent der Bevölkerung ausgegangen, die die Volkszählung per Internet ausfüllen möchten. Weil das Projekt aber einen Pioniercharakter hat, müssen wir auch die Neugierigen mitrechnen, die das System bloss mal begutachten wollen und die Fragebogen gar nicht ausfüllen oder diese Arbeit nicht abschliessen. Diese Neugierigen benötigen dieselben Ressourcen wie jeder, der die Formulare ausfüllt. Entsprechend haben wir das System dann so aufgebaut, dass es genügend Kapazität für 20 Prozent der Bevölkerung bietet. Wir sind optimistisch, dass unsere Server den Anforderungen genügen werden."
Von der Volkszählung im Internet versprechen sich nicht nur passionierte Web-Surfer Vorteile - auch für den Bund ergeben sich so neue Möglichkeiten, wie Urs Germann erklärt: "Wir vom Bundesamt für Statistik profitieren davon, dass wir die Daten bereits weitgehend plausibilisiert, vollständig und digitalisiert erhalten. Wir können den Benutzer führen und kontrollieren, ob er - falls nötig - eine Antwort gibt und ob diese Antwort zutreffend sein kann. Ist sie das nicht, können wir ihn sofort darauf hinweisen. Durch die bereits erfolgte Digitalisierung schliesslich entfällt ein kompletter, mitunter fehlerträchtiger Arbeitsschritt: Wir haben die Daten schneller und in einer höheren Qualität, wodurch auch die Auswertung beschleunigt wird."
Auch der Anwender kommt mit e-census nicht zu kurz: Das Ausfüllen der Formulare soll für ihn vor allem einfacher sein und mehr Spass machen. Der Einfachheit zuträglich ist dabei insbesondere das Filtersystem, das dafür sorgt, dass Fragen, die nicht zutreffen können, gar nicht erst erscheinen: So würde es etwa wenig Sinn machen, bei einem Elfjährigen nach dem Schulabschluss und der Berufstätigkeit zu fragen. Gleichzeitig gehen die Verantwortlichen davon aus, dass das Ausfüllen der Fragebogen per Internet einfach mehr Spass macht: Im Unterschied zu einem "trockenen" Papierformular gelte ein Webformular eher als Herausforderung.
Das bekannte Phänomen, dass Webformulare von vielen Surfern aus Datenschutzgründen grundsätzlich falsch ausgefüllt werden, ist für Andreas Binggeli kein Problem: "Soweit möglich und sinnvoll, versuchen wir das mit Plausibilitätsprüfungen zu verhindern. Technisch lässt es sich aber nicht vermeiden, dass jemand das Formular mit Nonsens füllt. Andererseits besteht dieses Problem ja auch mit den Papierfragebogen, wie die früheren Zählungen gezeigt haben." Papierfragebogen wie Webformulare werden nach Abschluss der Zählung denselben Plausibilitätsprüfungen unterzogen - offensichtlich falsche Antworten werden dabei herausgefiltert und vom Bundesamt nach telefonischer Nachfrage ergänzt. Ein Rückkanal per E-Mail ist dabei nicht vorgesehen.
Einer der Vorteile, von dem der Bund profitieren kann, liegt bei den Kosten für e-census. Hier unterscheiden die Verantwortlichen zwischen den reinen Entwicklungskosten und den Gesamtkosten des Projekts, die auch die Kosten beispielsweise für die Datenaufbereitung und die Integration der e-census-Lösung ins Gesamtkonzept der Volkszählung beinhalten. Diese Gesamtkosten belaufen sich laut Urs Germann auf rund vier Millionen Franken, wovon die Entwicklung der Lösung rund anderthalb Millionen Franken verschlang - angesichts von Gesamtkosten für die Volkszählung von 108 Millionen Franken ein bescheidener Betrag.
Auf der Basis dieser Zahlen geht das BFS davon aus, dass das Projekt bereits kostendeckend sein wird, wenn bloss rund drei Prozent der Bevölkerung das Internet für die Volkszählung nutzt. Urs Germann ist überzeugt, dass, würde die ganze Schweiz die Fragebogen per Internet ausfüllen, die Volkszählung auf weniger als die Hälfte der heutigen Kosten zu stehen käme.
In der heutigen Situation spielen die Kosten und die Ersparnisse allerdings keine wesentliche Rolle. Das Pionierprojekt gilt vielmehr als Investition ins Know-how und in die Zukunft - eine Zukunft, in der Volkszählungen weiterhin doppelspurig auf dem Web und in Papierform durchgeführt werden. "Man kann nicht davon ausgehen, dass bis in zehn oder zwanzig Jahren die gesamte Bevölkerung über Computer und Internetanschluss verfügt, und man darf bei einer Volkszählung auch keine technologischen Hürden aufstellen. Auch in Zukunft wird der Schweizer deshalb die Wahl haben, in welcher Form er die Formulare ausfüllen und einreichen will", erklärt Urs Germann.
Die Bedeutung dieses Pilotprojekts geht dennoch weit über die Volkszählung hinaus. Aufgrund der damit gemachten Erfahrungen werden künftige statistische Erhebungen aller Art übers Internet eingeholt werden können. Auch in verschiedene Projekte unter dem Stichwort E-Government werden die Erfahrungen mit der Volkszählung einfliessen: Dazu gehören etwa Anfragen an Ämter oder die Verbreitung von Informationen im öffentlichen Interesse, in mittlerer Zukunft eventuell auch das Einreichen von Steuererklärungen oder gar die Ausübung von Wahl- und Stimmrecht.