
WAP (Wireless Application Application)
Wasserzeichen, digitale
Web-Mining
Web-Roboter
Web-Services
Wireless Internet Security
Wireless Application Environment (WAE)WAE stellt eine allgemeine Anwendungsumgebung bereit und integriert sowohl WWW-Datendienste als auch Mobiltelefonsprachdienste. Primäres Ziel ist die effiziente Unterstützung von Netzbetreibern und Dienstanbietern unter Berücksichtigung der heterogenen Vielfalt möglicher Endgeräte. Ermöglicht wird dies durch eine Mikrobrowser-Umgebung:
Wireless Session Protocol (WSP)Je nach Anwendung bietet WSP einen verbindungsorientierten Netzzugriff unter Verwendung von WTP und einen Datagrammdienst mit Hilfe von WDP. Wesentliche Charakteristika:
Wireless Transaction Protocol (WTP)WTP stellt einen leichtgewichtigen Transaktionsdienst zur Verfügung, der an ressourcenarme Mobilstationen (thin" clients) angepasst ist und auf WDP aufsetzt. Zu den Diensten zählen u.a.
Wireless Transport Layer Security (WTLS)WTLS dient der Sicherung von schutzwürdigen Daten über unsichere Netzinfrastrukturen, zur Authentifizierung von Teilnehmern, z.B. beim Austausch von Visitenkarten, und zur Verhinderung von Denial-of-Service"-Angriffen durch Detektion und Abweisung von Nachrichten, die sich als nicht ausreichend verifizierbar erweisen. WTLS verwendet zur Erfüllung seiner Aufgaben Funktionen und Protokollelemente des Internetstandards TLS [5], wie z.B. kryptographische Verschlüsselungsalgorithmen auf Basis von öffentlichen Schlüsseln. In Abhängigkeit von den Sicherheitsvorgaben können Anwendungen selektiv Sicherungsdienste hinzunehmen oder deaktivieren. Beispielsweise unterstützt WAE die Authentifizierung zwischen WAP-Client und -Server mittels Benutzername-/Passwort-Abfrage, die unter WSP und HTTP 1.1 bereitgestellt wird. Wireless Datagram Protocol (WDP)WDP stellt den höheren WAP-Protokollen einen Datagrammdienst zur Verfügung und dient gleichzeitig als Schnittstelle zu den darunter liegenden Trägerdiensten (Bearer Services), die nicht mehr durch WAP-Spezifikationen definiert sind. WDP gewährleistet durch Konvergenzfunktionen die Anpassung der Transportschicht an die bereitgestellten Trägerdienste und somit die funktionelle Unabhängigkeit der höheren WAP-Schichten von dem eigentlichen Mobilfunknetz. Nach Möglichkeit sollen vorhandene Protokolle direkt übernommen werden, wie z.B. UDP (User Datagram Protocol), wenn WDP auf IP (Internet Protocol) aufsetzt. TrägerdiensteDie WAP-Architektur ist so konzipiert, dass WAP-Anwendungen über verschiedenste Mobilfunknetze mit unterschiedlichster Dienstgüte (QoS: Quality of Service) wie Durchsatz, Fehlerrate, Verzögerungsoder Echtzeitverhalten kooperieren können. Die WAP-Protokolle sind in der Lage, die unterschiedlichen QoS-Eigenschaften der Netze zu kompensieren oder angemessen zu tolerieren. Zu den wichtigsten Trägerdiensten gehören:
FazitVieles spricht dafür, dass sich WAP-Applikationen in vielen Bereichen des öffentlichen und privaten Lebens in relativ kurzer Zeit etablieren können. Beispiele dafür sind der Zugriff auf behördliche Informationssysteme (Einwohnermeldeamt, Katasteramt, Arbeitsamt, Finanzamt usw.), Cityinformationssysteme, Positionierungs- oder Routenplanungssysteme, Kfz-Telematikdienste, elektronisch unterstütztes Einkaufen und Reisen, intelligente Haushaltskomponenten oder medizinische Überwachungsassistenten. Gerade das letzte Beispiel verdeutlicht aber auch weiteren Forschungsbedarf auf den Problemfeldern Sicherheit, Dienstgüte und garantiertes Echtzeitverhalten. Insbesondere mit Bluetooth [6], dem Defacto-Standard für den Massenmarkt der peripheren Endgeräte und PDAs im frei zugänglichen 2,4-GHzISM-Band (Industry, Science, Medicine), der auch als als möglicher WAP-Bearer gehandelt wird, gewinnen diese Fragestellungen zunehmend an Bedeutung. Weitere aktuelle Informationen und detaillierte WAP-Spezifikationen, die in diesem Beitrag nur kurz angerissen sind, finden sich unter [7] und [8]. |
|
Web MiningKurzinfo Web Mining ist die Übertragung von Data-Mining-Techniken auf Datenmaterial, das im Zusammenhang mit Prozessen im Internet gesammelt wird.
|
ErläuterungSchon vor vielen Jahren ist eine der unangenehmen Auswirkungen des Informationszeitalters in den EDV-Abteilungen und Rechenzentren sichtbar geworden. Euphorisch über die neuen technischen Möglichkeiten der Datenverarbeitung wurden und werden immer mehr und immer detailliertere Informationen gespeichert. Die Folge ist unübersichtliches, inkonsistentes und hochgradig redundantes Datenmaterial, dem schon bei einfachen Fragestellungen kaum eine Antwort zu entlocken ist. Ein Datawarehouse [1] kann in diesem Fall helfen, Ordnung in die Daten zu bringen. In einem Datawarehouse werden alle operativen Datenquellen, die meist heterogen und von sehr unterschiedlicher Qualität sind, zusammengeführt, um sie unternehmensweit und für zukünftige Ansprüche skalierbar zur Verfügung zu stellen. Auch im Falle des Web Minings muss die Datenhaltung, die auch als Data Webhouse bezeichnet werden kann, an die neuen Anforderungen angepasst sein [2]. Auf diesen kumulierten Daten kann anschließend mit Data Mining [3] nach Antworten auf nicht gestellte Fragen gesucht werden. Data Mining bezeichnet den Prozess, der automatisch vorher unbekannte, interessante und interpretierbare Zusammenhänge in großen Datenmengen zu finden vermag. Data Mining ist stets im Kontext von Wissensentdeckung zu sehen (Knowledge Discovery in Databases, KDD), welche den gesamten Prozessablauf bezeichnet, der im Wesentlichen aus Datenaufbereitung, Data Mining und Interpretation der Ergebnisse besteht. Übertragen auf Web Mining wird der Prozess mit Web KDD" [4, 5] bezeichnet. Spuren im DatensandDurch die rasante Entwicklung des Internets, insbesondere im kommerziellen Sektor, fallen zunehmend auch umfangreiche Daten aus der Benutzung von Internetdiensten an. Dazu zählen primär die Protokolldateien der Web-Server, die Informationen über die angeforderten Inhalte und auch über denjenigen speichern, der sie angefordert hat. Auf diese Weise hinterlässt jeder Internet-Anwender seine Spur in Form von Seitenanfragen (Hits) in den entsprechenden Protokolldateien (Hitlog). Eine weitere Datenquelle ergibt sich, wenn sich der Internetbenutzer aus seiner Anonymität heraus bewegt und sich innerhalb eines Internetdienstes als Person zu erkennen gibt (Name, Anschrift usw.). Navigiert er zudem noch in einem zusammenhängendem WebAuftritt (z.B. ein e-Commerce-System), können alle Benutzeraktionen, die von dem System angeboten werden, registriert werden. Im einfachen Fall sind dies lediglich die Interaktionen des Benutzers mit der Maus (click stream) bzw. die Navigationsanfragen; sie können jedoch beliebig detailliert sein (z.B. Informationen über Suchanfragen, Bestellvorgänge, Warenkorbanwendungen, Gewinnspiele usw.). Eine weitere wesentliche Informationsquelle, die in besonderem Maße die Verarbeitung der gesammelten Daten beeinflusst, sind Metainformationen über die zu untersuchenden Seiten. Das ist insbesondere die Topologie (Aufbau und Verbindungen) und das Wissen über die Funktionalität. Jeder Internetseite wohnt eine der Anwendung sehr spezifische Funktionalität inne und die Interaktion des Benutzers wird entscheidend von den möglichen Prozessen beeinflusst. Die in einem Auftritt möglichen Prozessabläufe sind zwar sehr individuell, jedoch liefern sie sehr detaillierte und damit sehr wertvolle Informationen. Daten sind nicht gleich DatenDie Datenaufbereitung spielt beim Web Mining dieselbe wichtige Rolle wie beim Data Mining. Aufgrund technischer Begebenheiten (z.B. Caching) sind die Daten zumeist unsauber. Es finden an dieser Stelle die vom Data Mining bekannten Techniken zur Verbesserung der Datenqualität Anwendung. Extremwerte und Randwertartefakte können gefiltert (Outlier/Noise-Elimination) und fehlende Werte können aufgrund von statistischer Schätzung bzw. empirisch erhobenen Werten ersetzt werden. Da die Datenaufbereitungsschritte stets sehr stark auf die Datenquellen ausgerichtet sind, müssen beim Web Mining die internetspezifischen Umstände berücksichtigt werden, mit denen die Daten gesammelt werden. Das Internet besteht nicht nur aus international heterogenen Datenquellen, sondern auch die Benutzer können jeder Herkunft und fast jeden Alters sein. Die Überlegungen für das Data Mining von Kundendaten einer Filialbank sind auf solche Daten nicht ohne weiteres übertragbar. Die Ziele des Web Minings können in zwei Gruppen aufgeteilt werden: Zum einen geht es darum, die einzelnen Internetseiten auf ihre Inhalte zu untersuchen (Web Content Mining), und zum anderen, das Benutzerverhalten zu erkunden (Web Usage Mining). Häufig wird noch ein zusätzlicher Bereich genannt, der sich explizit mit der Analyse der Struktur im Web befasst (Web Structure Mining). Hier wird dieses Gebiet im Zusammenhang mit Web Content Mining behandelt. Web Content MiningDas Internet bietet zu jedem Thema unzählige Informationen und vielfältige Dateninhalte. Web Content Mining befasst sich mit der Analyse von den im Netz befindlichen Daten. Dazu gehören textuelle und multimediale Informationen jeglichen Formats und auch die Verbindungen (Links) zu den Nachbarseiten. Ein Ziel kann die Einteilung (Segmentierung) der Daten in thematisch zusammenhängende Bereiche sein. Hierfür können Algorithmen der automatischen Klassifikation (Clusteranalyse) herangezogen werden, wobei die Wahl der Metriken die entscheidende Rolle spielt. Die Ähnlichkeitsberechnung zweier Dokumente kann z.B. mit statistischer Gewichtung von Schlagwörtern als auch über einen aufwendig errechneten Feature-Vektor aus einer linguistischen Analyse erfolgen. Hierbei werden zumeist die partitionierenden den hierarchischen Verfahren vorgezogen, da die Distanzberechnungen hierarchischer Verfahren sehr schnell an Komplexitätsgrenzen stoßen [6]. Auch die Untersuchung der Verbindungen der Seiten untereinander kann helfen, die inhaltliche Verwandtschaft von Webseiten abzuleiten. Dem Entwickler der Webseiten darf unterstellt werden, dass sich sein Wissen über semantische Zusammenhänge zweier Seiten in den entsprechenden Verbindungen ausdrückt. Von Wang und Liu [7] werden Ansätze beschrieben, die das Web als gerichteten Graph modellieren, wobei die Dokumente auf die Knoten und die Links auf die Kanten abgebildet werden. Mittels Graphentransformationen und Bewertung wird nach Mustern in der Struktur des Webs gesucht, die auch Aussagen über den Inhalt der vernetzten Dokumente zulassen. Neben der Klassifikation von Webseiten aufgrund des Textinhaltes können auch die Ergebnisse der Klassifikation der Nachbardokumente" herangezogen werden [8]. Als Techniken werden sowohl klassische statistische Verfahren (K-Nächste-Nachbarn, Diskriminanzanalyse) als auch Verfahren des maschinellen Lernens eingesetzt (künstliche neuronale Netze, Entscheidungsbäume) [9]. Web Usage MiningDie Interaktion des Benutzers mit dem Internet ist Zentrum der Fragestellungen des Web Usage Minings. Wie navigiert er durch die Netzstruktur? Welche Inhalte bewegen ihn zu welchem Handeln? Sofern sich der Benutzer nicht freiwillig zu erkennen gibt (z.B. Benutzer-Login in eine Site), spricht man von nichtpersonalisiertem Web Mining, da der Benutzer anonym seine Seitenanfragen im Hitlog hinterlässt bzw. die Aktionen, die er auf den Seiten auslöst, keiner realen Person zugeordnet werden können. Im anderen Fall spricht man von personalisiertem Web Mining, da der Benutzer namentlich bekannt ist und sogar zusätzliche Datenquellen (z.B. demographische Daten) zur Analyse hinzugezogen werden können. In einem ersten Schritt können durch einfache Statistiken schon wichtige Fragestellungen beantwortet werden, z.B. kann die Häufigkeit der Zugriffe auf die Seiten einen Verknüpfungsfehler der Seiten untereinander aufdecken. Das Benutzerverhalten selbst kann jedoch erst durch die Aufdeckung von Mustern innerhalb der Seitenanfragen und Aktionen aufgedeckt werden. Ein Mittel ist die Generierung von Assoziationsregeln, welche das Benutzerverhalten in sog. WENN-DANN-Regeln beschreiben (z.B. WENN Produktseite und dann zusätzliche Informationsseite, DANN zu 25 % Bestellseite). Für eine solche Regel muss die Sequenz der Seitenanfragen des Benutzers bzw. der Zeitraum, in dem sich ein Benutzer auf bestimmten Seiten navigierend bewegt (Sitzung), identifiziert werden. Mittels z.B. dem Apriori-Algorithmus [10] werden dann alle Sequenzen von Seitenanfragen nach wiederkehrenden Teilsequenzen abgesucht. Das Ergebnis ist eine zumeist sehr große Menge von Regeln. Zu diesem Zeitpunkt der Analyse wird ein Bestandteil der Assoziationsanalyse wichtig: die Definition der Interessantheit von Regeln [6]. Insbesondere triviale Zusammenhänge können dadurch frühzeitig ausgefiltert werden. So kann z.B. via Apriori-Wahrscheinlichkeiten eine Bewertung der Navigationswege erfolgen (beispielsweise wird mit nahezu 100 % eine Sequenz von angeforderten Seiten mit einer der Einstiegsseiten beginnen). Die generierten Regeln können wiederum Ausgangspunkt für einer Clusteranalyse sein (Hypergraph Clustering [11]), um die Relevanz und Anwendbarkeit der Regeln zu überprüfen. Beim personalisiertem Web Usage Mining ist das Sammeln von Informationen zu einzelnen Benutzern von Interesse. Je nach Aktionsmöglichkeiten auf den Webseiten werden die Aktionen in ein Benutzerprofil abgelegt. Diese Profile sind dann wieder Gegenstand von Clusteranalysen, um Personen gleichen Interesses (Community) zu identifizieren oder auch von Klassifikationsanalysen, um neue Benutzer den bereits identifizierten Klassen zuordnen zu können. Anwendung der gewonnenen Erkenntnisse sind personalisierte dynamische Webangebote (Newsletter, Portal). Aber auch die Verbindung der beiden Bereiche Web Usage und Web Content Mining kann zur Analyse beitragen, sie sogar teilweise erst ermöglichen. Benutzer, deren Profil ähnliche Eigenschaften aufweisen, interessieren sich für ähnliche Seiteninhalte, d.h., aufgrund des Nutzerprofils kann die semantische Verwandtschaft von Inhalten abgeleitet werden. Meine Daten, deine DatenAuch wenn sich die Benutzer freiwillig auf den Internetseiten bewegen, sind die Aspekte des Datenschutzes wichtiger denn je [12]. In der Anfangsphase des Internets war die Surferidentität noch nicht direkt monetär nutzbar. Nach der Kommerzialisierung des Internets sieht es anders aus: Personenbezogene Daten werden intensiv gesammelt und oft genug gegen den Willen der Benutzer weitergegeben. Eine Sensibilität für den Schutz der Daten ist also auch bei Web Mining wünschenswert. FazitWeb Mining ist ein Anwendungsfeld von Data-Mining-Techniken, das durch das Internet induziert wurde und mit Sicherheit zukünftig noch intensive Aktivitäten verspricht. Unterschieden werden im Wesentlichen die inhaltsgetriebenen (Web Content Mining) und die verhaltensgetriebenen Analysen (Web Usage Mining). Es finden auf die Daten des Internets angepasste Techniken Anwendung, wie z.B. die Assoziationsanalyse und Klassifikation. Web Mining hat mit denselben Herausforderungen zu kämpfen wie Data Mining und bemüht eine spezielle Ausprägung in der Interpretation der Ergebnisse. Auch spielen die Fragen des Datenschutzes bei Web Mining eine besondere Rolle, gerade im Zusammenhang mit der steigenden Anzahl von kommerziellen Anwendungen im Internet. |
|
Autor & Copyright © 2001 Informatik Spektrum, Springer-Verlag Berlin Heidelberg |
ErläuterungDas World Wide Web (WWW) einst ein Sammelsurium aus durch Hyperlinks verknüpften Text-, Ton- und Bilddateien hat sich gerade in letzter Zeit zu einer Palette von Informationsdiensten entwickelt. Ein typischer Informationsdienst im WWW stellt Aktieninformationsdienst dar, der den neuesten Stand von Aktienkursen notiert. Das WWW in seiner heutigen Form ist bereits weitgehend am Benutzer und seinen Bedürfnissen orientiert. Trotzdem zeichnet sich in letzter Zeit vermehrt ein weiterer Trend ab die Automatisierung der Informationsdienste im WWW. Speziell im Bereich der Business-to-Business-(B2B-) und e-Commerce Anwendungen ist diese Art der Informationsverarbeitung bereits schon heute Wirklichkeit. B2B-Anwendungen beruhen auf manuell vereinbarten Schnittstellen und Nachrichtenformaten zwischen den Geschäftspartnern. Erschwerend kommt hinzu, dass die zeit- und kostenaufwendige Integration für jeden Geschäftspartner neu vorgenommen werden muss. Eine Automatisierung dieses Vorgangs wäre folglich sehr wünschenswert. Hier kommen die Web-Services ins Spiel. Eine einheitliche, konsistente und standardisierte Terminologie ist zum jetzigen Zeitpunkt noch nicht verfügbar. Trotzdem herrscht in Standardisierungsgremien wie dem World Wide Web Consortium (W3C) eine allgemeine Übereinstimmung darüber, was ein Web-Service ist [5]. Demnach lassen sich Web-Services wie folgt charakterisieren:
Darüber hinaus können Web-Services entweder von informativer oder von transaktioneller Natur sein. Transaktionelle Web-Services können Bestandteil lang laufender Geschäftstransaktionen sein. Web-Service-ArchitekturWeb-Services sind nicht monolithisch und müssen vielmehr im Zusammenhang mit einer verteilten Service-Architektur betrachtet werden. Aufgrund ihrer Protokolltransparenz können sie entweder auf transport- oder anwendungsorientierten Protokollen fußen. Das bedeutet, dass Funktionsaufrufe, verlässliche Nachrichtenübermittlung im Text- oder Binärformat, Transaktionen, Workflow und Kontext auf höherer Ebene geregelt werden müssen. Sicherheitsaspekte und Zusicherungen zur Dienstgüte sind bereichsübergreifend. Die Abgrenzung und Anordnung der einzelnen Schichten ist Gegenstand einer Diskussion in Standardisierungsgremien. Unabhängiger von der Anordnung der einzelnen Schichten lassen sich folgende Rollen von Web-Services identifizieren:
Konsument, Anbieter und Verzeichnis sind austauschbar. Ein Konsument kann auch als Zwischenhändler fungieren und somit auch Anbieter eines Web-Service sein. In ihrer einfachsten Form interagieren zwei Web-Services wie folgt:
Anfragemechanismus und Anbindung können entweder statisch oder dynamisch erfolgen. Bei einem dynamischen Ansatz können z.B. Dienstgüte, Verfügbarkeit oder weitere Kriterien zur Laufzeit ausgehandelt werden. Ergänzend lässt sich ein Lebenszyklus eines Web-Service feststellen. Bevor ein Web-Service genutzt werden kann, muss er erstellt werden. Danach kann er in einem Verzeichnis registriert werden. Potentielle Nutzer können Web-Services in einem Verzeichnis finden, damit er letztendlich verwendet werden kann. Standardisierung von Web-ServicesJe stärker neue Technologien verbreitet sind, desto mehr Bedeutung gewinnt ihre Interoperabilität. Internet-Standards und die zugrunde liegenden Technologien (z.B. XML) sind deshalb wichtiger denn je. Mit der Berücksichtigung von Standards sind auch klare Wettbewerbsvorteile verbunden. Sie reduzieren nicht nur Entwicklungskosten und Komplexität, sondern ermöglichen den Einstieg von Firmen und Privatpersonen ohne technologische Hürden. Beispielsweise erreichen Anbieter von Web-Services eine größere Verfügbarkeit. Auch haben Nutzer von Web-Services geringere Probleme beim Integrationsprozess. Leider kann die Standardisierung und Automatisierung von Web-Services nur zu einem bestimmten Grad vorangetrieben werden. Das bekannte Dilemma zwischen Dejure- und Defacto-Standards bleibt bislang noch bestehen. Zurzeit ist die Standardisierung im Bereich der Web-Services in vollem Gange. Das World Wide Web Consortium (W3C), OASIS (Organization for the Advancement of Structured Information Standards) und einige weitere unabhängige Gremien widmen sich der Standardisierung in diesem Bereich. Das W3C konzentriert sich hierbei weitgehend auf horizontale Standards, d.h. technische Standards, die auf alle Industriezweige angewendet werden können. OASIS dagegen befasst sich mit sog. vertikalen Standards und verwendet soweit möglich bestehende technische Standards. Gelegentlich kommt es aufgrund mangelnder Abstimmung zwischen den Organisationen zu Widersprüchen und Redundanzen. Folgende Standards bilden das Fundament der Web-Service-Architektur:
Ergänzend zu den bereits genannten Standards wurde ein einheitlicher Standard für die e-Business-Geschäftsabwicklung verabschiedet. Im Detail handelt es sich um die von OASIS und UN/CEFACT entwickelte Electronic Business Extensible Markup Language (ebXML) [2]. Dieser Standard unterstützt den Austausch von Geschäftsnachrichten und regelt Handelsbeziehungen. Er ermöglicht Datenkommunikation unter Verwendung des gleichen Vokabulars. Darüber hinaus definiert und registriert er Geschäftsprozesse. Die ebXML-Spezifikation enthält u.a. eine Referenzarchitektur, Schemata für Geschäftsprozesse und eine Protokollvereinbarung, die den Nachrichtenaustausch zwischen den Geschäftspartnern regelt. FazitWeb-Services und die damit assoziierten Standards befinden sich in einem aufeinander bezogenen Entwicklungsprozess: Sie beinhalten neben rein technologischen Vorteilen völlig neue wirtschaftliche Potentiale. Zum Beispiel lässt sich einerseits die verteilte B2B-Integration automatisieren, andererseits können interne Geschäftsprozesse durch externe Web-Services unterstützt werden. Aufgrund ihrer Neuartigkeit sind Web-Services auch mit Problemen verbunden. Letzte architektonische Lücken müssen geschlossen werden und grundlegende Standards reifen, damit sich vertrauenswürdige Web-Services und ihr Zusammenspiel mit anderen Web-Services voll entfalten können. Zahlreiche Unternehmen befassen sich zur Zeit mit Web-Services und arbeiten bereits an ihrer Verwirklichung. Erste produktive Ansätze in Form von Standards wurden bereits geschaffen. Allerdings müssen Web-Services und ihre Werkzeuge noch stark verbessert werden. Erste zuverlässige Produkte und Services werden nicht vor Ablauf diesen Jahres zu erwarten sein. |
Hinweis: Die URLs entsprechen dem Stand bei der Veröffentlichung des Artikels und werden nicht aktualisiert. |
|
Autor & Copyright © 2001 Informatik Spektrum, Springer-Verlag Berlin Heidelberg |
Abb. 1. Wireless LAN und GPRS Architektur
|
Insbesondere für Unternehmen bedeutet drahtloses Internet aber auch neue Sicherheitsrisiken. So manches WLAN wurde wegen nachträglich erkannter Sicherheitsrisiken schon wieder stillgelegt, und auch bei GPRS sollte man vor der Nutzung ein klares Sicherheitskonzept haben. Im Folgenden werden die Sicherheitsaspekte beider Technologien kurz beleuchtet; der Schwerpunkt liegt dabei auf professioneller Nutzung, z.B. für den Zugriff auf Enterprise-Anwendungen. Wireless LANWLAN Produkte nach dem IEEE-Standard 802.11 b können in zwei Modi betrieben werden: im Infrastruktur-Modus kommuniziert jeder Teilnehmer mit einem sog. Accesspoint (AP), der auf dem Linklevel (ISO-OSI, Schicht 2) eine Brücke zwischen funk- und drahtgebundenem Netz bildet. Im Ad-hoc Modus kommunizieren alle Teilnehmer direkt untereinander (Punkt-zu-Punkt-Verbindungen). Der Nutzen, aber eben auch die Gefahr von Funkübertragungen liegt darin, dass sich Funkwellen nicht an physikalische Grenzen wie z.B. die Wände eines Gebäudes halten: Zunächst einmal kann jeder, der nahe genug ist, Kommunikation mithören oder sich sogar selbst mit dem Netz verbinden. Viele WLAN-Installationen nutzen einen Netzwerknamen (SSID) und MAC-Adressen von WLAN-Karten als Zugriffsschutz. Diese Merkmale bieten jedoch kaum Sicherheit: SSIDs werden im Klartext übertragen und sind somit abhörbar. MAC-Adressen können mit relativ wenig Aufwand manipuliert werden und sind nicht fälschungssicher. Um WLANs abzusichern, definiert IEEE 802.11 ein kryptographisches Verfahren: WEP(Wired Equivalent Privacy"). WEP ist in die WLAN-Komponenten (AP und WLAN-Karten) integriert und soll eine dem verkabelten Netz ähnliche Sicherheit zur Verfügungstellen. WEP basiert darauf, dass alle Komponenten gemeinsame geheime Schlüssel besitzen, mit denen sie sich gegenseitig authentifizieren und die Kommunikation auf OSI-Schicht 2 verschlüsseln. Diese auf den ersten Blick sinnvolle Vorgehensweise birgt jedoch einige Probleme: Security-Management. Der statische Shared-key-Ansatz" von WEP skaliert nicht auf eine große Anzahl von Nutzern: Da alle WLAN-Karten und jeder AP die gleichen (bis zu 4) kryptographischen Schlüssel besitzen, stellt der Besitz einer Karte mit einem passenden Schlüssel einen Freibrief" für den Netzzugang dar. Da keine Verfahren zum Schlüsselmanagement vorgesehen sind, ist der Austausch der Schlüssel aufwändig und erfordert physischen Zugriff auf die Karten. Ein periodischer Schlüsselwechsel oder das Austauschen nach der Kompromittierung des Schlüssels (Verlust oder Diebstahl einer Karte) ist dadurch in der Praxis schon ab ein paar Dutzend Karten schwierig, bei mehreren hundert oder gar tausend Karten so gut wie unmöglich. Kryptographische Schwächen. Zur Verschlüsselung verwendet WEP einen Strom von Pseudozufallszahlen, der mit den zu übertragenen Daten mittels XOR verknüpft wird. Die Zufallszahlen werden durch den Algorithmus RC4 aus einem geheimen Schlüssel k berechnet. Solche Verfahren sind anfällig für sog. Known-plaintext-Attacken": Aus einem Klartext P wird der verschlüsselte Text C = P Å RC4(k) berechnet. Für feste k gilt jedoch C1 Å C 2 = P 1 Å P 2 , d.h., man kann mit einem bekannten Paar (P 1 , C 1 ) auch P 2 = (C 1 Å C 2 ) Å P 1 berechnen und somit sämtliche Kommunikation entschlüsseln ohne k zu kennen. Um diesen Effekt zu verhindern, sieht WEP zusätzlich einen Initialisierungsvektor (IV) vor, der sich bei jedem Datenpaket ändern muss: C = P Å RC4 (IV, k). Damit die Gegenseite das Paket wieder entschlüsseln kann, wird der IV dem übertragenen Datenpaket als Klartext hinzugefügt. Der IV ist aber nur 24 Bit groß; somit ist spätestens nach ein paar Tagen durchschnittlicher Netzlast dieser Zahlenraum erschöpft. Hat man sich in dieser Zeit eine Tabelle aller IVs angelegt, so ist man in der Lage, jedes weitere Paket mit machbarem Aufwand anzugreifen (z.B. mit tabellenbasierten Attacken [1]). Hinzu kommen Implementierungsschwächen; die Produkte mancher Hersteller erzeugen IVs nicht zufällig, sondern zählen nach jeder Initialisierung von Null aufwärts. Weiter wurde bekannt, dass RC4 mit bestimmten IVs den geheimen Schlüssel fast unverändert als Output liefert [2]. Angriffs-Tools, die WEP-Schlüssel durch reines Zuhören" kompromittieren (passive Attacke), sind inzwischen frei verfügbar [3]. Der Rechenaufwand ist dabei so klein, dass ein Angreifer unter Umständen in weniger als 15 Minuten vollen Zugriff auf ein WLAN erhalten kann. Die Sicherheitsfunktionen des IEEE-802.11b-Standards genügen also oft nicht den Anforderungen für professionelle Nutzung. Einige Hersteller bieten inzwischen Produkte mit Schlüsselmanagementfunktionen und dynamischer externer Authentifizierung an (z.B. über Radius [5]); dies bedeutet aber, Interoperabilität zu opfern und sich an einen Hersteller zu binden. In Folgeversionen des IEEE-Standards (802.11x) soll hier nachgebessert werden; wie sicher diese Technologie dann sein wird, kann derzeit nicht seriös beurteilt werden. GPRSGPRS ist aus Anwendersicht das WAN-Pendant zu WLANs; auch hier wird drahtloses Internet zur Verfügung gestellt, die zugrunde liegende Technologie ist allerdings eine andere: GPRS baut auf dem GSM-Standard auf und integriert dort die Vermittlung von IP-Paketen. Wunder an Geschwindigkeit sollte man jedoch nicht erwarten: Derzeit sind Übertragungsraten von 2030 kBit/s realistisch, ebenso Paketlaufzeiten von 12 Sekunden (ping"). Abbildung 1 zeigt links die grobe Architektur von GPRS: Der GGSN (Gateway GPRS Support Node) stellt die Verbindung zum öffentlichen Internet her, der SGSN (Service GPRS Support Node) vermittelt IP über GSM-Protokolle an das Endgerät. GPRS ist also kein Dial-in-Verfahren" ins Internet bzw. Intranet, wie es z.B. bei der Einwahl mit Laptops in Firmennetze etabliert ist. Ein GPRS-Client befindet sich im öffentlichen Internet und greift von dort aus z.B. auf Application-Server zu. Befinden sich diese Server in einem Firmennetz hinter einer Firewall, muss ein tragfähiges Sicherheitskonzept gefunden werden. Betrachten wir zunächst die GPRS-interne Sicherheit, die auf folgenden Komponenten der GSM-Sicherheit aufbaut: Authentifizierung. GSM bietet eine vergleichsweise starke Authentifizierung über Smart Cards (SIMs), die es dem Netzbetreiber beispielsweise erlaubt, die IP-Adresse eines GPRS-Clients auf den Teilnehmer abzubilden. Zu bedenken ist dabei jedoch, dass im ungeschützten öffentlichen Internet Angriffe wie IP-Spoofing oder Connection-Highjacking möglich sind. Vertraulichkeit. Relevant sind hier die Luftschnittstelle (GSM-Netz/Endgerät), die GSM-interne Sicherheit sowie evtl. das öffentliche Internet zwischen GGSN und Firmennetz: Der Algorithmus zur Verschlüsselung der Luftschnittstelle bei GPRS ist nicht veröffentlicht; es dürfte sich jedoch um eine schwache Verschlüsselung mit einem etwa 40 Bit großen Schlüssel handeln, darauf deutet zumindest das Requirements-Dokument [4] hin:
Ein neuer, aber ebenfalls geheimer Algorithmus wurde nach der Lockerung der Krypto-Exportbestimmungen spezifiziert, ist aber noch nicht in Produkten umgesetzt. Selbst diese zukünftige, wohl stärkere Verschlüsselung kann jedoch durch das GSM-Netz abgeschaltet werden; der Nutzer hat also keine Kontrolle über die verwendete Sicherheit. Schutz der übertragenen Information innerhalb des GSM-Netzes ist Sache des Netzbetreibers. Hier können also keine generellen Aussagen getroffen werden. Sobald der Datenverkehr ins öffentliche Internet wechselt, ist er so angreifbar, wie das Internet auf dieser Strecke eben ist. Datenübertragung über GPRS ist also per se kaum abgesichert. Hinzu kommt, dass sich ein über GPRS verbundener Rechner (Laptop, PDA) direkt im Internet befindet und somit leicht angreifbar ist. Zusätzliche Sicherheitslösungen dürften also oft erforderlich sein, sowohl zum Schutz der Kommunikation (z.B. durch ein Ende-zu-Ende-VPN, Virtual Private Network") als auch zum Schutz des Clients vor Angriffen aus dem Internet (z.B. durch eine lokale Firewall). Für Firmen bieten Netzbetreiber zusätzliche Sicherheits-Features (VPNs, Firewalls am GGSN, Port-Sperren); welchen Schutz diese bieten, sollte im Einzelnen geprüft werden. Ein Aspekt dabei sind auch sog. Lawful-interception"-Interfaces, die das Mithören von Kommunikation durch Staatsorgane ermöglichen. Insbesondere bei GPRS-Nutzung im Ausland (roaming) kann dies problematisch sein, denn es gibt Indizien, dass dies in manchen Ländern nicht nur zur Verbrechensbekämpfung, sondern auch zur Erlangung wirtschaftlich relevanter Informationen genutzt wird [6]. SchlussfolgerungenWLAN-Technologie und GPRS bieten viele interessante und neue Möglichkeiten, um Anwendungen über drahtlose Netze zu nutzen. Insbesondere für die professionelle Nutzung im Enterprise-Umfeld stellt jedoch Sicherheit eine Herausforderung dar: Praktikable und hersteller- bzw. providerunabhängige Sicherheitslösungen sind momentan nur auf höheren Netzwerkschichten zu finden. VPN-Lösungen, SSL/TLS-Verschlüsselung oder Sicherung auf Anwendungsebene stellen sinnvolle Maßnahmen dar. Ein VPN auf IP-Ebene bietet wohl die derzeit universellste Alternative. In der Praxis ist das aber oft nicht einfach umzusetzen: Bordmittel" wie Microsofts PPTP haben sich in der Vergangenheit als verwundbar erwiesen. Für die oft präferierte Variante IPSEC sind Clients zwar für die meisten gängigen Betriebssysteme erhältlich, aber noch kaum für mobile Geräte wie PDAs. Auch kann die Konfiguration von VPNs Überraschungen bergen: Bei GPRS stellen Roundtrip-Zeiten evtl. Hürden dar, und Network Address Translation (NAT) kann Features wie Authentication Header bei IPSEC ausschließen. Bei WLANs stellen die i. d. R. dezentral über das Firmengelände verteilten Accesspoints ein Problem dar, denn dies erfordert ebenso verteilte VPN-Server, eine separate Verkabelung oder entsprechende Konfiguration bei Routern. Insbesondere wird aber das Security-Management vor neue Herausforderungen gestellt, was skalierbaren, sicheren Betrieb angeht. WLAN und GPRS in Firmennetze einzubinden ist keine leichte Aufgabe, nicht zuletzt weil auch Security Policies diese neuen Technologien oft noch nicht adäquat berücksichtigen.
|
Hinweis: Die URLs entsprechen dem Stand bei der Veröffentlichung des Artikels und werden nicht aktualisiert. |