Webseitenklassifizierung

Michael Bieri

Angesehenes Mitglied
Ich suche die Möglichkeit, eine Seite zu "klassifizieren", d.h. ich möchte eine URL nach Warez, Adult, Fun, Community etc. zuweisen.

Es gibt ja viele Firewall's/Proxys, welche das im Firmenumfeld recht gut im Griff haben. Haben die ein zentrales Archiv, wo das ganze Zeug indexiert wird? Gibt es da auch was Opensourcemässiges? Oder Scannen die einfach den Inhalt nach Keywords, ähnlich wie bei den Spamfiltern?

MfG
 
Bei den meisten Firewalls (die Content Filtering beinhalten) kann man schon den Inhalt (oder auch die URL) nach Keywords scannen lassen. Aber das Verwalten der Keywords ist natürlich ein Riesenaufwand.

Deshalb bieten viele Firewalls die Möglichkeit, einen Content Filter quasi zu abonnieren - entweder direkt beim Hersteller der Firewall oder aber bei Dritten, z.B. Cerberian.com ( http://www.cerberian.com/products_oem.html ). Das läuft dann so, dass die Firewall den "Filter Provider" für eine bestimme URL oder Domain anfragt und von diesem die entsprechende Kategorie erhält. Je nach Einstellungen wird der Zugriff dann geblockt. Solche Filtering Dienste sind aber ziemlich teuer, weil dahinter ein grosser Aufwand steckt (schnelle Anbindung und Server, grosse Datenbanken mit den kategorisierten Sites).

Obs sowas für Opensource gibt, weiss ich nicht. Kostengünstig kann es eigentlich nur dann sein, wenn jeder der so ein System benutzt, es auch füttert resp. selbst Sites scannt und kategorisiert.

Griessli
Irene
 
Danke für deine Antwort Irene.

Auf Cerberian war ich bereits gestossen bei meiner Recherche. Die sind finanziell aber wirklich jenseits aller Vernunft - oder sie hatten kein Interresse an meiner Anfrage
wink.gif


Wenn es noch keine Freie, bzw Opensourcevariante gibt, dann wäre genau das ein schönes Projekt für meine anstehende Diplomarbeit
wink.gif


Jedoch habe ich noch rechtliche Bedenken. Ich möchte zusammen mit der Klassifizierung noch einen kleinen Screenshot der Seite ausliefern. Dies soll bei nicht vertrauenswürdigen, bzw. als unseriös klassifizierten Sites unterbunden werden. Klappt die Klassifizierung nicht sauber, könnte ich releativ schnell Ärger am Hals haben, da ich rechtswiedriges Material ausliefere..
 
Ich kenne die Gesetze nicht so genau, aber ich würde schon meinen, dass Du dich damit auf ein heikles Pflaster begibst. Und die Klassifizierung kann überhaupt nicht zu 100% stimmen - es ist genau die gleiche Problemstellung wie bei Spamfiltern, die ja entweder zu weich oder zu hart urteilen. Sprich es werden immer irgendwelche unseriösen Sites als seriös eingestuft oder umgekehrt. Deshalb benutz ich auch keine Contentfilter ;-)

Griessli
irene
 
Naja, ich könnte mich in diesem Fall sehr weit auf die Sichere Seite einlenken. Lieber einige Shots zuwenig, als unsichere durchlassen.. 100% sind aber auch so nicht möglich, natürlich..

Irgendwie geht es mir mächtig gegen den Strich, mich wegen sowas von einem coolen Projekt abzuhalten.
biggrin.gif
Muss mal schauen was die genaue Rechtslage aussagt zu diesem Punkt..
 
Zurück
Oben