StuRa:Wikipedia Sicherung

Aus Wiki StuRa HTW Dresden
Zur Navigation springen Zur Suche springen

Es gibt derzeit wenig bekannte Hoster, der eine komplette Kopie aller Sprachen aller Versionen der Wikipedia spiegelt (aufbewahrt). Das Projekt hat den Codenamen WikiSave.

Beschreibung

Nähere Details dazu gibt es bei Wikimedia [1] , wo eine Kopie vorliegt. Eine Recherche hat ergeben, dass die Kosten relativ hoch sind: derzeit sind es für das Device [2] knapp 1600 Euro und dann nochmal die Festplatten etwa 150 Euro für 500 GB [3] was bei 25 Slots eine angemessene Gesamtkapazität etwa 3750 Euro betragen würde.

Gründe

  • Wikipedia hat lange Tradition in Dresden (teilweise seit 2005)
  • sehr viele Dresdner Studierende nutzen Wikipedia täglich
  • über 200 Benutzer haben sich als Dresdner auf ihrer Benutzerseite identifiziert [1], einige sind Studierende oder arbeiten/lehren an der TU Dresden
  • es sind zu wenig komplette Sicherheitskopien weltweit vorhanden

mögliche Vorteile

  • Hochschulstandort Dresden wird interessanter für Forschung zur Wikipedia
    • soziologische Analysen
    • semantische Auswertung der Inhalte
    • Entwicklung von Inhalten über die Zeit
    • Nutzeraktivitätsanalysen
  • ein wichtiger Beitrag für größte freie Enzyklopädie wird geleistet
    • eine Sicherungskopie der Daten
    • ernsthafte Bestrebungen einen 1:1 Spiegel aller Sprachen einzurichten können bedient werden (dato nicht bekannt)
    • Foundation wird bestrebt sein, weiterhin unabhängig zu bleiben, um keinen Fork zu riskieren
  • öffentlichkeitswirksames Projekt (Wikimedia Projekte sind "freundlich", deutsche Wikipedia ist 10 Jahre alt)
  • steigende weltweite Bekanntheit des Hochschulstandorts, da viele Entwickler aktuelle Daten benötigen, welche dann vorgehalten werden (einzelne Verbindungen übern Teich nicht mehr notwendig)

mögliche Nachteile

  • erhöhter Traffic mit folgender Angleichung der DFN-Klasse (Menge kann bei Foundation angefragt werden)
  • wer übernimmt die Zuständigkeit auf Dauer

Zu klären

Geklärt werden müssen die rechtfertigung der Anschaffungskosten sowie ob der Trafficanstieg auf dieser IP geduldet wird. Erstmal müssten wir das Zeug herunterladen, was in sechs Tagen Download eben 10 TB Traffic erzeugen würde. Monatlich käme dann Wachstumstraffik und der Download hinzu.

Vorgehen

  • Antrag stellen
  • Nebennutzung bei Problemen definieren etc.

Sicherlich wäre es noch besser möglich in Dresden Forschung an dem Gesamtdatenpaket von Wikipedia durchzuführen, weil wir Interessenten 1GBit Anbindung an diese Daten geben könnten, was sicherlich dato nirgendwo auf der Welt sichergestellt ist.

weitere Projekte

Was auch interessant wäre, die 8 Millionen Medien auf Wikimedia Commons, das größte freie Werkearchiv ist zwar auf fünf verschiedenen Punkten auf der Welt gespiegelt - vielleicht könnte man jedoch mit einer Dresden Kopie auch die Medieninformatiker, Gestalter etc. als Unterstützer gewinnen.

Einzelnachweise

  1. http://meta.wikimedia.org/wiki/Mirroring_Wikimedia_project_XML_dumps
  2. http://www.google.com/products/catalog?q=hp+storageworks+25&hl=de&show=li&cid=770528528050242103&ei=Sdw_TdPXGoGI-gbb1ojhDg&sa=title&ved=0CBgQ8wIwAzgA#p
  3. http://www.preiscompany.de/origin-storage-festplatte-hotswap-sata150-7200-p-853442000.html