Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Nächste Überarbeitung
Vorhergehende Überarbeitung
Nächste ÜberarbeitungBeide Seiten der Revision
satellite:dnbd3_lokales_caching [2019/08/15 17:14 CEST] – angelegt srittersatellite:dnbd3_lokales_caching [2019/12/18 12:19 CET] – [Client] sritter
Zeile 1: Zeile 1:
-<note warning>**Experimentell**</note>+<note warning>**Experimentell** 
 + 
 +<wrap lo>Feature derzeit in Entwicklung und Test</wrap> 
 +</note>
  
 ====== Lokales Caching ====== ====== Lokales Caching ======
  
-bwLehrpool überträgt alle zur Laufzeit benötigten Daten über Netzwerk. Allein beim Boot einer virtuellen Windows Maschine fallen dabei schnell mehrere hundert Megabyte an. +bwLehrpool überträgt alle zur Laufzeit benötigten Daten über Netzwerk. Das betrifft sowohl das Grundsystem (MiniLinux) als auch anschließend gestartete VMs. Allein beim Boot einer virtuellen Windows Maschine fallen dabei schnell mehrere hundert Megabyte an. 
-Durch die Verwendung von [[satellite:dnbd3|DNBD3]]-Proxys können auch schlechter angebundene Räume bwLehrpool nutzen und die Abhängigkeit von schnellem Netzwerkzugang sinkt.+In manchen Fällen kann dies im Vergleich zu lokal installierten Systemen zu verlängerten Bootzeiten führen bspwbei: 
 +  * langsamer Netzanbindung 
 +  * langsamem Storage 
 +  * großer Anzahl gleichzeitig startender Clients
  
-Der nächste logische Schritt ist die Umsetzung von lokalem Caching. Clients speichern angefragte Blöcke auf der lokalen Festplatte und müssen diese bei späteren Bootvorgängen nicht mehr neu über das Netzwerk übertragen+Durch die Verwendung von [[satellite:dnbd3|DNBD3]]-Proxys können diese Abhängigkeiten reduziert werden. Außerdem besteht somit ein automatisches Failover, falls der Hauptstorage ausfallen sollte. DNBD3-Proxyserver allein sind jedoch nicht immer ausreichend oder gewünscht. Insbesondere, wenn viele Räume von einer langsamen Anbindung betroffen sind. 
 + 
 +Der nächste logische Schritt liegt daher in der Umsetzung von lokalem Caching. Clients speichern angefragte Daten(-Blöcke) auf einer speziell vorbereiteten Partition auf der lokalen Festplatte und können diese bei späteren Bootvorgängen direkt vom lokalen Speicher lesen. Die über Netzwerk zu übertragenden Daten sinken somit deutlich. Damit kann Netzwerk sowie Storage effektiv entlastet und die Bootgeschwindigkeit erhöht werden. Die Vorteile von bwLehrpool - u.a. sauberes System bei jedem Neustart, sofortige Verfügbarkeit neuer VMs, Raumunabhängigkeit - bleiben dennoch erhalten.
  
 ===== Voraussetzungen ===== ===== Voraussetzungen =====
Zeile 12: Zeile 20:
 ==== Server ==== ==== Server ====
  
-Es muss mindestens der Satellitenserver in **Version 3.8b** verwendet werden. Außerdem muss DNBD3 aktiviert sein. Es ist zu empfehlen mindestens einen DNBD3-Proxy zu verwenden, damit nicht der komplette Traffic vom VM-Storage über den Satellitenserver geleitet wird.+Es muss mindestens der Satellitenserver in **Version 3.8b** und **MiniLinux 25** verwendet werden. Außerdem muss DNBD3 aktiviert sein. Es ist zu empfehlen mindestens einen DNBD3-Proxy zu verwenden, damit nicht der komplette Traffic vom VM-Storage über den Satellitenserver geleitet wird.
  
 ==== Client ==== ==== Client ====
  
-Clients benötigen eine lokale Festplatte sowie eine entsprechend eingerichtete Partition zur Speicherung der Daten. Für bwLehrpool-Clients empfehlen wir immer den Einsatz einer sogenannten [[wiki:id44|ID44-Partition]]. Diese wird bei jedem Bootvorgang frisch formatiert und für temporäre Schreibzugriffe verwendet+Clients benötigen eine lokale Festplatte sowie eine entsprechend eingerichtete Partition zur Speicherung der Daten. Für bwLehrpool-Clients empfehlen wir immer den Einsatz einer sogenannten [[wiki:id44|ID44-Partition]]. Diese wird für temporäre Schreibzugriffe verwendet und bei jedem Bootvorgang frisch formatiert. 
  
-Für das lokale Caching muss daher eine weitere Partition eingerichtet werden. Diese benötigt bei MBR die ID "45" bzw. bei GPT das Label "OpenSLX-ID45". Diese Partition wird von bwLehrpool automatisch erkannt und eingebunden. Dort gespeicherte Daten werden im Gegensatz zur ID44 beim Booten nicht gelöscht.+Für das lokale Caching muss daher eine weitere, persistente Partition eingerichtet werden. Diese benötigt bei MBR die ID "45" bzw. bei GPT das Label "OpenSLX-ID45" oder den Partition-Type "87f86132-ff94-4987-b250-454545454545". Diese Partition wird von bwLehrpool automatisch erkannt und unter "/opt/openslx/persistent" eingebunden. Dort gespeicherte Daten werden im Gegensatz zur ID44 beim Booten nicht gelöscht. Zum einrichten der Partition vergleichen Sie die Informationen unter [[wiki:id44|ID44-Partition]]. 
 + 
 +Denken Sie daran, dass es auch von der Geschwindigkeit der Festplatte abhängt, ob lokales Caching überhaupt Vorteile bringt. Erste Messergebnisse scheinen darauf hinzuweisen, dass nur bei Verwendung von SSDs lokales Caching einen Geschwindigkeitszuwachs bedeutet.
  
  
Zeile 26: Zeile 36:
  
 | SLX_DNBD3_MIN_GB | Mindestgröße der ID45-Partition (in Gigabyte), damit ein Client überhaupt anfängt lokal zu cachen. | | SLX_DNBD3_MIN_GB | Mindestgröße der ID45-Partition (in Gigabyte), damit ein Client überhaupt anfängt lokal zu cachen. |
-| SLX_DNBD3_MIN_GB_HASH | Mindestgröße der ID45-Partition (in Gigabyte), damit angefragte Daten immer auf 16MB Blöcke aufgefüllt werden. | +| SLX_DNBD3_MIN_GB_HASH | Mindestgröße der ID45-Partition (in Gigabyte), damit angefragte Daten immer auf 16MB Blöcke aufgefüllt werden (Hashblock). |
  
-Standardmäßig wird zwischengespeichert, was der Client vom Server beim Start oder Betrieb einer VM anfragt. Werden 100KB angefragt, werden genau diese lokal gespeichert.  
  
-DNBD3 arbeitet intern aus Performanzgründen allerdings mit 16MB großen Blöcken über die jeweils Hashsummen für Integritätschecks gebildet werdenWird nun eine Datei mit 100KB angefragt, die auf mehrere logische 16MB Blöcke verteilt gespeichert wurde, kommt es darauf an, ob +Standardmäßig wird zwischengespeichert, was der Client vom Server beim Start oder Betrieb einer VM anfragtWerden 100KB angefragt, werden genau diese übertragen und lokal gespeichert
  
-Mit SLX_DNBD3_MIN_GB_HASH gibt an, wie groß die erkannte ID45-Partition sein muss, damit angefragte Daten immer auf 16MB Blöcke aufgefüllt werden. Der Vorteil ist, dass DNBD3 die Blöcke mit den Hashes auf dem Server vergleichen kann und somit sichergestellt ist, dass bei der Übertragung nichts schief gelaufen istNachteil ist aber, dass lokal deutlich mehr Speicherplatz benötigt wird und alles erstmal übers Netzwerk laufen muss. Wenn beispielsweise 100KByte aus 10 verschiedenen Blöcken angefragt werden, werden eben nicht nur 100KB gecachet, sondern gleich 10*16MByte. Außerdem haben Tests gezeigt, dass die Daten, die zum Start einer VM benötigt werden, häufig ziemlich verteilt im Image liegen.+Intern arbeitet DNBD3 aus Performanzgründen allerdings mit 16MB großen Blöcken, über die jeweils Hashsummen für Integritätschecks gebildet werden. Mit SLX_DNBD3_MIN_GB_HASH können Sie daher steuern, wie groß die erkannte ID45-Partition sein muss, damit angefragte Daten immer auf 16MB Blöcke aufgefüllt werden (backgroundReplication=hashblock). Der Vorteil ist, dass DNBD3 dadurch die erhaltenen Blöcke mit den Hashes auf dem Server vergleichen kann und somit sichergestellt ist, dass die Daten konsistent sindNachteilig ist jedoch, dass lokal deutlich mehr Speicherplatz benötigt wird und zusätzliche, eigentlich nicht angefragte Daten, übers Netzwerk übertragen werden müssen. Wenn beispielsweise eine 100KByte große Datei angefragt wird, die auf 10 verschiedene 16MB-Blöcke verteilt ist, werden eben nicht nur 100KB übertragen und gecachet, sondern gleich 160MB (10*16MByte)Diverse Tests haben gezeigt, dass Daten, die zum Start einer VM benötigt werden, häufig ziemlich verteilt im Image liegen.
  
 +**__Beispiel:__**
 +Beim erstmaligen Boot unserer "Windows 10 Standard Vorlage" mit lokalem Caching bis zum vollständig geladenenen Desktop werden etwa **800-900MB** gecachet. Wird die Hashblock-Methode verwendet (Caching kompletter 16MB-Blöcke), wächst der Cache (wieder beim erstmaligen Boot) dagegen auf ca. **11GB**.
  
 +Sie sollten SLX_DNBD3_MIN_GB_HASH daher auf einen relativ hohen Wert setzen oder ggf. komplett deaktivieren (Wert = 0), da bei der Verwendung unterschiedlicher VMs auf einem Client dessen ID45-Speicher sehr schnell voll laufen wird! Auf Grund der bisher noch sehr simplen Verdrängungsstrategie kann es dadurch passieren, dass das lokale Caching nur geringe Vorteile bietet oder sogar kontraproduktiv ist.
  
  
-===== Aktuelle Probleme =====+===== Aktuelle Probleme/Einschränkungen =====
  
-  * Gecachet werden derzeit nur VMs. Das MiniLinux kommt daher momentan immer noch bei jedem Start komplett übers Netzwerk (~350MB).  +  * Gecachet werden derzeit ausschließlich VMs. Das MiniLinux wird daher momentan immer noch bei jedem Start komplett übers Netzwerk (~350MB) übertragen.  
-  * Der erste Boot einer VM ist kann zunächst langsamer sein, da die Daten parallel auf die Festplatte geschrieben werden müssen. Bei weiteren Boots der gleichen VM sollte sich die Geschwindigkeit aber (in Abhängigkeit der Geschwindikeit der Festplatte) wieder normalisieren. +  * Der erste Boot einer VM kann zunächst langsamer sein, da die Daten parallel auf die Festplatte geschrieben werden müssen. Bei weiteren Boots der gleichen VM sollte sich die Geschwindigkeit aber (in Abhängigkeit der Geschwindikeit der Festplatte) wieder normalisieren. 
-  *  Derzeit gibt es noch keine intelligente Verdrängungsstrategie. Wenn der Speicher der ID45 voll ist und eine neue VM angefragt wird, werden alle Blöcke der am längsten nicht verwendeten VM verworfen, um Platz zu schaffen. Sie sollten den Speicherbereich der ID45 daher nicht zu stark begrenzen (vor allem nicht wenn auf 16MB Blöcke aufgefüllt wird).+  *  Derzeit gibt es noch keine intelligente Verdrängungsstrategie. Wenn der Speicher der ID45 voll ist und eine neue VM angefragt wird, werden alle Blöcke der am längsten nicht verwendeten VM verworfen, um Platz zu schaffen. Sie sollten den Speicherbereich der ID45 daher nicht zu stark begrenzen (vor allem nicht wenn wie Hashblock-Methode verwendet wird).
  
  
  
  
Drucken/exportieren