Stichprobenauswahlmethoden
Bei den Methoden der Stichprobenauswahl handelt es sich um spezifische Methoden, die für die Auswahl der Datensätze in einer Stichprobe verwendet werden.
Für die Datensatzstichprobe und die Währungseinheitsstichprobe unterstützt Analytics drei Stichprobenauswahlmethoden:
- festes Intervall
- Zelle
- Zufall
Bei der klassischen Erhebung einer Stichprobe von Variablenausprägungen ist die zufällige Auswahlmethode die einzige Möglichkeit.
Stichprobenauswahlmethode gegenüber Stichprobenart
Es ist wichtig, den Unterschied zwischen der Stichprobenart und der Stichprobenauswahlmethode zu verstehen.
Stichprobenart bezieht sich auf die allgemeine statistische Methode, die verwendet wird, um eine Schätzung bezüglich der Grundgesamtheit zu erhalten.
Stichprobenauswahlmethode bezieht sich auf die Art, in der die Datensätze für eine Stichprobe aus der Grundgesamtheit gezogen werden.
Stichprobenart | Verfügbare Stichprobenauswahlmethoden | Details |
---|---|---|
Datensatzstichprobe |
|
Die Datensätze innerhalb der Stichprobe werden direkt ausgewählt. |
Währungseinheitsstichprobe |
|
Die Datensätze entsprechen innerhalb der Stichprobe den ausgewählten Währungseinheiten. |
Klassische Erhebung einer Stichprobe von Variablenausprägungen |
|
Die Datensätze innerhalb der Stichprobe werden direkt ausgewählt. |
Auswahlmethode festes Intervall
Bei der Auswahlmethode „Festes Intervall“ wird eine anfängliche Währungseinheit oder ein Datensatz ausgewählt. Jede folgende Auswahl erfolgt hiervon ausgehend in einem festen Intervall bzw. einem bestimmten Abstand, also beispielsweise jede 5000. Währungseinheit oder jeder 20. Datensatz nach der ursprünglichen Auswahl.

Um die Auswahlmethode „Festes Intervall“ zu verwenden, machen Sie die folgenden Angaben:
- Der Intervallwert, der durch Analytics beim Berechnen des Stichprobenumfangs generiert wurde
- Eine Startzahl größer als Null und kleiner oder gleich dem Intervallwert
Die Startzahl und der Intervallwert werden verwendet, um die Datensätze der Stichprobe auszuwählen.
Hinweis
Wenn Sie möchten, dass Analytics zufällig eine Startzahl auswählt, können Sie eine Startzahl von „0“ eingeben oder die Startzahl offen lassen.
Beispiel
Falls Analytics das Intervall „62“ generiert und Sie „17“ als Startnummer auswählen, werden die folgenden Währungseinheiten oder Datensatznummern ausgewählt:
- 17
- 79 (17+62)
- 141 (79+62)
- 203 (141+62)
- usw.
Jede Auswahl weist denselben Abstand auf bzw. ist ein festes Intervall entfernt.
Bei der Währungseinheitsstichprobe entsprechen die tatsächlich ausgewählten Datensätze den ausgewählten Währungseinheiten. Weitere Informationen finden Sie unter Wie Datensätze für die Währungseinheitsstichprobe ausgewählt werden.
Überlegungen
Falls Sie die Auswahlmethode „Festes Intervall“ verwenden, müssen Sie auf mögliche Datenmuster achten. Weil ein festes Intervall für die Stichprobenauswahl verwendet wird, kann sich möglicherweise eine nicht repräsentative Stichprobe ergeben, falls die Daten ein Muster aufweisen, das mit dem angegebenen Intervall übereinstimmt.
Sie ziehen zum Beispiel eine Stichprobe für Spesen mit einem Intervall von €10.000, und dieselbe Spesenkategorie erscheint in der Datei in Intervallen von EUR 10.000. Dies führte dazu, dass alle ausgewählten Datensätze aus einer einzelnen Spesenkategorie stammen. Dieses Szenario ist ungewöhnlich, jedoch sollten Sie es kennen, falls es auftreten sollte.
Auswahlmethode „Zelle“
Bei der Auswahlmethode „Zelle“ wird das Dataset in mehrere Zellen oder Gruppen identischer Größe aufgeteilt. Aus jeder Zelle wird dann eine Währungseinheit oder ein Datensatz zufällig ausgewählt.

Um die Auswahlmethode „Zelle“ zu verwenden, machen Sie die folgenden Angaben:
- Der Intervallwert, der durch Analytics beim Berechnen des Stichprobenumfangs generiert wurde
- Ein Grundwert, der verwendet wird, um einen Zufallszahlen-Generator in Analytics zu initialisieren.
Der Intervallwert schreibt die Größe jeder Zelle vor. Der Zufallszahlen-Generator legt fest, welche Währungseinheit oder welche Datensatznummer aus jeder Zelle ausgewählt wird.
Hinweis
Wenn Sie möchten, dass Analytics einen Zufallswert für den Grundwert festlegt, können Sie „0“ als Grundwert eingeben oder den Grundwert offen lassen.
Beispiel
Falls Analytics das Intervall „62“ generiert, wird jeweils eine Währungseinheit oder eine Datensatznummer zufällig aus jeder der folgenden Zellen ausgewählt:
- Zelle 1 (1 bis 62)
- Zelle 2 (63 bis 124)
- Zelle 3 (125 bis 186)
- usw.
Jede Auswahl weist einen zufälligen Abstand zur nächsten Auswahl auf, befindet sich aber innerhalb ihrer Zelle.
Bei der Währungseinheitsstichprobe entsprechen die tatsächlich ausgewählten Datensätze den ausgewählten Währungseinheiten. Weitere Informationen finden Sie unter Wie Datensätze für die Währungseinheitsstichprobe ausgewählt werden.
Der Grundwert
Der Grundwert kann eine beliebige Zahl sein. Jeder eindeutige Grundwert führt zu unterschiedlichen Zufallszahlen. Wenn Sie denselben Grundwert festlegen, werden dieselben Zufallszahlen erzeugt. Legen Sie einen Grundwert explizit fest und speichern Sie diesen, wenn Sie eine bestimmte Stichprobenauswahl replizieren möchten.
Überlegungen
Der Hauptvorteil der Zellenauswahlmethode gegenüber der Auswahlmethode „Festes Intervall“ besteht darin, dass Probleme auf Grund von Mustern in den Daten vermieden werden.
Bei der Währungseinheitsstichprobe gibt es zwei Nachteile:
- Beträge können sich über die Trennlinie zweier Zellen erstrecken. Dies kann dazu führen, dass ein Betrag zweimal ausgewählt wird. Die Stichprobe ist in diesem Fall weniger konsistent als mit der festen Intervallmethode.
- Größere Beträge, die unterhalb der Außenschichtgrenze liegen, haben eine leicht geringere Chance, ausgewählt zu werden.
Zufällige Auswahlmethode
Mit der zufälligen Auswahlmethode werden alle Währungseinheiten oder Datensätze zufällig aus dem gesamten Dataset ausgewählt (oder aus jeder Schicht, wenn Sie die klassische Erhebung einer Stichprobe von Variablenausprägungen verwenden).

Hinweis
Verwenden Sie nicht die zufällige Auswahlmethode bei einer Währungseinheitsstichprobe, wenn Sie später mit Analytics Fehlerbeträge auswerten möchten, die in der sich ergebenden Stichprobe festgestellt wurden. Zur Auswertung von Währungseinheitsstichproben ist es notwendig, dass Sie die Auswahlmethoden „Festes Intervall“ oder „Zelle“ verwenden.
Um die zufällige Auswahlmethode zu verwenden, machen Sie die folgenden Angaben:
- Der Stichprobenumfang nach der Berechnung von Analytics, also die Anzahl der zu wählenden Elemente
- Ein Grundwert, der verwendet wird, um einen Zufallszahlen-Generator in Analytics zu initialisieren.
- Die Größe der Grundgesamtheit, also der absolute Wert des Stichprobenfelds oder die Gesamtanzahl der Datensätze innerhalb des Datasets
Für die klassische Erhebung einer Stichprobe von Variablenausprägungen können der Stichprobenumfang und die Grundgesamtheit automatisch von Analytics ausgefüllt werden.
Der Zufallszahlen-Generator legt fest, welche Währungseinheiten oder welche Datensatznummern aus dem Dataset ausgewählt werden. Jede Auswahl weist einen zufälligen Abstand zur nächsten Auswahl auf.
Hinweis
Wenn Sie möchten, dass Analytics einen Zufallswert für den Grundwert festlegt, können Sie „0“ als Grundwert eingeben oder den Grundwert offen lassen.
Der Grundwert
Der Grundwert kann eine beliebige Zahl sein. Für die klassische Erhebung einer Stichprobe von Variablenausprägungen muss der Grundwert eine positive Zahl bis maximal 2.147.483.647 sein.
Jeder eindeutige Grundwert führt zu unterschiedlichen Zufallszahlen. Wenn Sie denselben Grundwert festlegen, werden dieselben Zufallszahlen erzeugt. Legen Sie einen Grundwert explizit fest und speichern Sie diesen, wenn Sie eine bestimmte Stichprobenauswahl replizieren möchten. Sie können auch einen Grundwert aus dem Befehlsprotokoll abrufen.
Überlegungen
Große Beträge werden aus einer Währungseinheitsstichprobe unter Umständen ausgeschlossen
Bei der zufälligen Auswahlmethode hat jede Währungseinheit die gleiche Chance, ausgewählt zu werden. Es ist nicht gewährleistet, dass die sich ergebende Stichprobe einheitlich verteilt ist. In einigen Fällen kann der Abstand bzw. die Lücke zwischen einzelnen Einheiten daher groß sein. Wenn alle Währungseinheiten eines großen Betrags in eine solche Lücke fallen, wird sich der Betrag unter Umständen nicht in der Stichprobe befinden. Außerdem gibt es bei der zufälligen Auswahlmethode keine Außenschichtgrenze.
Bei den Auswahlmethoden „Festes Intervall“ und „Zelle“ ist gewährleistet, dass die ausgewählten Einheiten einheitlich oder zumindest ziemlich einheitlich verteilt sind. Auch eine Außenschichtgrenze ist verfügbar.
Beträge werden in eine Währungseinheitsstichprobe unter Umständen mehrmals aufgenommen
Analytics schließt doppelte Zufallszahlen aus. Eng aneinanderliegende oder sequenzielle Zufallszahlen können jedoch auftreten.
Bei einer Währungseinheitsstichprobe entsprechen eng aneinanderliegende oder sequenzielle Zufallszahlen der Auswahl eng aneinanderliegender oder sequenzieller Währungseinheiten. Dies wiederum kann dazu führen, dass der zugehörige Betrag mehr als einmal ausgewählt wird.
Bei der Datensatzstichprobe und der klassischen Erhebung einer Stichprobe von Variablenausprägungen tritt dieses Problem nicht auf, da jede Zufallszahl einem unterschiedlichen Datensatz entspricht.
Algorithmen für Zufallszahlen
Bei der Datensatzstichprobe und der klassischen Erhebung einer Stichprobe von Variablenausprägungen können für den Zufallszahlen-Generator in Analytics zwei alternative Algorithmen gewählt werden:
- Mersenne-Twister
- Der Standardalgorithmus von Analytics
Mersenne-Twister ist ein breit verwendeter Algorithmus zur Erstellung von Zufallszahlen und weist bessere statistische Eigenschaften als der Standardalgorithmus in Analytics auf. Verwenden Sie den Standardalgorithmus, falls Sie eine Abwärtskompatibilität mit Analytics-Skripts oder Stichprobenergebnissen vor der Analytics-Version 12 benötigen.
Bei der klassischen Erhebung einer Stichprobe von Variablenausprägungen ist der Algorithmus Mersenne-Twister keine Option, weshalb der Standardalgorithmus von Analytics verwendet wird.
Ein Datensatznummernfeld hinzufügen
Es ist möglicherweise hilfreich, der Analytics-Tabelle, aus der Sie eine Stichprobe ziehen, ein Feld mit einer Datensatznummer hinzuzufügen. Nach dem Ziehen der Stichprobe werden die ausgewählten Datensatznummern aus der Quelltabelle in der Ausgabetabelle mit der Stichprobe angezeigt.
Hinweis
Ein Feld mit der Datensatznummer wird automatisch in die Ausgabetabelle aufgenommen, falls Sie die klassische Erhebung einer Stichprobe von Variablenausprägungen wählen.

- Erstellen Sie in der Quelltabelle ein Kalkulationsfeld mit dem folgenden Ausdruck:
RECNO( )
Weitere Informationen finden Sie unter Bedingtes Kalkulationsfeld definieren.
- Wenn Sie die Stichprobe ziehen, erstellen Sie die Ausgabe nach Feldern und nicht nach Datensätzen.
Sie müssen die Ausgaben nach Feldern erstellen, damit das berechnete Datensatznummernfeld in ein physisches Feld konvertiert wird, das die Datensatznummern der Quelltabelle beibehält.
- Schließen Sie das Kalkulationsfeld für die Datensatznummern in die ausgewählten Ausgabefelder ein.