PDA

Vollständige Version anzeigen : SQL ist leicht (10) - Nummerierung in Abfragen


ebs17
08.10.2017, 19:49
Desweilen wünscht man sich eine fortlaufende Datensatznummerierung analog der Zeilennummerierung in Excel. Zum einen dient es der schönen deutschen Ordnung, an der sich das Auge weiden kann, wenn alles sauber durchnummeriert ist. Zum anderen braucht man solche Durchnummerierungen wirklich, u.a.
- weil man in Kreuztabellenabfragen Aufzählungsfelder als Spaltenüberschrift erzeugen will,
- weil man gezielt auf bestimmte Datensätze nach Reihenfolgekriterien zugreifen oder solche Datensätze auch verknüpfen könnte (z.B. jeden fünften Datensatz, den vierten folgenden Arbeitstag auf ein Datum usw.),
- weil man überhaupt erst so etwas wie eine ID in einer Menge von gleichen Datensätzen erzeugen will.

Die Lösungen in "Laufende Nummer" (FAQ 3.11 (http://www.donkarl.com?FAQ3.11)) können die genannten Aufgaben teilweise erledigen und werden hier in Gegenüberstellung gezeigt. Die hier vorgestellte Lösung , die aus einer Funktion in Zusammenarbeit mit zwei globalen Variablen besteht, kann zusätzlich auch durchnummerieren, wenn es kein (verwendbares) Feld zur Unterscheidung gibt. Hier wird nach der vorgenommenen Sortierung nummeriert.

Einschub: Die Bestimmung einer laufenden Nummer per Unterabfrage bzw. DCount im SELECT-Teil der Abfrage hat ein systematisches Problem. In einer Datenbanktabelle sowie -abfrage gibt es keine nutzbare Reihenfolge, wo man einen Zähler einfach hochzählen könnte (in einem Recordset mit dieser Tabelle/Abfrage dann schon). Daher zählt man bei diesen beiden Varianten über alles nach einem Kriterium, und das pro Datensatz der Hauptabfrage. Das bedeutet, mit steigenden Datensatzzahlen wird der jeweilige Vergleichen-Zählen-Aufwand größer, und natürlich erfordern mehr Datensätze auch mehr Zählungen. Damit steigt die benötigte Laufzeit überproportional zur Datensatzzahl-Steigerung bis hin zur praktischen Unverwendbarkeit. Die Domänenaggregatfunktion (Methode des Accessobjektes, nicht Methode der VBA-Bibliothek) scheint in dieser Verwendung der Datenbankmaschine etwas Intelligenteres zu übergeben im Vergleich zu dem, wie die Datenbankmaschine das pure SQL abarbeitet.
Die hier vorgestellte Lösung QueryIncrement hat dieses systematische Problem nicht.
' mod_QueryIncrement

Public gQI_Category As String
Public gQI_Icount As Long

Public Function QueryIncrement(ByVal Init As Variant, _
ByVal StartValue As Long, _
ParamArray Categories() As Variant) As Long
Dim k As Long, v As Variant
Dim sAllCategories As String

v = Init
If IsMissing(Categories) Then
sAllCategories = "$$$$$"
Else
For k = 0 To UBound(Categories)
If IsNull(Categories(k)) Then Categories(k) = vbNullString
Next
sAllCategories = Join(Categories, "|")
End If

If gQI_Category = sAllCategories Then
gQI_Icount = gQI_Icount + 1
Else
gQI_Category = sAllCategories
gQI_Icount = StartValue
End If
QueryIncrement = gQI_Icount
End Function
Syntaxgegenüberstellung der Varianten für eine gleiche Aufgabe:
SELECT
T.A,
T.C,
T.Betrag,
QueryIncrement(T.A, 1, T.A, T.C) AS LfdNr
FROM
tblDaten AS T
ORDER BY
T.A,
T.C,
T.Betrag

'--------------------------------------------------------------------

SELECT
T.A,
T.C,
T.Betrag,
(
SELECT
COUNT(*)
FROM
tblDaten AS X
WHERE
X.A = T.A
AND
X.C = T.C
AND
X.Betrag < T.Betrag
)
+ 1 AS LfdNr
FROM
tblDaten AS T
ORDER BY
T.A,
T.C,
T.Betrag

'--------------------------------------------------------------------

SELECT
T.A,
T.C,
T.Betrag,
DCount('*', 'tblDaten', 'A = ' & T.A & ' AND C = ''' & T.C & ''' AND Betrag < ' & T.Betrag) + 1 AS LfdNr
FROM
tblDaten AS T
ORDER BY
T.A,
T.C,
T.Betrag
Es wird auffallen, dass die Syntax zur Verwendung von QueryIncrement nicht so hohe Hürden aufbaut wie z.B. die DCount-Variante.
Zusätzlich wurde eine Performancebetrachtung durchgeführt (im angehängten Bild sichtbar, in der angehängten Demo nachvollziehbar). Dort wurde mit sortierten und gemischten Daten sowie mit verschiedenen Indizierungen variiert.

Zum Abschluss zwei Anmerkungen:
1) Bei der Lösung QueryIncrement wird strikt durchgezählt, die Vergabe eines gleichen Ranges bei gleicher Punktzahl ist nicht möglich. Auch das ist in den vorhandenen Abfragen nachvollziehbar.
2) Es liegt in der Natur von globalen Variablen, dass diese ihren Wert behalten, wenn kein unbehandelter Fehler auftritt. Wenn also eine Abfrage mit QueryIncrement zum zweiten Mal aufgerufen wird und dabei die erstverwendete Kategorienliste des Neuabrufes mit der letztverwendeten und gespeicherten Kategorienliste übereinstimmt, würde die Zählung fortgeführt statt neu begonnen. In einem solchen Fall müsste man die Variablen vorher resetten.