SQL distinct on one column

In der Datenbankwelt spielt SQL eine wichtige Rolle, um Daten effizient zu organisieren, abzufragen und zu verarbeiten. Eines der nützlichen Konzepte in SQL ist das „DISTINCT“-Schlüsselwort, das verwendet wird, um doppelte Datensätze in einer Abfrage zu entfernen. Jedoch kann es vorkommen, dass nicht alle Spalten in einer Abfrage eindeutig sein müssen. In solchen Fällen kann das „DISTINCT ON“-Konzept verwendet werden, um die Eindeutigkeit anhand einer bestimmten Spalte festzulegen.

Was ist das „DISTINCT ON“ Konzept?

Das „DISTINCT ON“ Konzept ist eine Erweiterung des herkömmlichen „DISTINCT“-Schlüsselworts in SQL. Während „DISTINCT“ alle Spalten einer Abfrage berücksichtigt, wird mit „DISTINCT ON“ nur eine bestimmte Spalte verwendet, um Duplikate zu entfernen.

Die Syntax für „DISTINCT ON“ ist wie folgt:
“‘
SELECT DISTINCT ON (Spalte) Spalte1, Spalte2,…
FROM Tabelle
WHERE Bedingung
ORDER BY Spalte,…
“‘

Dabei kann die Spalte entweder durch ihren Namen oder durch ihre Position in der SELECT-Anweisung identifiziert werden.

Das „DISTINCT ON“ Beispiel

Um das Konzept des „DISTINCT ON“ besser zu verstehen, betrachten wir ein einfaches Beispiel. Angenommen, wir haben eine Tabelle mit dem Namen „Kunden“, die die Spalten „Kundennummer“, „Name“ und „Land“ enthält. In dieser Tabelle können mehrere Kunden denselben Namen haben, aber unterschiedliche Kundennummern und Länder.

Wenn wir alle Kunden anzeigen möchten, ohne Duplikate basierend auf dem Namen zu erhalten, können wir das „DISTINCT ON“ Konzept verwenden. Die Abfrage könnte wie folgt aussehen:

“‘
SELECT DISTINCT ON (Name) Kundennummer, Name, Land
FROM Kunden
ORDER BY Name, Kundennummer
“‘

Diese Abfrage würde nur den ersten Datensatz für jeden eindeutigen Namen zurückgeben. Wenn es mehrere Kunden mit demselben Namen gibt, wird der Datensatz mit der niedrigsten Kundennummer ausgewählt.

how to select distinct on one column with multiple…

Anwendungsbeispiele für „DISTINCT ON“

Das „DISTINCT ON“-Konzept kann in verschiedenen Szenarien nützlich sein. Hier sind einige Anwendungsbeispiele.

Bestseller ermitteln

Angenommen, wir haben eine Tabelle mit dem Namen „Bestellungen“, die Bestelldetails wie Bestellnummer, Kunde, Produkt und Bestellmenge enthält. Nun möchten wir die Bestsellerprodukte ermitteln, basierend auf der Anzahl der Bestellungen. Das bedeutet, dass wir nur das Produkt mit den meisten Bestellungen anzeigen möchten. In diesem Fall könnte die Abfrage folgendermaßen aussehen:

“‘
SELECT DISTINCT ON (Produkt) Produkt, COUNT(Bestellnummer) AS Anzahl_Bestellungen
FROM Bestellungen
GROUP BY Produkt
ORDER BY Produkt, COUNT(Bestellnummer) DESC
“‘

Diese Abfrage würde nur das Produkt mit den meisten Bestellungen zurückgeben.

Neueste Einträge auswählen

Wenn wir eine Tabelle mit Einträgen haben, die ein Datum aufzeichnen, könnte es sein, dass mehrere Einträge am selben Tag gemacht wurden. In diesem Fall können wir das „DISTINCT ON“-Konzept verwenden, um nur den neuesten Eintrag für jeden Tag anzuzeigen. Die Abfrage würde ähnlich aussehen wie folgt:

“‘
SELECT DISTINCT ON (Datum) EintragID, Datum, Beschreibung
FROM Einträge
ORDER BY Datum DESC
“‘

Diese Abfrage würde nur den neuesten Eintrag für jeden Tag zurückgeben, wobei die Einträge nach dem Datum absteigend sortiert werden.

Fazit

Das „DISTINCT ON“ Konzept erweitert die Funktionalität des „DISTINCT“-Schlüsselworts in SQL und ermöglicht es uns, Duplikate basierend auf einer bestimmten Spalte zu entfernen. Es ist besonders nützlich, wenn wir nur eine Teilmenge der Spalten einer Tabelle eindeutig machen möchten. Durch die Verwendung von „DISTINCT ON“ können wir spezifische Anforderungen erfüllen, wie das Finden von Bestsellern oder das Auswählen der neuesten Einträge. Es ist wichtig zu beachten, dass die Funktionalität von „DISTINCT ON“ nicht in allen Datenbanksystemen unterstützt wird. Daher ist es ratsam, vor der Verwendung die Datenbankdokumentation zu überprüfen.