Am Montag, 30. Juli 2007 16:47 schrieb Tamas Szalai:
> Am Montag, den 30.07.2007, 16:40 +0200 schrieb Michael Diederich:
> > Ich kann das frühstens im Laufe der Woche ausprobieren, aber eventuell
> > hilft dir ein
> >
> > group by gh.loc_id
> >
> > oder
> >
> > group by g.loc_id
> >
> aha ... nur noch 48 Ergebnisse - sehr gut. danke. :o)
Ok, das mag eine gültige Methode sein. Das Problem liegt darin, daß Dir
offenbar nicht ganz klar ist, welche Datensätze mehrfach vorkommen können. Im
Grunde kann JEDER Datensatz mehrfach in der DB vorkommen. Z.B. dann, wenn er
im Laufe der Zeit seine Zugehörigkeit zu einem Landkreis o.ä. geändert hätte.
Siehe Gültigkeitsdaten, die bei jedem Datensatz existieren.
Oder auch die verschiedenen Namen, die ein Ort haben kann. Z.B. Munich /
München als ein bekanntes Beispiel. Oder Niedersachsen / Lower Saxony. Oder
selbst wenn wir im hier gebräuchlichen Bereich bleiben, gibt es z.B. in der
Gegend um Bautzen zwei unterschiedliche offizielle Namen für die Orte: einmal
sorbisch, einmal deutsch (obwohl die sorbischen Einträge noch immer fehlen).
Bei Texteinträgen solltest Du generell nach '... AND is_default_name = true'
suchen, ansonsten generell nach '... AND valid_until >= date('today')'.
Z.B. habe ich gerade mal in der geodb_hierarchies und der geodb_textdata einer
älteren OpengeoDB Version geschaut. In der hierarchies sind 2375 von 40120
Einträgen nicht mehr gültig, in der geodb_textdata sind es 24 von 109916
Daten. Diese würdest Du alle erstmal doppelt zurückbekommen, wenn Du Dich
nicht auf ein Datum festlegst.
Grüße,
Thomas
--
Mailingliste OpenGeoDB
Listenadresse: opengeodb-r1mDYR0DdAyzQB+pC5nmwQ@xxxxxxxxxxxxxxxx
Informationen: http://opengeodb.de
Mit freundlicher Unterstütztung von php::bar (http://phpbar.de)
|