Hallo,
On Wed, Jul 14, 2004 at 12:11:35PM +0200, Martin Trautmann wrote:
> opengeodb nutze ich als Basis fuer die Ortsdaten. Abgleichen moechte ich es
> mit tatsaechlichen Adressangaben, speziell aber auch fuer Strassendaten.
Die DPAG bietet sämtliche Straßendaten, wenn man Großkunde beim
Paketversand ist (oder wird). Sinn ist, dass die Pakete vom Absender
bereits kodiert werden sollen (Postleitcode).
Ich habe letztes Jahr dazu ein Frontend gebaut, was remote oder mit
einer website ansprechbar ist. Die Daten werden via bash-Skript in eine
MySQL eingelesen. Datenmenge: knapp 1,5 Mio Datensätze, 250MB Rohdaten
und noch einmal soviel vor die Indizes, damit man nicht zwei Minuten auf
ein Ergebniss warten muss :)
Demo: plc.tobus.org
> Hat jemand von euch hier praktische Erfahrungen mit den neueren
> Telefonbuch-Versionen, die einen vollstaendigen Datenexport erlauben sollen?
Ist in Planung, also auf der ToDo. Ob es dieses Jahr noch etwas wird,
weiß ich nicht. Es gibt AFAIk leider keine Beschreibung zum genutzten
Datenformat der DT-MEDIEN.
Sowieso mit Bedacht zu hantieren, ist bei der nicht privaten Nutzung der
Daten. Da sollte man sich immer an den Eigentümer wenden.
> Was mich interessiert:
>
> - Strassenname und dessen haeufige Schreibfehler bzw. -Varianten
> (z.B. Haeufigkeit von 'Dresdener Str.' vs. 'Dresdner Str.')
Wer soll diese Fipptehler erfassen? Das muss ja irgendjemand analysieren
und eine Alias-Tabelle anlegen. Besser ist es, den user auf senen Fehler
zu verweisen.
> - dazu erforderlich sind wohl PLZ oder Vorwahl und Ort,
> hilfreich die Hausnummer
Es gibt Straßen, die sich über mehrer Postleitzahlen erstrecken.
> (z.B. die Frage, wie oft vierstellige Hausnummern in D vorkommen)
Dass kann ich ermitteln, also wieviele Straßen mit vierstelligen Nr.
existieren.
> - Initialen sind interssant - z.B. wie oft die gleichen Initialen an
> einer Adresse vorkommen.
???
> Hat hier vielleicht jemand Erfahrung mit der Qualitaet der exportierten
> Daten? Wie gross werden diese? - Denn unkomporimiert 30 Mio Datensaetze mit
> z.B. je 1 KB Daten ergibt gleich mal 35 GB Festplattenplatz.
Ja, dass sind ungefähre Größenordnungen. Über Referenzen lässt sich das
natürlich stark verkleinern, aber 10GB kommen schon zusammen. Das sollte
man dan nicht einer IDE-Platte antun ;)
Hagen
--
Mailingliste OpenGeoDB
Listenadresse: opengeodb-r1mDYR0DdAyzQB+pC5nmwQ@xxxxxxxxxxxxxxxx
Informationen: http://opengeodb.de
Mit freundlicher Unterstütztung von php::bar (http://phpbar.de)
|