13.1.1 Datenaufbereitung


Daten sind der Motor des Internets. Viele Internetseiten, welche Informationen bereitstellen, laden Daten aus Datenquellen und bereiten diese Daten so auf, dass Internet-Clients auf diese zugreifen können.

Anhand des Beispiel von Isotopen (Atomkerne mit gleich viel Protonen aber einer variablen Anzahl von Neutronen) sollen Sie diese Datenverarbeitung mit Hilfe von Algorithmen kennenlernen. Für das Projekt sollen Daten bekannter Isotope aus einer frei zugänglichen Internetquelle besorgt werden. Eine Internetrecherche zeigt, dass z.B. die "International Atomic Energy Agency" mit Sitz in Wien eine Datenquelle für Isotopen-Daten anbietet:

Nuclear Wallet Cards Search

Es sollen Daten für alle Isotope mit unterschiedlichen Kernladungszahlen Z gefunden werden.

  • Geben Sie bei "Protons (Z)" die Werte 0 und 117 ein.
  • Klicken Sie auf "Search", so dass die Daten angezeigt werden
  • Klicken Sie auf "Save Results", so dass die Datei 'walletcards.csv' im Ordner 'Downloads' gespeichert wird.
  • Klicken Sie auf die Datei 'walletcards.csv' mit der rechten Maustaste und öffnen Sie die Datei in einem Texteditor.

  • Falls die Isotopen-Datenbank gerade offline ist können Sie folgende Datei verwenden: walletcards.csv

Wenn Sie sich die Datei ansehen, stellen Sie fest, dass es viele Informationen in der Datei gibt, die uns gerade nicht interessieren. Diese sollen entfernt werden. Dazu werden die Daten in ein Tabellenkalkulationsprogramm importiert:

  • Legen Sie in Excel eine neue leere Datei an.

  • Klicken Sie in die Zelle "A1" und dann auf "Daten". Im Menü "Daten" klicken Sie auf "Aus Text/CSV" und wählen auf ihrem PC die Datei 'walletcards.csv'.

  • Klicken Sie auf "Daten transformieren" und bestätigen Sie damit die Einstellungen mit dem Trennzeichen "Tabstopp".

  • Klicken Sie im nächsten Dialog oben links auf "Laden/Schließen". Die Dateien der Textdatei werden in Excel geladen.

  • Löschen Sie alle Spalten bis auf die Spalten "Atomic Number (Z)", "Atomic Mass (A)" und "Element", indem Sie oben mit der rechten Maustaste auf die Spalte klicken und dann 'Spalte löschen' anklicken.

  • Übersetzen Sie die Spaltenbezeichnungen ins deutsche.

  • Fügen Sie eine Spalte 'Neutronenzahl (N)' ein und lassen Sie Excel den richtigen Wert berechnen.

  • Sortieren Sie die Spalten in der Reihenfolge 'Kernladungszahl, Elementname, Massenzahl, Neutronenzahl'.

  • Speichern Sie die Datei im csv-Format, indem Sie auf "Speichern unter..." klicken, als Dateiformat "CSV UTF-8 (durch Trennzeichen getrennt)" auswählen, den Dateinamen "isotope.csv" eingeben und auf "Speichern" klicken.

Folgende Datei sollten Sie erzeugt haben: isotope.csv