Erste Schritte mit Python

Folien Tag 1

Folien Tag 2

Folien Tag 3

Folien Tag 4

Tag 1: Grundlagen und erste Schritte
Tag 2: Daten
Tag 3: Bibliotheken und Funktionen
Tag 4: Klassen und Programme

Computer Grundlagen II: Datenkodierung
Python Grundlagen II: Datenstrukturen
Projekt 2: CSV & JSON
Quellen zum Selbststudium

Datenkodierung

Computer kennen nur 0 und 1
Nachricht (Syntax):
Folge von 0en und 1en
Information (Semantik):
Bedeutung der Nachricht

Graph+sas, CC BY-SA 4.0 , via Wikimedia Commons

Wertigkeit der Stellen: $2^i$
$101_2 $
$= 1 * 4 + 0 * 2 + 1 * 1 $
$= 5_{10}$

User000name, CC BY-SA 4.0 , via Wikimedia Commons

Wertigkeit der Stellen: $16^i$
$10_{16} = 1 * 16 + 0 * 1 = 16_{10}$
$AF_{16} $
$= 10 * 16 + 15 * 1 $
$= 175_{10}$

Hr.hanafi, CC BY-SA 3.0 , via Wikimedia Commons

User000name, CC BY-SA 4.0 , via Wikimedia Commons

maximaler Wert einer 4-stelligen Binärzahl:
$8+4+2+1=15$
maximaler Wert einer 1-stelligen Hexadezimalzahl:
$F_{16} = 15$
4 Zeichen binär $XXXX_2$
= 1 Zeichen hexadezimal $X_{16}$

Binär-Daten lassen sich kompakt Hexadezimal darstellen
$1100_{2}=12_{10}=A_{16}$
$1100 0101_{2}$ = 1100 0101 = $A5_{16}$
1 Byte = 8 Bit
$XX_{16}$ = $XXXX.XXXX_{2}$

X-Bit entspricht der Größe der CPU Register
Microcontroller: 8-Bit (1 Byte) / 16-Bit
Heutige PCs: 64bit (alte PCs: 32bit)
X-Bit ist die Speicherbandbreite
32bit = max. 4GB RAM
64bit = max. 16 Exabyte (16 Milliarden Gigabyte) RAM

Zahlenraum:
$-2^{n-1}, ... , 0, ... -2^{n-1}$
8bit: -127...127
32bit: -2.147.483.648 ... 2.147.483.648
Negative Zahlen: Binärwert invertieren und 1 addieren
4 = 0000 0100
invertiert: 1111 1011
1 addieren: 1111 1100 = -4

Grenzen der Darstellung können zu Problemen führen
Reddit: Reddit-Kommentare laufen bei 32-Bit über
Google: l+f: Integer-Überlauf Gangnam-Style

Reddit-Kommentare laufen bei 32-Bit über

l+f: Integer-Überlauf Gangnam-Style

Gleitkommazahlen müssen als Binärmuster darstellt werden
IEEE 754: $x=$$s$$2^e$$m$
Vorzeichen s (1 bit), Exponent e, Mantisse m
negative Exponenten: Biaswert wird addiert
32 Bit Darstellung: 3.14
=0 2^1 1.5700000524520874
= 0 1000.0000 10.0100.0111.1010.1110.00010
Dargestellte Zahl: 3.1399998664855957031250000

Kodierung pro Zeichen
einfachste Kodierung: ASCII
ein Zeichen pro Byte, sehr kleiner Zeichenraum
aktueller Standard: UTF8
variable Zeichenlänge, (fast) alle Zeichen darstellbar

Text: Hallo, Welt!
ASCII: 48 61 6c 6c 6f 2c 20 57 65 6c 74 21
UTF-8: 48 61 6c 6c 6f 2c 20 57 65 6c 74 21
UTF-16: 0048 0061 006c 006c 006f 002c 0020 0057 0065 006c 0074 0021
Zeichen 😊
ASCII: Nicht darstellbar
UTF-8: F0 9F 98 8A
UTF-16: D83D DE0A

Computer Grundlagen II: Datenkodierung
Python Grundlagen II: Datenstrukturen
Projekt 2: CSV & JSON
Quellen zum Selbststudium

Python ist eine:
- höhere Sprache
- interpretierte Sprache

Python verwendet Einrückung um Blöcke zu bilden
Viele andere Sprachen: { }


								>>> for i in range(1,10):
								...     print(i)
								...

Datentypen:
- Ganzzahl: int
- Dezimalzahl: float
- Komplexe Zahl: complex
Built-in Types
Python 3: int is unbeschränkt


								Python 3.10.6
								>>> import sys
								>>> sys.float_info
								sys.float_info(
									max=1.7976931348623157e+308, ...
									min=2.2250738585072014e-308, ...)


								>>> a = 5
								>>> type(a)
								<class 'int'>
								>>> b = 3.14
								>>> type(b)
								<class 'float'>
								>>> z = complex(3,4)
								>>> type(z)
								<class 'complex'>
								>>> z.real
								3.0
								>>> z.imag
								4.0

								Python 2.7.18
								>>> import sys
								>>> sys.maxint
								9223372036854775807

Ein Feld (englisch [...] array [...]) ist in der Informatik eine Datenstruktur-Variante, mit deren Verwendung „viele gleichartig strukturierte Daten [...] verarbeitet werden sollen“. Der Zugriff auf bestimmte Inhalte eines Felds erfolgt mit Hilfe von Indizes, die dessen Position bezeichnen.

penubag, CC BY-SA 3.0 , via Wikimedia Commons

https://de.wikipedia.org/wiki/Feld_(Datentyp)

Eine verkettete Liste ist eine dynamische Datenstruktur, in der Datenelemente geordnet gespeichert sind. Bei ihrer Erstellung braucht die maximale Anzahl der Elemente nicht festgelegt zu werden, und die Anzahl darf während der Laufzeit beliebig variieren.

penubag, CC BY-SA 3.0 , via Wikimedia Commons

https://de.wikipedia.org/wiki/Liste_(Datenstruktur)

Höhere Datenstruktur
Kann verschiedene Werte aufnehmen
Kann über Index zugegriffen werden
Neue Elemente können angehängt werden
Dokumentation


								>>> list = [5, 3, "Hallo"]
								>>> list
								[5, 3, 'Hallo']
								>>> list[0]
								5
								>>> list[2]
								'Hallo'
								>>> list.append(3)
								>>> list
								[5, 3, 'Hallo', 3]

Höhere Datenstruktur
Kann verschiedene Werte aufnehmen
Kann über Index zugegriffen werden
Feste Länge
Unterstützt "unpacking"
Dokumentation


								>>> tuple = (1, 3, "Welt")
								>>> tuple
								(1, 3, 'Welt')
								>>> tuple[2]
								'Welt'
								>>> x, y, z = tuple
								>>> x
								1
								>>> y
								3
								>>> z
								'Welt'

Eine Hashfunktion [...] ist eine Abbildung, die eine große Eingabemenge, die Schlüssel, auf eine kleinere Zielmenge, die Hashwerte, abbildet. Eine Hashfunktion ist daher im Allgemeinen nicht injektiv.

Jorge Stolfi, Public domain, via Wikimedia Commons

penubag, CC BY-SA 3.0 , via Wikimedia Commons

https://de.wikipedia.org/wiki/Hashfunktion

In der Informatik bezeichnet man eine spezielle Indexstruktur als Hashtabelle (englisch hash table oder hash map) [...]. Sie wird verwendet, um Datenelemente in einer großen Datenmenge zu suchen bzw. aufzufinden [...].

Public domain, via Wikimedia Commons

penubag, CC BY-SA 3.0 , via Wikimedia Commons

https://de.wikipedia.org/wiki/Hashtabelle

Hashtabelle
Kann über Schlüssel zugegriffen werden
Dokumentation


								>>> dict = {}
								>>> type(dict)
								
								>>> dict['Hallo'] = 'Welt'
								>>> dict
								{'Hallo': 'Welt'}

Menge
Kann jedes Element nur einmal enthalten
Dokumentation


								>>> list
								[5, 3, 'Hallo', 3]
								>>> set = set(list)
								>>> set
								{'Hallo', 3, 5}

Computer Grundlagen II: Datenkodierung
Python Grundlagen II: Datenstrukturen
Projekt 2: CSV & JSON
Quellen zum Selbststudium

Teil 1: DWD Warnzellen CSV
dwd.de https://t.ly/-ajyu
Teil 2: Open Power System Data Wetter Daten CSV
open-power-system-data.org https://t.ly/IbeO
Teil 3: Data USA Bevölkerung JSON
datausa.io https://t.ly/8Py-