Informatik/Rechnerarchitekturen 1.md

7.6 KiB
Raw Blame History

Grundprinzipien

  • Ein- und Ausgabe
  • Programmspeicher
  • Datenspeicher

Unterschieden in:

  • Harvard Architektur: direkt mit Prozessor verbunden
  • Princeton-Architektur (von-Neumann-Architektur): über Systembus verbunden

Eigenschaften

Fast alle der heute üblichen Rechner gehen auf folgende Eigenschaften zurück:

  1. Die Rechenanlage besteht aus den Funktionseinheiten Speicher, Steuerwerk (engl. controller), dem Rechenwerk (engl. data path) und Ein-/Ausgabe-Einheiten.
  2. Die Struktur der Anlage ist unabhängig vom bearbeiteten Problem. Die Anlage ist speicherprogrammierbar.
  3. Der Speicher wird in Zellen gleicher Größe geteilt. Die Zellnummern heißen Adressen.
  4. Das Programm besteht aus einer Folge von elementaren Befehlen, die in der Reihenfolge der Speicherung bearbeitet werden.
  5. Abweichungen von der Reihenfolge sind mit (bedingten oder unbedingten) Sprungbefehlen möglich.
  6. Es werden Folgen von Binärzeichen (nachfolgend Bitvektoren genannt) verwendet, um alle Größen darzustellen.
  7. Die Bitvektoren erlauben keine explizite Angabe des repräsentierten Typs. Aus dem Kontext heraus muss stets klar sein, wie die Bitvektoren zu interpretieren sind.

Befehlssatz

Adressierung ohne Speicherzugriff

  • Registeradressierung: ausschließlich Operanden aus & Ziele in Registern
  • Unmittelbare Adressierung, Direktoperanden, immediate addressing: Operanden sind Teil des Befehlsworts
  • Direkte Adressierung, absolute Adressierung: Adresse ist ausschließlich im Befehlswort enthalten
  • Register-indirekte Adressierung: Adresse ist ausschließlich im Register enthalten
    • Varianten: pre/post-increment/decrement zur Realisierung von Stapeloperationen
  • Relative Adressierung, indizierte Adressierung, Basis-Adressierung: Adresse ergibt sich aus der Addition eines Registerinhalts und einer Konstanten im Befehl

n-Adressmaschinen

Klassifikation von Befehlssätzen bzw. Befehlen nach der Anzahl der Adressen bei 2-stelligen Arithmetik-Befehlen

  • 3-Adressmaschinen: Operanden und Ziel einer Operation werden explizit angegeben
  • 2-Adressmaschinen: Überschreiben eines Operanden mit dem Ergebnis
  • 1 12-Adressmaschinen: wie 2-Adressmaschinen, nur unter Verwendung von Registern
  • 1-Adressmaschinen: Nutzung von nur 1 Register
  • 0-Adressmaschinen: Kellermaschinen

Programmiermodelle, Instruction Set Architectures (ISAs)

Klassifikation von Befehlssätzen nach der Gestaltung/Ausprägung der vorhandenen Maschinenbefehle

  • CISC Complex Instruction Set Computers
    • Relativ kompakte Codierung von Programmen
    • Für jeden Befehl wurden mehrere Taktzyklen benötigt. Die Anzahl der Zyklen pro Befehl war groß
    • (Mikro-) Programm zur Interpretation der Befehle nötig
    • Compiler konnten viele Befehle gar nicht nutzen
  • RISC Reduced Instruction Set Computers
    • Wenige, einfache Befehle
    • Hohe Ausführungsgeschwindigkeit
      • durch kleine Anzahl von Taktzyklen pro Befehl
      • durch Fließbandverarbeitung (siehe später)
    • Programmlaufzeit = Anzahl auszuführender Befehle * CPI-Wert * Dauer eines Taktzyklus
    • Eigenschaften
      • feste Befehlswortlänge
      • LOAD/STORE-Architektur
      • einfache Adressierungsarten
      • „semantische Lücke“ zwischen Hochsprachen & Assemblerbefehlen durch Compiler überbrückt
      • statt aufwändiger Hardware zur Beseitigung von Besonderheiten (z.B. 16-Bit Konstanten) wird diese Aufgabe der Software übertragen
      • rein in Hardware realisierbar, keine Mikroprogrammierung

Technologien zum Speichern von Daten

  • Arten
    • Modifikation von Strukturen: Lochkarte, Schallplatte
    • Rückkopplung: Flip-Flops, SRAM
    • Elektrische Ladungen: Kondensator, DRAM
    • Magnetismus: Magnetkernspeicher, Magnetband, Diskette, Festplatte
    • Optik: Bar-Codes, CD-ROM, DVD
  • Vergleichskriterien
    • Kapazität
    • Energiebedarf
    • Geschwindigkeit
    • Robustheit
    • Speicherdichte
    • Kosten
  • Zugriffsmethoden
    • Sequentieller Zugriff
      • Zugriffszeit ist abhängig vom Speicherort und vom vorherigen Zugriff
      • Beispiele: Magnetbänder, Festplatten, CD-ROM, DVD, BluRay
      • Bei Plattenspeicher schneller Zugriff durch Überspringen von Spuren
    • Wahlfreier Zugriff
      • Zugriffszeit ist unabhängig vom Speicherort und vom vorherigen Zugriff
      • Eindeutige Adresse identifiziert den Speicherort
      • RAM (Random Access Memory)
  • Einteilung des Speichers in
    • Flüchtigen Speicher
      • Informationen gehen nach Ausschalten der Versorgungsspannung verloren!
      • Register innerhalb des Prozessors
      • Static RAM (SRAM) für Caches
      • Dynamic RAM (DRAM) für den Arbeitsspeicher
    • Nichtflüchtige Speicher:
      • Informationen bleiben auch ohne Versorgungsspannung über längere Zeit (typischerweise einige Jahre) erhalten!
      • Beispiele: Flash, Magnetspeicher (Festplatte, Disketten, Magnetbänder)
      • Bei einem ROM (Read Only Memory) ist nur lesender Zugriff möglich

Zweierpotenzen

  • 1 KibiByte = 1 KiB = 1024 Bytes = 2^10 Bytes
  • 1 MebiByte = 1 MiB = 1024 KiB = 2^20 Bytes = 1.048.576 Bytes
  • 1 GibiByte = 1 GiB = 1024 MiB = 2^30 Bytes = 1.073.741.824 Bytes
  • 1 TebiByte = 1 TiB = 1024 GiB = 2^40 Bytes = 1.099.511.627.776 Bytes

Blocktransfer (Burst)

Auslesen des kompletten Zeilenpuffers durch automatisches Inkrementieren der Spaltenadresse

Cache

= schneller Speicher, der vor einen größeren, langsamen Speicher geschaltet wird

  • Im weiteren Sinn: Puffer zur Aufnahme häufig benötigter Daten
  • Für Daten die schon mal gelesen wurden oder in der Nähe von diesen liegen
  • 90% der Zeit verbringt ein Programm in 10% des Codes
  • Im engeren Sinn: Puffer zwischen Hauptspeicher und Prozessor
  • Ursprung: cacher (frz.) verstecken („versteckter Speicher“)

Organisation von Caches

  • Prüfung anhand der Adresse, ob benötigte Daten im Cache vorhanden sind („Treffer“; cache hit)
  • Falls nicht (cache miss): Zugriff auf den (Haupt-) Speicher, Eintrag in den Cache

Ein- und Ausgabe

Übertragungsprotokolle

  • Synchrone Busse
    • Keine Rückmeldung bei der Übertragung
    • Unidirektionales Timing
  • Asynchrone Busse
    • Rückmeldung der Datenannahme
    • Bidirektionales Timing
unidirektional bidirektional
Beschreibung Kommunikationspartner verlassen sich darauf, dass Partner innerhalb festgelegter Zeit reagieren. Kommunikationspartner bestätigen per Kontrollsignal (senden ein acknowledgment), dass sie in der erwarteten Weise reagiert haben.
Vorteile einfach; bei konstanten Antwortzeiten schnell passt sich unterschiedlichen Geschwindigkeiten an; hoher Grad an Flusskontrolle möglich
Nachteile Kommunikationspartner muss in bestimmter Zeit antworten komplexer; Zeitüberwachung notwendig; evtl. langsam
Einsatzgebiet synchrone Busse, Speicherbusse asynchrone Busse, E/A- und Peripheriebusse

Programmierbarer Interrupt Controller (PIC)

Prozessorergänzung

Prozessor-Leistung

Leistung = (Durchschnitts-)Befehle pro Zeit
Berechnung: L=\frac{IPC}{t_{cycle}} mit IPC = \frac{1}{CPI} und CPI = \sum t_i *p_i

  • IPC: Instructions Per Cycle (Anzahl Durchschnittsbefehle pro Taktzyklus)
  • CPI: Cycles Per Instruction (Mittlere Anzahl Taktzyklen pro Befehl)
  • t_i : Anzahl Taktzyklen des i-ten Befehls
  • p_i : Relative Häufigkeit des i-ten Befehls
  • t_cycle : Taktzykluszeit [$μs$]

Befehlspalette

Pipelining: Fließbandverarbeitung (seriell vs parallel)

  • IF / ID / EX: Befehl lesen / dekodieren / ausführen
  • OF / WB: Operand lesen / schreiben (Register)
  • Probleme: Unterschiedliche Phasenlänge, bedingte Sprünge, Datenabhängigkeiten

Superskalare Architektur:
Befehl lesen -> Befehl dekodieren -> Operand lesen -> Befehl ausführen -> Operand schreiben

dRam: mit Kondensator
sRam: mit FlipFlop
RAM: Random Access Memory
ROM: Read Only Memory\