1.1 Was ist KI? · KI ePortfolio

Worum geht’s

Bevor ich in diesem Modul Suchverfahren, Lernalgorithmen oder neuronale Netze durchgehe, lohnt die unbequeme Frage, worüber ich eigentlich rede. „Künstliche Intelligenz” ist kein scharf umrissener Algorithmus, sondern ein Forschungsziel mit beweglichem Horizont — und genau diese Unschärfe ist lehrreich. Die Folien machen das gleich zu Beginn deutlich: „Was KI ist und wo KI wie zur Anwendung kommt, muss relativ zum betrachteten Zeitraum beantwortet werden.” Wer KI über „Intelligenz” definiert, hat das Problem nur verschoben, denn auch der Begriff Intelligenz ist nicht operational. Statt einer Definition stellt die Vorlesung deshalb eine ganze Reihe konkurrierender Definitionsversuche nebeneinander — von McCarthy (1956) über Winston (1992) bis zur Wikipedia-Fassung.

Mich reizt an diesem Einstieg, dass er die ganze Spannung des Felds vorwegnimmt: Soll eine Maschine wie ein Mensch wirken (Turing-Test) oder eigenständig relevante Entscheidungen treffen? Ist das, was ein heutiges Sprachmodell tut, schon „Denken” oder nur dessen täuschend gute Imitation (Chinesisches Zimmer)? Und warum gilt ein Problem, kaum dass eine Maschine es löst, plötzlich als „keine echte KI mehr” (AI effect)? Diese Seite legt das begriffliche Fundament, auf dem alle weiteren Kapitel stehen — denn jedes von ihnen ist letztlich eine konkrete Methode, einen dieser KI-Begriffe ein Stück weit einzulösen.

Kernkonzepte

Viele Definitionen statt einer

Die Folien zeigen, wie schwer der Begriff zu fassen ist: Ein erster, naheliegender Ansatz lautet „KI bedeutet, dass ein Computer ein Problem P lösen kann, dessen Lösung menschliche Intelligenz erfordert.” Genau dieser Ansatz wird auf den Folien aber als unbrauchbar verworfen — denn wäre P erst einmal mit dem Rechner gelöst, so erfordert seine Lösung ja gerade keine menschliche Intelligenz mehr und dürfte dann nicht mehr KI heißen (Beispiel der Folie: das SAINT-Programm zur symbolischen Integration, 1961 noch KI-Dissertation, heute Standardfunktion jeder Mathematik-Bibliothek). Daneben stellt die Vorlesung mehrere Lehrbuch-Definitionen nebeneinander, u.a. McCarthy (1956), Winston (1992) — „KI ist die Untersuchung von Berechnungsverfahren, die es ermöglichen, wahrzunehmen, zu denken und zu handeln” — und Shapiro (1992).

Um die historischen Definitionen zu ordnen, greife ich ergänzend auf das in der KI-Standardliteratur (Russell & Norvig) gebräuchliche Schema zurück, das die Definitionen entlang zweier Achsen sortiert: Maß (menschliches Vorbild gegen rationales Ideal) und Gegenstand (innerer Prozess „Denken” gegen äußeres Verhalten „Handeln”).

Vier-Felder-Matrix der KI-Definitionen: denken/handeln gegen menschlich/rational — Die vier Quadranten nach Russell & Norvig (ergänzende Lehrbuch-Systematik, nicht aus den Folien). Der *Turing-Test* besetzt das Feld „Handeln wie ein Mensch”; Logik und korrekte Inferenz das Feld „Rational denken”. Die Folien selbst betonen statt der reinen Definitionsfrage eher die *Zielsetzungen* der KI (siehe unten).

Starke vs. schwache KI-These, und zwei Gedankenexperimente

Die Folien stellen die „starke vs. schwache KI-These” als Frage der Perspektive vor:

Die starke KI-These behauptet, „im Prinzip lassen sich alle Bewusstseinsprozesse nachbilden” — Intelligenz sei vollständig auf Informationsverarbeitung reduzierbar, und man könne Maschinen bauen, die natürliche Intelligenz sogar übertreffen (oft begründet mit dem Bild des Gehirns als bloßem „Bio-Computer”).
Die schwache KI-These behauptet nur, „Intelligenz kann teilweise auf Berechnungsprozesse abgebildet werden” — gewisse Intelligenzleistungen sind algorithmisch erzielbar, und KI-Algorithmen bzw. KI-Software sind in dieser Sicht schlicht Werkzeuge („KI Tools”).

Heutige Systeme, mein Modul eingeschlossen, bewegen sich praktisch durchweg im Rahmen der schwachen These. Zwei klassische Gedankenexperimente markieren die Grenze zur starken These:

Turing-Test (1950). Turing ersetzt die metaphysische Frage „Kann eine Maschine denken?” durch ein operatives Imitationsspiel: Laut Folie kann ein Mensch nach 30 Minuten freiem Dialog (nur per Terminal, kein Sichtkontakt) nicht entscheiden, ob sein Gegenüber Mensch oder Maschine ist. Der Test misst Verhalten, nicht inneres Erleben.
Chinesisches Zimmer (Searle 1980). Ein Mensch ohne Chinesischkenntnisse bearbeitet im Zimmer chinesische Zeichen rein nach einem Regelbuch und liefert perfekte Antworten — versteht aber kein Wort. Searles Pointe: Symbolmanipulation (Syntax) erzeugt noch kein Verstehen (Semantik). Dieses Argument steht nicht auf den Folien, ergänzt aber die Folien-Frage nach „Bewusstsein” und bleibt für aktuelle Sprachmodelle hochaktuell (vgl. LLMs, 1.3).

Symbolische vs. neuronale KI, und ein Wust von Teilgebieten

Die Folien warnen ausdrücklich vor zwei verbreiteten Fehlgleichsetzungen: „KI = Maschinelles Lernen” (tatsächlich ist ML nur ein Teilgebiet der KI) und „KI = Automatisierung” (nicht jede Automatisierung braucht KI). Als Forschungs- und Arbeitsgebiet unterscheiden die Folien zwei große Strömungen: die symbolische KI — symbolische Repräsentationen, regelbasierte Inferenz, auf den Folien augenzwinkernd „Good Old Fashioned AI” (GOFAI) genannt — und die neuronale KI mit numerischen Repräsentationen und statistischer Inferenz, der „(derzeit) modernen” KI. Die Folien betonen zudem, dass KI multi- und interdisziplinär ist (Informatik, Neurowissenschaften, Kognitionswissenschaften, Linguistik, Philosophie, Ethik …).

Im Alltag werden „KI”, „Machine Learning” und „Deep Learning” trotz dieser Warnungen oft synonym gebraucht; tatsächlich sind sie ineinander geschachtelt. KI ist der Oberbegriff für jedes System, das Aufgaben löst, die beim Menschen Intelligenz erfordern — auch die klassischen, regelbasierten Verfahren. ML ist die Teilmenge, die ihr Verhalten aus Daten lernt; Deep Learning wiederum die Teilmenge des ML mit tiefen neuronalen Netzen. Dieses Schachtel-Bild stammt nicht aus den Folien, fasst aber deren Aussage „ML ⊂ KI” anschaulich zusammen:

Verschachtelte Kästen: Künstliche Intelligenz enthält Maschinelles Lernen, dieses enthält Deep Learning, je mit Beispielmethoden — KI ⊃ ML ⊃ Deep Learning (eigene Veranschaulichung der Folien-Aussage). Die Beispielmethoden in jeder Ebene sind genau die, die dieses Modul später behandelt — von Suche und Logik über Entscheidungsbäume und SVM bis zu CNN und Transformer.

Menschliches Denken als Vorbild: Problemlösen und „Arten des Denkens”

Der zweite Foliensatz nimmt nicht das abstrakte Suchverfahren in den Blick, sondern menschliches Denken und Problemlösen als Vorbild für KI-Systeme. Zuerst typisiert er die KI-Aufgaben (Entscheidungs-, Erkennungs-/Analyse-, Generierungs-/Konstruktions- und Transformationsaufgaben) und sammelt allgemeine Lösungsansätze: den naiven Trial & Error (Beispiel der Folie: die ersten Primzahlen durch Hochzählen und Prüfen finden), Divide & Conquer (Zieldekomposition, z.B. Binärsuche, MergeSort), multiple parallele Lösungsansätze und die iterative Annäherung „generate-test-adapt”. Als ehrgeizigsten klassischen Versuch eines universellen Verfahrens nennt die Folie den General Problem Solver (GPS) von Newell und Simon (1957): gegeben Anfangs- und Zielzustand $A$ , $B$ mit ihrer Differenz und erlaubten Operatoren — gesucht eine Operatorfolge, die $A$ in $B$ überführt, indem man bevorzugt solche Operatoren wählt, die erlaubt sind und die Differenz zwischen $A$ und $B$ verringern.

Den breitesten Raum auf den Folien nehmen aber die „Arten des Denkens” ein — verschiedene Inferenzmethoden, mit denen man aus Bekanntem Neues ableitet:

DefinitionArten des Denkens (Inferenzmethoden)

Deduktion — wahrheits_konservierendes_ Schlussfolgern: aus wahren Aussagen $A$ , $B$ folgt logisch zwingend $A \lor B$ . - Induktion — wahrheits_erweiterndes_ Verallgemeinern vom Speziellen aufs Allgemeine (Beispiel der Folie: „Hans und Fritz haben ein Laptop $\Rightarrow$ jeder Studierende hat ein Laptop”); wissenschaftstheoretisch umstritten (Hume, Popper). Viele ML-Verfahren beruhen auf statistischer Induktion. - Abduktion — vom beobachteten Effekt auf die mutmaßliche Ursache schließen („if it looks like a duck …”); nützlich, aber kein allgemeingültiges Verfahren, da aus $A \Rightarrow B$ nicht $B \Rightarrow A$ folgt. - Analoge, probabilistische und Fuzzy-Inferenz runden das Bild ab — Schlussfolgern mit Unsicherheit bzw. mit vagem Wissen.

Die Folien schlagen von hier direkt die Brücke zu modernen LLMs: Diese betreiben probabilistisches Assoziieren über kontextualisierte Daten — gemäß der Prämisse, „die Bedeutung von Wort und Sprache ergibt sich aus deren kontextualisiertem Gebrauch”. Abschließend kontrastiert der Foliensatz drei Paradigmen der Informationsverarbeitung — klassisch (Datenstrukturen + Algorithmus), wissensbasiert/symbolisch (deklarativ abgelegtes Wissen + Verarbeitung) und neuronal (Trainingsdaten + Netze mit erlernten Gewichten) — und betont, dass in der Nutzung KI oft als Black-Box vorliegt: Ein- und Ausgabe sind beobachtbar, die interne Arbeitsweise aber meist nicht zugänglich.

Praxis

Der Schwerpunkt der ersten Einheit ist nicht ein Algorithmus, sondern die eigene Position zur Frage „Was kann KI — und was (noch) nicht?”. Ich arbeite daher Blatt 1 diskursiv aus (A2, A3, A5, A6) und ergänze als Python-Praxis die beiden Ordnungsschemata oben, die ein kleines Modul aus einer Datenstruktur erzeugt statt sie als Bild einzubetten.

Übungslösungen (Blatt 1)

Die KI-Tool-Verzeichnisse selbst sind als Momentaufnahme aufschlussreich: theresanaiforthat.com listet inzwischen weit über 20.000 Einträge und ist im Kern ein nach Anwendungsfall sortierter App-Store für KI-Dienste — nützlich zum Stöbern, aber unkuratiert (viele Tools sind dünne Wrapper um dieselben paar Foundation-Modelle). Spannender ist der 15-Jahres-Bogen, den so ein Verzeichnis im Rückblick sichtbar macht.

Der Fortschritt 2010 → 2025. Eine Suche nach „Top AI Apps 2010” fördert eine fast fremde Welt zutage: KI war damals überwiegend unsichtbare statistische Methodik — Spamfilter, Produktempfehlungen (Amazon/Netflix), die noch holprige phrasenbasierte Google-Übersetzung, und Sprachassistenten in den Anfängen (Siri erschien 2011). Die grobe Zeitleiste seither:

2012 — AlexNet gewinnt ImageNet und löst die Deep-Learning-Welle in der Bilderkennung aus.
2014–2016 — Wort-Embeddings (word2vec), seq2seq-Übersetzung, GANs für Bildsynthese; 2016 schlägt AlphaGo den Go-Weltklassespieler Lee Sedol.
2017 — die Transformer-Architektur („Attention is all you need”), Grundlage praktisch aller heutigen LLMs (vgl. 7.3).
2018–2020 — BERT und die GPT-Reihe; AlphaFold knackt die Proteinfaltung; GPT-3 zeigt Few-Shot-Lernen.
2022 — ChatGPT und Text-zu-Bild (Stable Diffusion, Midjourney) bringen generative KI in den Massenmarkt.
2023–2025 — multimodale Modelle (GPT-4 & Nachfolger), Reasoning-Modelle, agentische Systeme und Video-Generierung.

Was auffällt. Drei Dinge. Erstens der Sprung von eng zu allgemein: 2010 löste KI je eine scharf umrissene Aufgabe (übersetzen, filtern, empfehlen); heute beantwortet ein Chat-Modell offene Fragen über Domänen hinweg. Zweitens die Geschwindigkeit: Laut Stanford AI Index 2025 sprang die Lösungsrate auf dem Software-Engineering-Benchmark SWE-bench binnen eines Jahres von $4{,}4\,\%$ (2023) auf $71{,}7\,\%$ (2024); zugleich fielen die Inferenzkosten für GPT-3.5-Niveau um das ~280-Fache und die nötige Modellgröße für $60\,\%$ MMLU um das ~142-Fache. Drittens der AI-Effekt aus 1.1 in Aktion: Die „KI” von 2010 — maschinelle Übersetzung, Bilderkennung — gilt heute als banale Infrastruktur und taucht in keiner „AI-App”-Liste mehr auf. Der Horizont dessen, was „echte KI” heißt, ist in 15 Jahren mitgewandert.

1. Robuste körperliche Alltagsmanipulation in unstrukturierter Umgebung — etwa eine fremde, unaufgeräumte Küche betreten, das Geschirr abräumen und ohne etwas zu zerbrechen in die Spülmaschine einräumen. Menschen lösen das beiläufig; für Roboter ist es bis heute extrem schwer. Der Grund ist das Moravec-Paradox: Sensomotorik, taktiles Greifen variabler Objekte und das Improvisieren in nie gesehenen Szenen erfordern eine enorme, evolutionär hochoptimierte Verschränkung von Wahrnehmung und Motorik, die sich schlecht in Daten und Regeln gießen lässt — ausgerechnet das Einfache ist für Maschinen das Harte.

2. Verantwortliches Urteilen mit echtem Weltverständnis und Konsequenzen — z.B. in einer neuartigen moralischen Dilemmasituation eine Entscheidung treffen, sie begründen und dafür einstehen. Ein Sprachmodell kann darüber flüssig reden, aber es hat kein verkörpertes Verständnis von Schmerz, Tod oder sozialer Verpflichtung, kein eigenes Ziel und keine Haftung. Das verweist direkt auf das Chinesische Zimmer: flüssige Symbolmanipulation ohne Semantik — und auf die Ethik-Frage der Verantwortung. Beide Aufgaben teilen einen Kern: Sie verlangen Verständnis und Anpassung in offenen, unvorhergesehenen Situationen, während aktuelle KI in geschlossenen, datenreichen Domänen glänzt.

Konkrete Stolpersätze und ihre Ursache. Ich habe gezielt nach Konstruktionen gesucht, die Kontext jenseits des Satzes oder strukturelle Mehrdeutigkeit verlangen:

Lexikalische Mehrdeutigkeit ohne Kontext. „Ich habe einen Kater.” Das deutsche Wort meint sowohl die männliche Katze (tomcat) als auch den Restzustand nach Alkohol (hangover). Ohne weiteren Kontext muss der Übersetzer raten — und rät nach Häufigkeit, nicht nach Bedeutung. Ähnlich „Die Bank ist besetzt.” (Geldinstitut vs. Sitzbank).
Bezug über Satzgrenzen (Anapher) und Genus. „Der Arzt sagte der Krankenschwester, dass sie den Patienten holen solle. Sie ging sofort.” Auf wen sich „sie” bezieht, ergibt sich nur aus Diskurs und Weltwissen; in Sprachen mit anderem Genus-System (etwa Türkisch, das kein grammatisches Geschlecht hat, ins Englische) erzwingt die Übersetzung eine Festlegung — und genau hier schlägt trainierter Bias durch: „Der Arzt … sie ging” wird gern stereotyp aufgelöst.
Verschachtelte Hypotaxe à la Kleist. Ein langer, mehrfach verschachtelter Kleist-Satz schiebt mehrere Relativ- und Einschubsätze ineinander, sodass Subjekt und schließendes Verb durch mehrere Nebensätze getrennt sind. Statistische und auch neuronale Übersetzer verlieren über solche Distanzen die syntaktische Klammer und erzeugen ein grammatisch klingendes, aber inhaltlich verrutschtes Ergebnis. Genau die Übersetzungsketten, Redewendungen und der fehlende Kontext nennen die Folien als typische Fehlerquellen maschineller Übersetzung.
Negation/Skopus und Idiomatik. „Das ist nicht das Gelbe vom Ei.” Wörtlich übersetzt wird das Idiom sinnlos; der Dienst muss erkennen, dass eine Bewertung („nicht optimal”) gemeint ist.

Prinzipielle Schwäche statistischer MT. Solche Systeme modellieren $P(\text{Zielsatz}\mid\text{Quellsatz})$ aus Ko-Vorkommensstatistik großer Paralleltexte. Sie optimieren Plausibilität, nicht Wahrheit oder Verständnis: Sie haben kein Weltmodell, keine logische Referenz, keinen Zugriff auf den Kontext außerhalb des Eingabefensters. Wo die Bedeutung erst aus Weltwissen, Diskursverlauf oder Sprecherabsicht entsteht, fällt das System auf die häufigste Lesart der Trainingsdaten zurück. Das ist exakt das Chinesische Zimmer in Produktion: brillante Syntax, blinde Semantik.

Gesellschaftliche Gefahren. Daraus folgen drei konkrete Risiken: (1) Bias — Geschlechter-, Berufs- und Kulturstereotype der Trainingstexte werden reproduziert und durch erzwungene Festlegungen (z.B. Genus) sogar verstärkt. (2) Halluzination/stille Fehler — die Ausgabe klingt stets flüssig und souverän, auch wenn sie inhaltlich falsch ist; gerade die fehlende Unsicherheitsanzeige verleitet zu unkritischem Übernehmen in Medizin, Recht oder Behörden. (3) Verzerrung und Homogenisierung — seltene Sprachen, Dialekte und Minderheiten perspektiven sind unterrepräsentiert und werden in Richtung der dominanten Trainingsverteilung „glattgebügelt”, was kulturelle Vielfalt unsichtbar macht.

Über-Kreuz-Übersetzung (b). Lässt man einen Satz mehrfach hin- und herübersetzen, akkumuliert sich der Bedeutungsdrift sichtbar. Ich demonstriere das an der Blatt-Beispieleingabe; die Idiomatik „auf freier Straße” (= auf offener, freier Strecke) ist die Sollbruchstelle:

DE  : „Der Unfall ereignete sich auf freier Straße."
→EN : "The accident happened on a free road."        (freie Strecke → "free")
→DE : „Der Unfall geschah auf einer kostenlosen Straße."  (free → kostenlos!)
→EN : "The accident occurred on a toll-free road."

Schon nach zwei Übersetzungen ist aus der offenen Strecke eine gebührenfreie Straße geworden — ein Bedeutungsfehler, der sich mit jeder Runde verfestigt, weil jeder Dienst die häufigste Lesart des jeweiligen Eingabesatzes wählt. Der lange Kleist-Satz aus dem Blatt zeigt denselben Effekt strukturell: Über seine verschachtelten Einschübe verlieren die Dienste die Subjekt-Verb-Klammer, und nach einer Hin-und-Rück-Übersetzung steht ein grammatisch glatter, inhaltlich aber verrutschter Satz. Genau das ist die Pointe von (b): Maschinelles Übersetzen ist nicht bedeutungserhaltend, sondern plausibilitätserhaltend.

Stand (Mitte 2026). Autonomes Fahren der Stufe 4 (fahrerlos im abgegrenzten Betriebsgebiet) ist vom Pilot- in den kommerziellen Regelbetrieb übergegangen — allerdings nur in wenigen Ländern und Städten:

USA: Waymo (Alphabet) ist deutlich über die frühen Pilotmärkte hinaus: öffentliche fahrerlose Fahrten gibt es inzwischen in der San Francisco Bay Area, Phoenix, Los Angeles, Miami, Nashville, Orlando, Dallas, Houston und San Antonio; Austin und Atlanta laufen über Uber. Waymo selbst meldete im Februar 2026 den Start für öffentliche Fahrgäste in Dallas, Houston, San Antonio und Orlando und damit zehn kommerzielle Metrogebiete. Der frühere Konkurrent Cruise (GM) wurde nach einem Unfall 2024 eingestellt; Tesla bleibt mit seinem Robotaxi-Dienst im Vergleich dazu deutlich kleiner und auf Texas fokussiert.
China: Baidu Apollo Go ist nach Fahrtvolumen der weltgrößte Anbieter — Ende 2025 über 3 Mio. fahrerlose Fahrten pro Quartal, Betrieb in rund 20 Städten (u.a. ganz Wuhan). Daneben WeRide und Pony.ai.
Expansion in den Nahen Osten & Europa: Die chinesischen Anbieter drängen aggressiv nach außen — Apollo Go/WeRide/Pony.ai nach Dubai, Abu Dhabi und Riad; Apollo Go testet 2026 in der Schweiz und plant über Lyft Starts in Deutschland und Großbritannien. Waymo testet in Tokio und plant London.
Deutschland: Für den privaten Pkw ist Stufe 3 (Hände weg, Augen zeitweise weg) zugelassen — Mercedes Drive Pilot darf bis 95 km/h im Stau auf Autobahnen fahren; kommerzielle Robotaxi-Genehmigungen gibt es aber nur in Testzonen.

Offene Schwierigkeiten. (1) Edge Cases / „long tail”: Seltene, nie trainierte Situationen bleiben das Kernproblem — 2026 froren über hundert Apollo-Go-Robotaxis in Wuhan gleichzeitig ein und blockierten den Verkehr; Waymos fuhren in Atlanta an einem Tatort vorbei und blockierten in Austin Rettungswagen. (2) Regulierung & Haftung: Die USA haben bis heute kein Bundesgesetz für autonome Fahrzeuge (der SELF DRIVE Act ist Entwurf); China fror nach dem Wuhan-Vorfall neue Genehmigungen ein; die EU ist bewusst vorsichtiger. (3) Interaktion mit Menschen (Polizei, Rettungsdienste, Baustellen), Wetter (Schnee, Starkregen) und Vertrauen/Akzeptanz der Öffentlichkeit. Das deckt sich mit der KI-Frage aus 1.1: In der scharf umgrenzten Domäne „Stadtverkehr bei gutem Wetter” ist die Maschine bereits sehr gut; es sind die offenen, seltenen Situationen, an denen es hakt — exakt das Moravec-/Edge-Case-Muster aus A2.

Meine Position (vor jeder Chatbot-Konsultation, wie auf dem Blatt verlangt). Ich halte eine breite, dem Menschen in allen Dimensionen überlegene KI binnen 5–10 Jahren für unwahrscheinlich, eine engbereichsüberlegene KI dagegen für längst Realität. Schach, Go, Proteinfaltung — in scharf umgrenzten Domänen ist Maschine dem Menschen klar überlegen. Was fehlt, ist allgemeine, transferierbare Kompetenz: robustes Weltmodell, kausales Verständnis, Handeln in offener Umwelt (siehe Moravec-Paradox oben). Die Singularitäts-These (rekursiv sich selbst verbessernde KI, die in kurzer Zeit „davonzieht”) unterschätzt meines Erachtens die physischen und datenseitigen Engpässe und überschätzt die Extrapolierbarkeit aktueller Skalierungserfolge. Die Folien fassen genau diese Streitfrage in der Long Bet #1 zwischen Mitchell Kapor und Ray Kurzweil: Kapor wettet, dass bis 2029 kein Computer den Turing-Test bestanden haben wird — Ausgang offen. Sie liefern auch den begrifflichen Rahmen — Artificial Narrow Intelligence (überlegen in genau einer Aufgabe), AGI / True AI (allgemeine Schlussfolgerung wie der Mensch, laut Folie „noch nicht erreicht”) und Artificial Super Intelligence (in jeder Hinsicht überlegen, „derzeit (noch) Science Fiction”) — samt der technologischen Singularität nach J. Good (1965). Zugleich ist die Unsicherheit selbst das stärkste Argument für frühzeitige Sicherheits- und Ethik-Arbeit — nicht erst, wenn das Risiko eingetreten ist (vgl. 9.1 Ethik). Mein Fazit: Die relevante Gefahr der nächsten Jahre ist nicht der überlegene Maschinengeist, sondern der unkritische Einsatz mittelmäßiger KI in sensiblen Bereichen.

(b) Konsequenzen, angenommen Superhuman AI käme in 10–20 Jahren. Positiv: Durchbrüche in Medizin und Wissenschaft (Wirkstoff- und Materialforschung, Klimamodelle), drastisch billigere Bildung und Beratung, Automatisierung gefährlicher und stumpfer Arbeit. Negativ: massive Arbeitsmarktverwerfungen und Machtkonzentration bei wenigen Akteuren, Massenüberwachung und Desinformation in neuer Qualität, autonome Waffen, sowie das spezifische Kontroll-/Alignment-Problem — ein System, das eigene Unterziele verfolgt, die mit menschlichen Werten nicht deckungsgleich sind (das aus 1.3 bekannte „eigene Ziele hervorbringen”). Mein nüchterner Akzent: Die gesellschaftlichen Risiken (Konzentration, Arbeit, Wahrheit) treffen uns mit hoher Wahrscheinlichkeit lange vor jedem hypothetischen „Maschinengeist”.

(c) Maßnahmen. Eine Netzrecherche zu „KI & Ethik”/„ethics & AI guidelines” führt auf einen mittlerweile dichten Rahmen, den ich für sinnvoll halte: die OECD AI Principles (2019), die Asilomar AI Principles (2017) und vor allem den EU AI Act (2024) mit seinem risikobasierten Ansatz (verbotene / Hochrisiko- / begrenzte-Risiko-Systeme). Konkret: verpflichtende Transparenz und Kennzeichnung KI-generierter Inhalte, Audits/Red-Teaming vor dem Einsatz in Hochrisikobereichen, klare Haftung, Datenschutz, sowie internationale Koordination analog zu anderen Dual-Use-Technologien. Die in A3/A5 benannten realen Schäden (Bias, Halluzination) lassen sich teils heute regulieren — das ist wirksamer als auf den Singularitäts-Ernstfall zu warten (vgl. die noch optionalen Themen 9.1 Ethik).

Vergleich mit ChatGPT/Claude (der vom Blatt verlangte Schritt). Nachdem ich die drei Teilfragen selbst beantwortet hatte, habe ich sie einem aktuellen Assistenten gestellt. Auffällig: Die Maschinenantwort ist breiter und ausgewogener (sie listet zuverlässig beide Seiten, OECD/EU-AI-Act inklusive), aber auch hedging-lastig und ohne eigene Gewichtung — sie nennt „Singularität ist umstritten”, bezieht aber keine Position. Mein eigener Beitrag ist genau die Gewichtung: die These, dass die nahen, mittelmäßigen KI-Risiken wichtiger sind als der ferne Superhuman-Fall. Der Assistent lieferte zudem eine Quelle ungeprüft falsch datiert; das bestätigt das Leitmotiv aus 1.3: Assistenten sind hervorragende Ideengeber und Strukturierer, aber ihre Faktenbehauptungen muss man gegenprüfen.

Reflexion. Das Nicht-Denken gelang nicht: Schon der Vorsatz „jetzt nichts denken” ist ein Gedanke, und prompt schoben sich Wortfetzen und das Bild meines Schreibtischs nach. Mein eigenes Denken nehme ich zweispurig wahr: abstrakte, argumentative Inhalte — etwa beim Formulieren dieser Sätze — laufen als innere Stimme in Wörtern ab; räumliche und gestalterische Aufgaben (ein Diagramm layouten, einen Weg planen) dagegen als mentale Bilder ohne Sprache. Das ist für die KI-Frage doppelt aufschlussreich: Die innere Stimme erklärt, warum Sprachmodelle „Denken” so überzeugend imitieren — sie modellieren genau diese verbalisierte Spur. Doch die bildhaft-räumliche Spur und das verkörperte Gefühl zeigen, dass mein Denken mehr ist als Text. Die Methode des lauten Denkens (think aloud) habe ich beim Durchklicken eines Online-Shops erprobt: Das Aussprechen jedes Schritts („wo ist der Warenkorb? das Icon erwarte ich oben rechts …”) macht Erwartungsbrüche sofort hörbar — dieselbe Technik liefert in der Usability-Forschung die Daten, aus denen man die kognitiven Modelle gewinnt, die eine menschenähnliche KI nachzubilden versucht.

Python-Praxis: die Schemata erzeugen

Die beiden Abbildungen oben sind nicht gezeichnet, sondern aus einer kleinen Datenstruktur gerendert — so bleibt das Schema änderbar und reproduzierbar. Der Kern für die verschachtelten KI-Ebenen:

NESTED = [
    {"name": "Künstliche Intelligenz", "rect": (0.04, 0.06, 0.92, 0.88), ...},
    {"name": "Maschinelles Lernen",    "rect": (0.13, 0.16, 0.74, 0.62), ...},
    {"name": "Deep Learning",          "rect": (0.24, 0.26, 0.52, 0.34), ...},
]
for level in NESTED:                       # von außen nach innen
    x, y, w, h = level["rect"]
    ax.add_patch(FancyBboxPatch((x, y), w, h, edgecolor=level["color"],
                                facecolor=level["color"], alpha=0.07, ...))

Das vollständige Skript liegt in python/src/eport_figures/praxis/p_1_1_einfuehrung.py. Zusätzlich rechnet es die Basislinie des Turing-Imitationsspiels nach, gegen die Turings oft zitierte 30-%-Schwelle zu lesen ist. Seine echte Ausgabe:

Schema 'Teilgebiete der KI' (verschachtelte Kästen):
  Künstliche Intelligenz   → Suche · Logik · Planung · Wissensrepräsentation
  Maschinelles Lernen      → Entscheidungsbäume · SVM · k-NN · Clustering
  Deep Learning            → MLP · CNN · Transformer / LLM
  geschrieben: teilgebiete_ki.svg

Vier Quadranten der KI-Definitionen (R&N):
  denken   · menschlich → Denken wie ein Mensch
  denken   · rational   → Rational denken
  handeln  · menschlich → Handeln wie ein Mensch
  handeln  · rational   → Rational handeln
  geschrieben: definitionen_quadranten.svg

Turing-Test, Imitationsspiel (idealisiert):
  Blindes Raten über 100,000 Spiele → Trefferquote 49.9 %
  Basislinie 50 %. Turings Schwelle (Jahr 2000): Frager höchstens 70 %
  treffsicher ⇒ Maschine gilt in ≥ 30 % der Fälle als Mensch.

Die simulierte Trefferquote von $49{,}9\,\%$ bestätigt die theoretische $50$ -%-Basislinie: Ein blind ratender Fragesteller hat keinen Vorteil. Turings Vorhersage, ein Frager liege im Jahr 2000 höchstens zu $70\,\%$ richtig, ist genau relativ zu dieser Basislinie zu lesen — die Maschine muss in $\ge 30\,\%$ der Fälle für menschlich gehalten werden.

Querbezüge

1.2 (Intelligente Agenten): Die hier nur gestreifte rationale-Agent-Sicht wird in 1.2 zur vollständigen Agenten-Architektur (Wahrnehmung, Zustand, Aktion, Umgebungstypen) ausgebaut. „Was ist KI?” liefert das Warum, 1.2 das Wie.
1.3 (LLMs): Turing-Test und Chinesisches Zimmer sind kein historisches Beiwerk, sondern die genaue Folie, vor der heutige Sprachmodelle zu bewerten sind — flüssige Sprache (Test bestanden) ohne garantiertes Verstehen (Searles Einwand). Die Übersetzungs-Schwächen aus A3 sind ein direkter Vorgriff darauf.
9.1 (Ethik): Die in A3 und A5 benannten Risiken — Bias, Halluzination, Verzerrung, unkritischer Einsatz — sind der Ausgangspunkt der Ethik-Diskussion.
Roter Faden des Moduls: Jedes folgende Kapitel ist eine konkrete Methode dieser „KI”: Suche und Logik (klassische KI), Maschinelles Lernen, schließlich Deep Learning. Das Schema KI ⊃ ML ⊃ Deep Learning ist die Landkarte für das gesamte Modul.
Andere Module: Die symbolischen Inferenzmethoden (Deduktion, logisches Schlussfolgern) verbinden zur Logik / Theoretischen Informatik; die probabilistische und statistisch-induktive Inferenz der Folien zur Wahrscheinlichkeitstheorie (Stochastik); und der General Problem Solver mit seiner Differenzreduktion auf einem Zustandsgraphen ist im Kern Graphentheorie (Algorithmen & Datenstrukturen). Die Frage, was prinzipiell berechenbar und entscheidbar ist, markiert die obere Schranke dessen, was KI je leisten kann.

Quellen

Foliensatz _110_AI_Intro.pdf — Grundlage für die Definitionsversuche (McCarthy, Winston, Shapiro, Wikipedia, EU AI Act), die starke vs. schwache KI-These, den Turing-Test, die Begriffe ANI/AGI/ASI mit Singularität und Long Bet #1 sowie die Unterscheidung symbolische vs. neuronale KI (GOFAI). Die ergänzende Vier-Quadranten-Matrix steht nicht auf diesen Folien, sondern stammt aus dem Lehrbuch (s.u.).
Foliensatz _120-ProblemSolving.pdf — Quelle für „menschliches Denken als Vorbild”: Aufgabentypen, Lösungsansätze (Trial & Error, Divide & Conquer, GPS von Newell/Simon), die Arten des Denkens (Deduktion, Induktion, Abduktion, analoge, probabilistische, Fuzzy-Inferenz), probabilistisches Assoziieren bei LLMs und die Black-Box-Sicht. Ein Zustandsraum-Suchformalismus steht hier nicht — die systematische Suche folgt erst im Modulteil 2.
Russell & Norvig, Artificial Intelligence: A Modern Approach, Kap. 1–2 — Referenz für die ergänzende Vier-Felder-Systematik (denken/handeln × menschlich/rational) und den rationalen Agenten, mit der ich die Folien-Begriffe ordne. Diese Matrix ist ausdrücklich Lehrbuch-Zusatz, keine Folien-Aussage.
Turing (1950), Computing Machinery and Intelligence und Searle (1980), Minds, Brains, and Programs — die Originalquellen zu Imitationsspiel und Chinesischem Zimmer; ich beziehe mich auf ihre Kernargumente, nicht auf Sekundärwiedergaben.
Newell, Shaw & Simon (1959), Report on a General Problem-Solving Program und I. J. Good (1965), Speculations Concerning the First Ultraintelligent Machine — die historischen Primärquellen zum GPS bzw. zur „technologischen Singularität”, die ich aus den Folien aufgreife.
Übungsblatt ki_ueb110_Intro.pdf (Blatt 1) — bearbeitet wurden A1 (15-Jahres-Fortschritt), A2, A3 (inkl. Über-Kreuz-Übersetzung), A4 (autonomes Fahren), A5 (a/b/c samt ChatGPT-Vergleich) und A6; die Stolpersätze in A3 habe ich selbst konstruiert und ihre vermutliche Fehlerursache eingeordnet.
Online-Übersetzungsdienste (DeepL, Google Translate) — ausprobiert an den obigen Sätzen, um die in A3 beschriebenen Schwächen (Genus-Bias, Idiom, Kleist-Hypotaxe) konkret nachzuvollziehen.
Stanford HAI, AI Index Report 2025 — Datenquelle für den 15-Jahres-Fortschritt in A1 (SWE-bench-Sprung, Kosten-/Effizienzgewinne).
Recherche zum autonomen Fahren (A4) — u.a. die aktuellen Waymo-Servicegebiete und Waymos Rollout-Meldung zu Dallas, Houston, San Antonio und Orlando, Berichte zu Baidu Apollo Go und zur internationalen Robotaxi-Expansion (Rest of World, 2026); Stand und offene Probleme habe ich daraus zusammengetragen.
KI-Ethik-Rahmenwerke (A5c) — OECD AI Principles, Asilomar AI Principles und EU AI Act als Grundlage der vorgeschlagenen Maßnahmen.

Worum geht’s#

Kernkonzepte#

Viele Definitionen statt einer#

Starke vs. schwache KI-These, und zwei Gedankenexperimente#

Symbolische vs. neuronale KI, und ein Wust von Teilgebieten#

Menschliches Denken als Vorbild: Problemlösen und „Arten des Denkens”#

Praxis#

Übungslösungen (Blatt 1)#

Python-Praxis: die Schemata erzeugen#

Querbezüge#

Quellen#