Maschinelles Lernen ist die Untersuchung von Programmen, die ihre Leistung bei einer bestimmten Aufgabe automatisch verbessern können, und war von Anfang an ein Teil der KI.
Es gibt verschiedene Arten des maschinellen Lernens. Unüberwachtes Lernen analysiert einen Datenstrom und findet Muster und macht Vorhersagen ohne weitere Anleitung. Überwachtes Lernen erfordert, dass ein Mensch die Eingabedaten zuerst kennzeichnet, und es gibt zwei Hauptvarianten: Klassifizierung (bei der das Programm lernen muss, vorherzusagen, zu welcher Kategorie die Eingabe gehört) und Regression (bei der das Programm eine numerische Funktion auf der Grundlage einer numerischen Eingabe ableiten muss).
Beim Verstärkungslernen wird der Agent für gute Antworten belohnt und für schlechte bestraft. Der Agent lernt, Antworten zu wählen, die als "gut" eingestuft werden. Transferlernen bedeutet, dass das aus einem Problem gewonnene Wissen auf ein neues Problem angewandt wird. Deep Learning ist eine Art des maschinellen Lernens, bei dem die Eingaben durch biologisch inspirierte künstliche neuronale Netze für alle diese Arten des Lernens laufen.
Zu den modernen Deep-Learning-Techniken für NLP gehören Word Embedding (Darstellung von Wörtern, typischerweise als Vektoren, die ihre Bedeutung kodieren), Transformers (eine Deep-Learning-Architektur, die einen Aufmerksamkeitsmechanismus verwendet), und andere. Im Jahr 2019 begannen generative vortrainierte Transformer (oder "GPT") Sprachmodelle, kohärenten Text zu generieren, und bis 2023 waren diese Modelle in der Lage, bei der Anwaltsprüfung, dem SAT-Test, dem GRE-Test und vielen anderen realen Anwendungen Ergebnisse auf menschlichem Niveau zu erzielen.
Maschinelle Wahrnehmung ist die Fähigkeit, aus dem Input von Sensoren (wie Kameras, Mikrofonen, drahtlosen Signalen, aktivem Lidar, Sonar, Radar und taktilen Sensoren) auf Aspekte der Welt zu schließen. Computer Vision ist die Fähigkeit, visuelle Eingaben zu analysieren.
Kismet, ein Roboterkopf, der in den 1990er Jahren hergestellt wurde; eine Maschine, die Emotionen erkennen und simulieren kann.
Affective Computing ist ein interdisziplinärer Oberbegriff, der Systeme umfasst, die menschliche Gefühle, Emotionen und Stimmungen erkennen, interpretieren, verarbeiten oder simulieren. So werden beispielsweise einige virtuelle Assistenten so programmiert, dass sie sich unterhalten oder sogar humorvoll scherzen; dies lässt sie sensibler für die emotionale Dynamik menschlicher Interaktion erscheinen oder erleichtert auf andere Weise die Interaktion zwischen Mensch und Computer.
Dies führt jedoch dazu, dass naive Benutzer eine unrealistische Vorstellung von der Intelligenz bestehender Computeragenten haben. Zu den mäßigen Erfolgen im Zusammenhang mit affektivem Computing gehören die textuelle Stimmungsanalyse und, in jüngerer Zeit, die multimodale Stimmungsanalyse, bei der die KI die von einer videografierten Person gezeigten Affekte klassifiziert.
Eine Maschine mit künstlicher allgemeiner Intelligenz sollte in der Lage sein, eine Vielzahl von Problemen in einer Breite und Vielseitigkeit zu lösen, die der menschlichen Intelligenz ähnelt.
(Quelle: Wikipedia)