Im maschinellen Lernen bezeichnen Kernel-Methoden eine Klasse von Algorithmen zur Mustererkennung. Diese Methoden nutzen sogenannte Kernelfunktionen, welche eine Menge von bekannten Datenpunkten in einen höherdimensionalen Raum transformieren. In diesem neuen Raum sucht die Kernel-Methode nach einer Hyperebene, die die Datenpunkte korrekt klassifiziert. Die Abbildung zum Kernel-Trick veranschaulicht ein einfaches Beispiel. Eine besondere Eigenschaft der Kernelfunktionen ist, dass sie eine implizite Berechnung im höherdimensionalen Raum ermöglichen. Dadurch können Kernel-Methoden bei der Suche nach einer geeigneten Hyperebene hochdimensionale Räume verwenden, ohne die Rechenzeit signifikant zu erhöhen.[1] Bekannte Kernel-Methoden sind unter anderem Support Vector Machines, Gauß-Prozesse und die Kernel-PCA.

Formale Definition Kernel

Bearbeiten

Sei ein Eingaberaum. Eine Abbildung heißt Kernel, wenn es einen Skalarproduktraum und eine Abbildung in diesen Raum gibt mit .

heißt Featurespace oder Merkmalsraum, Featuremapping oder Merkmalsabbildung. Ein Kernel ist also eine Möglichkeit, das Skalarprodukt zweier Punkte im Merkmalsraum zu berechnen, ohne die potentiell sehr hochdimensionalen Repräsentationen , explizit ausrechnen zu müssen. Dieses Skalarprodukt im Merkmalsraum kann dann für Klassifizierungsalgorithmen wie Support Vector Machines verwendet werden.

In der Praxis muss der Featurespace nicht explizit bekannt sein, da Kernel durch den Satz von Mercer eine einfache Charakterisierung aufweisen.

Verschiedene Klassen von Kernel-Funktionen

Bearbeiten

Es gibt verschiedene Arten von Kerneln, die sich zum Teil über Parameter an die gegebene Problemstellung anpassen lassen:

  • lineare Kernel
  • polynomiale Kernel , mit einem freien Parameter
  • Radiale-Basisfunktion-Kernel (RBF) , wobei die Bandbreite ein freier Parameter ist
  • Fisher Kernel
  • Graph Kernel
  • Kernel Smoother
  • String Kernel
  • Neural Tangent Kernel
  • Neural Network Gaussian Process (NNGP) Kernel

Kernel-Trick

Bearbeiten

Bei Kernel-Methoden gibt es den Kernel-Trick, mit dem beispielsweise ein linearer Klassifikator erfolgreich auf nicht-linear trennbare Daten angewendet werden kann. Dies wird erreicht, indem die Daten in einen höherdimensionalen Raum transformiert werden, in dem eine bessere lineare Separierbarkeit erwartet wird (siehe Abbildung). Dieser Vorgang kann als eine Form des Feature-Engineering verstanden werden.

Gegeben seien die Abbildung und der Kernel . Dann kann eine SVM mit diesem Kernel K die roten und lila Datenpunkte durch eine Hyperebene trennen. Die zweidimensionalen Trainingspunkte werden durch in den dreidimensionalen Raum abgebildet, wo eine trennende Hyperebene leicht gefunden werden kann.

Literatur

Bearbeiten
  • Christopher M. Bishop: Pattern Recognition and Machine Learning. Information Science and Statistics, Springer-Verlag, 2008, ISBN 978-0387310732
  • Nello Cristianini, John Shawe-Taylor: Kernel Methods for Pattern Classification. Cambridge, 2004.
  • Bernhard Schölkopf, Alex Smola: Learning with Kernels. MIT Press, Cambridge, MA, 2002.
  • Thomas Hofmann, Bernhard Schölkopf, Alexander J Smola: Kernel methods in machine learning. In: Annals Statistics 36 (3) 2008: 1171–1220. PDF.
Bearbeiten

Einzelnachweise

Bearbeiten
  1. Paul Wilmott: Grundkurs Machine Learning. 1. Auflage. Rheinwerk Verlag GmbH, Bonn 2020, ISBN 978-3-8362-7598-9, S. 133.

📚 Artikel Terkait di Wikipedia

Kernel

Gruppenhomomorphismus Kernel-Methode, Klasse von Algorithmen zur Mustererkennung Kernel Holding S.A., ukrainischer Agrarkonzern Kernel, ein Stabilitätskonzept

Bernhard Schölkopf

(Physik). Schölkopf befasst sich mit Maschinenlernen und speziell Kernel-Methoden, die er auch in der algorithmischen Biologie anwendet. Er ist seit

Oops

oops steht für: Kernel oops, weniger gravierender Linux-Kernel-Fehler als eine Kernel panic OOPS steht für: Out of Phase Stereo, Methode zur Verbesserung

Thread (Informatik)

Arten von Threads unterschieden: Threads im engeren Sinne, die sogenannten Kernel-Threads, laufen ab unter Steuerung durch das Betriebssystem. Im Gegensatz

Rotfuchs

oder die Kernel-Methode, welche die Dichte der Beobachtungshäufigkeiten berücksichtigt. Auch hier sind Prozentbildungen möglich, z. B. 50-%-Kernel oder 95-%-Kernel

Systemaufruf

Kontrolle vom Programm an den Kernel übergeben. In modernen Computersystemen (z. B. der IA-32-Architektur von Intel) läuft der Kernel, also der Betriebssystemkern

Rootkit

keinen Zugriff auf der Kernel-Ebene benötigen. Sie stellen jeweils eine DLL bereit, die sich anhand verschiedener API-Methoden (SetWindowsHookEx, CreateRemoteThread)

Support Vector Machine

ISBN 978-0-387-77241-7. 602 pp. Nello Cristianini, John Shawe-Taylor: Kernel Methods for Pattern Analysis, Cambridge University Press, Cambridge, 2004, ISBN