Esempio di SVM dove i campioni di training in 2D sono rimappati su di uno 3D

Nell'apprendimento automatico, i metodi kernel, detti anche macchine basate su kernel (o kernel machine), sono una classe di algoritmi di apprendimento supervisionato e non supervisionato [1][2]. Il rappresentante maggiormente conosciuto è costituito dalle macchine a vettori di supporto (SVM).

Descrizione

modifica

Lo scopo generale dell'analisi di schemi è di trovare e studiare tipi generici di relazioni (come gruppi, posizioni, componenti principali, correlazioni, classificazioni) e in generale tipi di dati (sequenze, documenti testuali, insiemi di punti, vettori, immagini ecc.).

I metodi kernel si approcciano al problema mappando i dati in uno spazio di caratteristiche multidimensionale, dove ogni coordinata corrisponde a una caratteristica dei dati dell'elemento, trasformando i dati in un insieme di punti dello spazio euclideo.

Poiché la mappatura può essere generale (non necessariamente lineare, ad esempio), le relazioni trovate in questo modo risultano di conseguenza molto generali. I metodi kernel sono così chiamati per le funzioni kernel usate per operare nello spazio delle caratteristiche senza necessità di calcolare le coordinate dei dati nello spazio, ma soltanto il prodotto interno tra le immagini di tutte le coppie di dati nello spazio funzione. Tale operazione risulta spesso computazionalmente più conveniente rispetto al calcolo esplicito delle coordinate, e viene chiamata "stratagemma del kernel"[3] (kernel trick). Funzioni kernel sono state proposte per diversi tipi di strutture dati quali sequenze, grafi, testi, immagini e vettori.

Gli algoritmi capaci di operare con i kernel comprendono le macchine a vettori di supporto, processi gaussiani, l'analisi discriminante lineare di Fisher, l'analisi delle componenti principali (PCA), l'analisi di correlazione canonica, la regressione della cresta, il raggruppamento spettrale, i filtri adattivi lineari e molti altri.

Motivazione e spiegazione informale

modifica

I metodi basati su kernel possono essere considerati come modelli di apprendimento basati su istanze: invece di apprendere un insieme fisso di parametri corrispondenti alle caratteristiche dei loro input, "ricordano" l'-esimo esempio di training e imparano per esso un peso corrispondente . La predizione per gli input non etichettati, ovvero quelli non presenti nell'insieme di addestramento, viene trattata mediante l'applicazione di una funzione di similarità , detta kernel, tra l'input non etichettato e ciascuno degli input di training . Ad esempio, un classificatore binario kernelizzato può essere definito tipicamente come somma ponderata delle similarità

dove:

  • è l'etichetta predetta dal classificatore binario kernelizzato per l'esempio non etichettato di cui interessa la sua vera etichetta latente ;
  • è la funzione kernel che misura la similarità fra qualsiasi ogni si input ;
  • la somma comprende gli n esempi etichettati nel training set del classificatore, con ;
  • i sono pesi sugli es. di training determinati dall'algoritmo di apprendimento;
  • la funzione segno determina se la classificazione predetta risulti positiva o negativa.

I classificatori basati su kernel furono descritti già negli anni '60, con l'invenzione del percettrone basato su kernel. [3] Essi raggiunsero grande importanza con la popolarità della macchina a vettori di supporto (SVM) negli anni '90, quando si scoprì che la SVM poteva competere con le reti neurali in attività come il riconoscimento della scrittura.

Voci correlate

modifica

Note

modifica
  1. ^ S. Y. Kung, Kernel Methods and Machine Learning, Cambridge University Press, 2014, DOI:10.1017/cbo9781139176224, ISBN 978-1-107-02496-0.
  2. ^ Ethem Alpaydin, Ch 13: Kernel Machines, in Introduction to machine learning, collana Adaptive computation and machine learning series, Fourth edition, The MIT Press, 2020, ISBN 978-0-262-04379-3.
  3. ^ a b M. A. Aizerman, E. M. Braverman and L. I. Rozonoer, Theoretical foundations of the potential function method in pattern recognition learning, in Automation and Remote Control, vol. 25, 1964, pp. 821–837.

Collegamenti esterni

modifica

📚 Artikel Terkait di Wikipedia

Connettività cerebrale

^ Daniele Marinazzo, Mario Pellicoro e Sebastiano Stramaglia, Kernel method for nonlinear Granger causality, in Physical Review Letters, vol. 100

Modellazione causale dinamica

1080/09548980500238756. ^ Marinazzo, Daniele, Mario Pellicoro e Sebastiano Stramaglia, Kernel method for nonlinear Granger causality, in Physical review letters, vol. 100

Percettrone basato su kernel

basato su kernel (o kernel perceptron) è una variante del popolare algoritmo di apprendimento del percettrone capace di apprendere macchine kernel, ovvero

Olio di mandorle

spremuto a freddo è stato attribuito nome INCI: PRUNUS AMYGDALUS AMARA KERNEL COLD PRESSED OIL con numero CAS 90320-35-7 e numero EINECS 291-063-5. All'olio

Macchine a vettori di supporto

risolvere problemi non linearmente separabili, utilizzando il kernel trick, comune ai metodi kernel, ossia mappando implicitamente i dati di input su uno spazio

James Mercer (matematico)

Su tale teorema si fonda il cosiddetto trucco del kernel (ideato da Aizerman et al. per il kernel perceptron), che consente di convertire facilmente

Metodo degli elementi finiti

Il metodo degli elementi finiti (FEM, dall'inglese Finite Element Method) è una tecnica numerica atta a cercare soluzioni approssimate di problemi descritti

Olio di argan

per cosmetici skincare che haircare. Il suo nome INCI è: argania spinosa kernel oil. Nei cosmetici per pelli grasse può essere utilizzata anche la frazione