La curva logistica

La funzione sigmoidea è una funzione matematica che produce una curva sigmoide, ovvero una curva avente un andamento ad "S". Spesso, la funzione sigmoidea si riferisce ad uno speciale caso di funzione logistica, mostrata nell'immagine accanto, definita dalla formula:

Membri della famiglia sigmoidea

modifica

Generalmente, una funzione sigmoidea è una funzione continua e derivabile, che ha una derivata prima non negativa e dotata di un unico punto di flesso.

Oltre alla funzione logistica, le funzioni sigmoidee includono la funzione arcotangente, tangente iperbolica e funzione di errore. Spesso inoltre è usata in statistica come funzione di distribuzione cumulata, infatti la forma ad "S" dà luogo a distribuzioni di probabilità a forma di campana, che raccolgono la maggior parte della densità di probabilità intorno al valore medio.

La funzione sigmoidea logistica è collegata con la tangente iperbolica, per esempio da:

Funzioni sigmoidee nelle reti neurali

modifica

Le funzioni sigmoidee sono spesso usate nelle reti neurali per introdurre la non linearità nel modello e/o per assicurarsi che determinati segnali rimangano all'interno di specifici intervalli. Un popolare elemento neurale artificiale computa la combinazione lineare dei relativi segnali in ingresso ed applica una funzione sigmoidea limitata al risultato; questo modello può essere visto come variante "regolare" del classico neurone soglia. Un motivo per la relativa popolarità nelle reti neurali è perché la funzione sigmoidea soddisfa questa proprietà:

Questa relazione polinomiale semplice fra la derivata e la funzione stessa è, dal punto di vista informatico, semplice da implementare.

Doppia funzione sigmoidea

modifica

Il doppio sigmoideo è una funzione simile alla funzione sigmoidea con numerose applicazioni. La relativa formula generale è:

dove d è il centro e s è il fattore di steepness. Essa è basata sulla curva gaussiana ed è graficamente simile a due sigmoidi identiche legate insieme al punto x = d. Una delle relative applicazioni è la normalizzazione non lineare di un campione.

Voci correlate

modifica

Altri progetti

modifica

Collegamenti esterni

modifica
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica

📚 Artikel Terkait di Wikipedia

Funzioni di attivazione

il massimo. Nella classificazione viene spesso utilizzata l'attivazione softmax. Nelle reti regressive, invece, sono di norma assenti. La tabella seguente

Trasformatore (informatica)

scomposizione è uno strato softmax lineare: U n E m b e d ( x ) = s o f t m a x ( x W + b ) {\displaystyle \mathrm {UnEmbed} (x)=\mathrm {softmax} (xW+b)} La matrice

Word2vec

rappresentazione word embedding del token V i {\displaystyle V_{i}} . La funzione softmax viene applicata nell'ultimo layer della rete neurale. L'architettura CBOW