📑 Table of Contents

Funkcja softmax, softargmax, znormalizowana funkcja wykładnicza (ang. softmax function, softmax activation function) – funkcja matematyczna odwzorowująca wektor liczb w wektor prawdopodobieństw, w taki sposób, żeby prawdopodobieństwa były proporcjonalne do kolejnych liczb przekształconych za pomocą funkcji wykładniczej[1].

Funkcja softmax jest uogólnieniem funkcji logistycznej na wiele wymiarów i jest stosowana w wielomianowej regresji logistycznej. Funkcja softmax jest również często używana jako funkcja aktywacji w ostatniej warstwie sztucznej sieci neuronowej w celu normalizacji wyników sieci do rozkładu prawdopodobieństwa przewidywanych klas wyjściowych[2].

Definicja

edytuj

Argumentem funkcji softmax jest wektor liczb rzeczywistych (). Standardowa (jednostkowa) funkcja softmax odwzorowuje ten wektor w wektor wynikowy, który można potraktować jak rozkład prawdopodobieństwa składający się z prawdopodobieństw. Prawdopodobieństwa wynikowe , gdzie , są proporcjonalne do liczb w wektorze wejściowym przekształconych za pomocą funkcji wykładniczej i sumują się do 1:

Oznacza to, że przed zastosowaniem funkcji softmax niektóre składowe wektora mogą być ujemne lub większe od 1, nie muszą się też sumować do jedności, ale po przekształceniu każdy element wektora będzie w przedziale i ich suma będzie wynosić 1.

Uogólnieniem standardowej funkcji softmax jest funkcja z parametrem [3]:

Nazwa

edytuj

Nazwa „softmax” wywodzi się ze wzmacniającego wpływu przekształcenia wykładniczego: większym elementom odpowiadać będzie większe prawdopodobieństwo; jednocześnie wszystkie elementy pozostaną niezerowe. Na przykład wektor wejściowy po odwzorowaniu za pomocą standardowej funkcji softmax zwróci, co sprowadza się do tego, że niemal cała masa skupi się na pozycji odpowiadającej maksimum wektora wejściowego (6). Zastosowanie funkcji softmax z parametrem =1,4 jeszcze bardziej wzmocni ten efekt – wektor wynikowy wyniesie .

Przypisy

edytuj
  1. Softmax Function in ScienceDirect [1]
  2. Sumiran Mehra, Gopal Raut, Ribhu Das Purkayastha, Santosh Kumar Vishvakarma, Anton Biasizzo, An Empirical Evaluation of Enhanced Performance Softmax Function in Deep Learning, „IEEE Access”, 11, 2023, s. 34912–34924, DOI10.1109/ACCESS.2023.3265327, ISSN 2169-3536 [dostęp 2024-07-27].
  3. M. Franke and J. Degen, The softmax function: Properties motivation and interpretation, September 2023, [online] Available: https://doi.org/10.31234/osf.io/vsw47.

📚 Artikel Terkait di Wikipedia

Funkcja logistyczna

możliwych kategorii, uogólnieniem na trzy lub więcej kategorii jest funkcja softmax, której wartości są wektorami. Logistic functions [online], xaktly.com

Funkcja sigmoidalna

softmax Funkcja swish Rozkład Weibulla Statystyka Fermiego-Diraca JunJ. Han JunJ., ClaudioC. Moraga ClaudioC., The influence of the sigmoid function parameters

ReLU

może to jednak wiązać się ze spadkiem ogólnej wydajności modelu. Funkcja softmax AurélienA. Géron AurélienA., Uczenie maszynowe z użyciem Scikit-Learn i

Funkcja straty

maszynowym, w modelach sztucznej inteligencji. Funkcja straty (ang. loss function) to matematyczna miara błędu modelu uczonego maszynowo. Określa, jak bardzo

Długa pamięć krótkotrwała

użyciem pakietu `torch`: library(torch) model <- nn_module( initialize = function(input_size, hidden_size, output_size) { self$lstm <- nn_lstm( input_size

Propagacja wsteczna

problem uczenia perceptronu funkcji XOR(2) oraz funkcji parzystości (parity function) dla większej liczby wejść jako uogólnienie problemu. W „Perceptrons” pokazali

Metoda gradientu sprzężonego

{\displaystyle k:=k+1} end repeat Wynikiem jest x k + 1 {\displaystyle x_{k+1}} function [x] = conjgrad(A,b,x0) r = b - A*x0; w = -r; z = A*w; a = (r'*w)/(w'*z);