📑 Table of Contents

Funkcja softmax, softargmax, znormalizowana funkcja wykładnicza (ang. softmax function, softmax activation function) – funkcja matematyczna odwzorowująca wektor liczb w wektor prawdopodobieństw, w taki sposób, żeby prawdopodobieństwa były proporcjonalne do kolejnych liczb przekształconych za pomocą funkcji wykładniczej[1].

Funkcja softmax jest uogólnieniem funkcji logistycznej na wiele wymiarów i jest stosowana w wielomianowej regresji logistycznej. Funkcja softmax jest również często używana jako funkcja aktywacji w ostatniej warstwie sztucznej sieci neuronowej w celu normalizacji wyników sieci do rozkładu prawdopodobieństwa przewidywanych klas wyjściowych[2].

Definicja

edytuj

Argumentem funkcji softmax jest wektor liczb rzeczywistych (). Standardowa (jednostkowa) funkcja softmax odwzorowuje ten wektor w wektor wynikowy, który można potraktować jak rozkład prawdopodobieństwa składający się z prawdopodobieństw. Prawdopodobieństwa wynikowe , gdzie , są proporcjonalne do liczb w wektorze wejściowym przekształconych za pomocą funkcji wykładniczej i sumują się do 1:

Oznacza to, że przed zastosowaniem funkcji softmax niektóre składowe wektora mogą być ujemne lub większe od 1, nie muszą się też sumować do jedności, ale po przekształceniu każdy element wektora będzie w przedziale i ich suma będzie wynosić 1.

Uogólnieniem standardowej funkcji softmax jest funkcja z parametrem [3]:

Nazwa

edytuj

Nazwa „softmax” wywodzi się ze wzmacniającego wpływu przekształcenia wykładniczego: większym elementom odpowiadać będzie większe prawdopodobieństwo; jednocześnie wszystkie elementy pozostaną niezerowe. Na przykład wektor wejściowy po odwzorowaniu za pomocą standardowej funkcji softmax zwróci, co sprowadza się do tego, że niemal cała masa skupi się na pozycji odpowiadającej maksimum wektora wejściowego (6). Zastosowanie funkcji softmax z parametrem =1,4 jeszcze bardziej wzmocni ten efekt – wektor wynikowy wyniesie .

Przypisy

edytuj
  1. Softmax Function in ScienceDirect [1]
  2. Sumiran Mehra, Gopal Raut, Ribhu Das Purkayastha, Santosh Kumar Vishvakarma, Anton Biasizzo, An Empirical Evaluation of Enhanced Performance Softmax Function in Deep Learning, „IEEE Access”, 11, 2023, s. 34912–34924, DOI10.1109/ACCESS.2023.3265327, ISSN 2169-3536 [dostęp 2024-07-27].
  3. M. Franke and J. Degen, The softmax function: Properties motivation and interpretation, September 2023, [online] Available: https://doi.org/10.31234/osf.io/vsw47.

📚 Artikel Terkait di Wikipedia

Ciemna materia

Five-Year Wilkinson Microwave Anisotropy Probe Observations: Cosmological Interpretation. „The Astrophysical Journal Supplement Series”. 180 (2), s. 330, luty

Platon

(Interpreting Plato, Stockholm 1977), Jean-Louis Vieillard-Baron (Platonisme et interprétation de Platon à l’époque moderne, Paris 1998) oraz Alan Kim (Brill’s Companion

Hugh Everett

względnych. W 1973 roku za sprawą książki Bryce DeWitta The Many Worlds Interpretation of Quantum Mechanics (Interpretacja mechaniki kwantowej w teorii wielu

Efekt wyświadczonej przysługi

ISBN 978-1-905177-21-9. D. J. Bem. Self-perception: An alternative interpretation of cognitive dissonance phenomena. „Psychological review”. 74, s. 183-200

TFIDF

występuje. (orig: The specificity of a term can be quantified as an inverse function of the number of documents in which it occurs.) Przykładowe wartości df

Paul Feyerabend

Körner [ed.] Observation and Interpretation, London, Butterworth, s. 121–130 [1958] An Attempt at a Realistic Interpretation of Experience, “Proceedings

Ptaki

The Owl Pages. Retrieved on September 15, 2007. Dupree N (1974). „An Interpretation of the Role of the Hoopoe in Afghan Folklore and Magic.” Folklore 85

Interpretacja wielu światów

Interpretacja wielu światów (ang. many-worlds interpretation, MWI), nazywana też wieloświatową interpretacją mechaniki kwantowej – interpretacja mechaniki