Illustration des Prinzips von Transfer Learning.
Transfer Learning und Domain Adaptation

Transfer Learning ist eine Technik im maschinellen Lernen, bei der Modelle, die auf einer bestimmten Aufgabe trainiert wurden, auf eine neue, verwandte Aufgabe (eventuell mit kleinen Anpassungen) angewandt werden[1]. Dieser Ansatz ermöglicht es, das Wissen, das ein Modell auf einer Aufgabe erworben hat, zu nutzen, um die Leistung auf einer anderen Aufgabe zu verbessern, insbesondere wenn anfangs wenig Daten für eine Aufgabe vorliegen (small data).

Da beim Transfer Learning mehrere Ziele betrachtet werden, ist es mit der Mehrzieloptimierung verwandt.

Transfer Learning kann als Regularisierungstechnik betrachtet werden und verbessert die Generalisierungsfähigkeiten von Modellen und ermöglicht eine effizientere Nutzung von Ressourcen. Transfer Learning hat in verschiedenen Bereichen wie Computer Vision, natürlicher Sprachverarbeitung und anderen Anwendungen des maschinellen Lernens erhebliche Fortschritte ermöglicht.

Während Transfer Learning den (sequentiellen) Transfer von Wissen von einer Aufgabe (Task) auf eine andere betrachtet, werden beim Multi-Task Learning simultan mehrere Aufgaben trainiert[2].

Einzelnachweise

Bearbeiten
  1. Yang, Q., Zhang, Y., Dai, W., Pan, S. J. (2020). Transfer Learning. USA: Cambridge University Press.
  2. Yu, Tianhe et al. "Gradient surgery for multi-task learning." Advances in Neural Information Processing Systems 33 (2020): 5824-5836. https://arxiv.org/pdf/2001.06782.pdf

📚 Artikel Terkait di Wikipedia

Föderales Lernen

die Besonderheiten eines Teilnehmers angepasst sind – sogenanntes Multi-Task Learning. Die Teilnehmer können dazu auch in Cluster eingeteilt werden, die

Selbstüberwachtes Lernen

veröffentlichten in den Proceedings der ICCV 2017 das Paper „Multi-Task Self-Supervised Visual Learning“. Es ist ebenfalls eines der am meisten zitierten Paper

Dennis J. Snower

Economic Review. Band 78, Nr. 1, 1988, S. 167–188.  mit Assar Lindbeck: Multi-task Learning and the Reorganization of Work. In: Journal of Labor Economics. Band 18

Large Language Model

vortrainierte Modelle verwendet, wie die GPT-Modelle. LLMs sind Teil des Deep Learning (DL) oder maschinellen Lernens (ML) und zählen zu den generativen KI-Modellen

Axel-Cyrille Ngonga Ngomo

ADAGIO - Automated Data Augmentation of Knowledge Graphs Using Multi-expression Learning. Hypertext 2022: 43-51 (dice-research.org, PDF) Personenseite

Convolutional Neural Network

Learning fallen. Hierbei ist auf die Ähnlichkeit zum Optimalfilter hinzuweisen. Architektonisch können im Vergleich zum mehrlagigen Perzeptron (Multi-Layer-Perzeptron)

Volker Tresp

Yu und Anton Schwaighofer: Learning Gaussian processes from multiple tasks. International Conference on Machine Learning, 2006 mit Maximilian Nickel

Inzidentelles Lernen

function of semantic, graphic, and syntactic orienting tasks. In: Journal of Verbal Learning and Verbal Behavior. 12 (1973), S. 471–480. Civic Education