Wat is een Transformer?

Definitie

Een Transformer is een deep learning architectuur geïntroduceerd in 2017 die gebruikmaakt van attention mechanisms om sequentiële data zoals tekst efficiënt te verwerken.

Doel

Het doel van de transformer-architectuur is het efficiënt verwerken van lange sequenties door alle posities tegelijk te bekijken in plaats van stap-voor-stap.

Functie

Transformers gebruiken self-attention om relaties tussen alle woorden in een zin tegelijkertijd te berekenen, waardoor parallelle verwerking en betere context-begrip mogelijk wordt.

Voorbeeld

GPT, BERT, T5, en de meeste moderne taalmodellen zijn gebaseerd op de transformer-architectuur, evenals veel image- en multimodale modellen.

Gerelateerd

Attention Mechanism, Large Language Model, GPT, BERT

🍄

Wil je meer weten?

Als je meer wilt weten over Transformer, neem contact met me op via X. Ik deel graag ideeën, beantwoord vragen en bespreek nieuwsgierigheden over deze onderwerpen, dus aarzel niet om langs te komen. Tot snel!

Wat is Dienend Leiderschap?

Dienend Leiderschap is een filosofie waarbij het belangrijkste doel van de...

Wat is DDD?

Domain-Driven Design (DDD) is een benadering voor softwareontwikkeling die...

Wat is een Latentie Budget?

Een Latentie Budget is de maximaal acceptabele tijd die een AI-systeem mag...