KI-ENNA: (E)in (N)euronales (N)etz zum (A)usprobieren

Trainingsdatensatz

Vokabular

–

Batches

–

Kontextlänge

–

Vokabulargröße
40 wenige (5) oder viele (80) Wörter

Kontextlänge
8 wenige (3) oder viele (16) Tokens

Epochen
wenige (50) oder viele (500) Durchläufe

Lernrate
0.05 langsam (0.01) oder schnell (1)

Aufmerksamkeitsmatrix

Verlustfunktion (Cross-Entropy)

Token-Vektoren-Matrix

Token	Vektor

Beispielsatz (Prompt)

Ergebnis

–