Zpracování přirozeného jazyka II

V tomto kurzu navážeme na základní kurz Zpracování přirozeného jazyka pokročilejšími tématy. 

Popis kurzu:

Zaměříme se především na předzpracování dat a nejnovější aplikace hlubokého učení ve zpracování textu. Bude se jednat především architektury neuronových sítí postavených na takzvaných Transformerech. S využitím metody transfer learningu ukážeme, jak lze využít velké předtrénované neuronové sítě pro nejrůznější praktické aplikace.

Požadované znalosti:
  • Základní znalost programování v Pythonu
  • Středoškolská matematika
  • Znalosti strojového učení na úrovni kurzu Úvod do strojového učení
  • Znalosti na úrovni kurzu Zpracování přirozeného jazyka
Obsah kurzu:

Předzpracování textových dat

  • Kódování znaků a unicode normalizace
  • Tradiční tokenizace (jednoduché metody, Spacy, Moses)
  • Subword tokenizace (byte-pair kódování, wordpiece, sentencepiece)
  • Šištění dat (deduplikace, odstranění textového balastu)

Word embeddings

  • Obecné principy
  • Implementace skip-gram modelu

Strojový překlad s rekurentními sítěmi

  • Paměťové buňky LSTM a GRU
  • Implementace strojového překladu pomocí rekurentních sítí

Transformery

  • Attention is all you need
  • Architektura transformeru
  • GPT2
  • BERT
  • XLNET

Příklady transfer learningu pro zpracování přirozeného jazyka

  • Klasifikace textů
  • Rozpoznání jmenných entit
  • Question answering
úroveň

střední

jazyk
cz en

délka kurzu

1 den

Vyberte termín a místo konání
Kdykoliv cz
Online
Online
Kdykoliv en
Online
Online
Počet účastníků

Potřebujete poradit?

+420 499 810 606
Nevybrali jste si? nevadí!

Připravíme vám školení na míru