Throughput vs Latency (Latence)
Je to počet dokončených pracovních položek v určitém časovém rámci.
| Throughput | Latency (Latence) | |
|---|---|---|
| Definition | V metodě Kanban se 'throughput' používá k popisu celkového počtu úkolů nebo pracovních položek, které tým dokáže dokončit během stanoveného období. Tento ukazatel měří produktivitu a efektivitu týmu a používá se k hodnocení a zlepšení výkonu v průběhu času. | Latency neboli Latence je čas, který uplyne mezi odesláním dotazu nebo požadavku AI systému a přijetím odpovědi nebo výsledku. |
| Categories | agilní, dodání, kanban, metrika | ai, performance |
Co je throughput?
Je to počet dokončených pracovních položek v určitém časovém rámci.
Definice
V metodě Kanban se 'throughput' používá k popisu celkového počtu úkolů nebo pracovních položek, které tým dokáže dokončit během stanoveného období. Tento ukazatel měří produktivitu a efektivitu týmu a používá se k hodnocení a zlepšení výkonu v průběhu času.
Metrika
Throughput je klíčovým ukazatelem výkonnosti, který pomáhá týmům porozumět jejich kapacitě dodávky a efektivitě.
Měření
Throughput se měří počítáním počtu úkolů nebo uživatelských příběhů, které byly dokončeny a dodány v průběhu určitého období, často na iteraci nebo týdně.
Sledování
Týmy mohou využívat údaje o throughputu k lepšímu sledování zlepšení v jejich procesu dodávky a identifikaci potenciálních úzkých míst.
Typ
Throughput je kvantitativní měření toho, kolik práce je dokončeno v čase v rámci systému Kanban.
Analogie
Může být přirovnáván k výstupu továrny, indikujícímu rychlost, jakou je práce zpracovávána a dodávána.
Co je Latency v AI?
Čas mezi odesláním dotazu AI systému a přijetím odpovědi.
Definice
Latency neboli Latence je čas, který uplyne mezi odesláním dotazu nebo požadavku AI systému a přijetím odpovědi nebo výsledku.
Účel
Kritická metrika pro uživatelskou zkušenost, zvlášť důležitá u real-time aplikací a interaktivních AI systémů.
Funkce
Ovlivněna velikostí modelu, složitostí dotazu, hardwarem a síťovými podmínkami.
Příklad
Chatbot s latencí 200ms poskytne téměř okamžité odpovědi, zatímco latence 5 sekund vytváří frustrující zpoždění.
Související
Souvisí s throughput, inference optimalizací a edge computing pro snížení latence.