www-ai.cs.tu-dortmund.de/LEHRE/VORLESUNGEN/KDD/SS13/FOLIEN/9MLVsubgroup.pdf
Vorlesung Wissensentdeckung - Knowledge based sampling – KBS
Fehler insgesamt 9%
Predicted True email spam email 57,3 4,0 spam 5,3 33,4
Sensitivität: 100 · 33, 4
33, 4 + 5, 3 = 86, 3%
Spezifizität:
100 · 57, 3
57, 3 + 4, 0 = 93, 4%
12 von 32
LS 8 Informatik Computergestützte [...] und der reine Zufall 50%. λ = 1/3, weil (1− 1/3) ·Acc = 50%. Wegen Gleichung (2) ergibt sich:
Pr[Âcc ≤ (1− 1/3) ·Acc] ≤ exp(−(1/3)2m ·Acc/2)
⇔ Pr[Âcc ≤ 1/2] ≤ exp(−1/9m3/8) = exp(−m 24
)
Risiko ≤ δ = 5% [...] dreimaliges Würfeln: X1 1. Wurf, X2 2. Wurf, X3 3. Wurf sind i.i.d. verteilt. X4 = X1 +X2 und X5 = X2 +X3 sind zwar identisch verteilt, aber nicht unabhängig. X4 und X3 sind unabhängig, aber nicht identisch verteilt …