Inf280 Autumn 2005 Exercise Set 5
Concept learning

The following (voluntary) exercises are in Norwegian. I apologize to non-speakers. Please ask me, Harald, or your fellow students for assistance if needed. Alternativeley, you could do Exercises 2.2 and 2.3 in Mitchell. Also, see below for more exercises in the book.
 1. Vi skal lære konseptet "studenter som vil stå til eksamen" som er en delmengde av "studenter". Hver student blir beskrevet med følgende attributter:

  Eksempler:

  jobberlesesalleserforelesningstår
  ingentingalltidenormtalltidja
  litealltidenormtalltidja
  liteoftemyeofteja
  liteoftemyealltidja
  myealdrinoealdrinei
  myealdrinoeoftenei

  1. Anta at hypoteserommet består av konjunksjoner av restriksjoner på attributtene, der hver restriksjon (som i boken) kan tillatte ingen verdier (Ø), én verdi (f.eks. ("ofte") eller alle verdier (?). Hvor mange syntaktisk og semantisk distinkte hypoteser er det i hypoteserommet?
  2. Bruk algoritmen FIND-S på eksemplene over. Hvilken hypotese kommer du frem til? Er den konsistent med de negative eksemplene? Er dette målkonseptet?

 2. Vi fortsetter med eksemplet fra oppgaven over.
  1. Utvid hypoteserommet ved å tillate restriksjonene på hver attributt å tillate en liste av ulike verdier. Hvor stort er det nye hypoteserommet i antall semantisk distinkte hypoteser?

  2. Bruk algoritmen FIND-S med det nye hypoteserommet. FIND-S finner bare én hypotese; den mest spesifikke som er konsistent med alle positive eksempler. Er det mange andre hypoteser som er konsistente med treningsdata?

 3. Gjenta oppgavene 1 og 2 med kandidatelimineringsalgoritmen i stedet for FIND-S. Sammenlign svarene.

  1. Hva sier den induktive læringshypotesen, og hva betyr det for læring i eksemplet over?
  2. Hva er induktiv bias for en læringsalgoritme?
  3. Hvilken induktiv bias har kandidat-elimineringsalgoritmen? Forklar hvordan graden av bias avhenger av valget av hypoteserom. Sammenlign hypoteserommene fra oppgave 1 og 2. Hvilket gir sterkest bias?
  4. Hva kan skje hvis læringsalgoritmen har for sterk bias? For svak bias? Hva skjer hvis den er helt "unbiased" ("fordomsfri")?

 4. Exercise 2.4 from Mitchell, p. 48.

 5. * Extra exercises from Mitchell (more theoretical): 2.7, 2.8.

 6. ** Honors problem from Mitchell (more difficult): 2.9.
Good luck!