David Schlangen : Home Page > minutes030208b
- present: M, T, D
- Nigh2, Fehleranalyse:
- Diagramm sollte die Ratio `wait' / `take' plotten, als Funktion
des Abstandes zu EOT bzw. zu EOU. Ersteres für alle Datenpunkte,
letzteres nur für turn-interne EOUs (und damit also sind alle
`take's false positives); technisch: für solche, wo dist_to_eou !=
dist_to_eot.
(Da sind wir beim letzten Treffen wohl durcheinander gekommen;
in den Notes steht es richtig und falsch drin.)
- was wir sehen wollen:
- Anschwillen des Anteils von `take' in Richtung EOT hin; das
kann uns dann sagen, wo ein guter Punkt ist, die Grenze für
`take' zu setzen.
- kleineres Anschwillen in Richtung EOU. Das sind dann alles
false positives (weil ja diese EOUs so ausgewählt sind, dass
sie keine EOTs sind), aber FPs um EOUs rum sind entschuldbarer
als FPs mittendrin.
- Nigh2, Variante von af:
- Information über Position in Wort benutzen? Momentan ist es ja
so, dass für die ersten 2/3 des Wortes die
Wort-Identitätsbasierte Information nachhinkt. Möglicherweise
verwirrt das den Klassifizierer. Einfacher, schneller Test: alle
Frames mit `relative position in word' < .66 rauswerfen. Damit
verbleiben nur Frames, die akustische und syntaktische Info des
gleichen Wortes verbinden.
- mid-term planning:
- Nigh2 dann aber erstmal reifen lassen, als Wein bringenden
Steinbruch betrachten. Will heißen: Arbeit daran hat uns
geholfen, die Module auf den Weg zu bekommen & zu
Datenmanipulationsexperten zu werden. Jetzt erstmal
Anderes. Verbesserungen an Modulen (z.B. prosodische
Modellierung, anderer Parser, andere Korpora) können dann bei
Gelegenheit zurückfließen.
- Das InProPento-System!
Strategie: bis Juli (d.h., in 5 Monaten) Prototyp bauen! Dieser
bietet dann den Rahmen, innerhalb dessen danach dann die
schlaueren Sachen implementiert werden, damit wir 2009 dann mit
vielen Erkenntnissen glänzen. Außerdem wird uns erst die
Entwicklung verraten, wo genau die Schwierigkeiten bei der
konsequent inkrementellen Verarbeitung sind.
- dabei im Auge behalten:
- bi-directional hypothesis chains
- the dialogue management pandaemonium; emergent behaviour
through independent sub-actors.
Turn-Taking ist ("nur") unser Test case! Es geht um die Vorzüge
(und Nachteile, möglicherweise) von inkrementeller
Verarbeitung.
- to do:
- Spezifikationsdokument:
- Domain, features, made-up example dialogues
- modules:
- architecture
- details
to be updated as we learn more..
das, 03/03/08 10:30 (GMT)
Add a new page under this one