Poprawna identyfikacja słów sięga na testach nawet 93%. W
olontariusze, którzy próbowali odczytać słowa z tych samych nagrań osiągnęli wynik 52%
. System, który zaskakująco dobrze radzi sobie z odczytem nazywa się
LipNet
i powstał na Uniwersytecie Oksfordzkim.
Naukowcy wykorzystali postępy sieci neuronowych w rozumieniu ludzkiej mowy i nakarmili bazy danych nowymi połączeniami: słowa odpowiadają konkretnym ruchom ust, trzeba je powiązać. Jest to oczywiście pełne pułapek: kontekstów, różnych kształtów ust i języków. W tej chwili system pracuje wyłącznie na języku angielskim.