Google har sedan ett tag tillbaka filat på Universal Speech Model (USM), en modell för maskininlärning som på sikt ska klara av att känna igen och översätta 1 000 olika språk.

Hittills har USM tränats upp på drygt 300 språk med hjälp av 12 miljoner timmar tal från inspelningar och 28 miljarder meningar från diverse texter.

Utöver större språk som engelska och mandarin handlar det bland annat om amhariska, cebuano, assamiska och azerbajdzjanska, rapporterar Google Research.

Redan nu används USM för att skapa automatiska undertexter på Youtube, men i skrivande stund är det ”bara” 73 språk som stöds där.