Este banco de dados forma parte da coleção de 200 milhões de palavras usada pelas minorias étnicas no norte e nordeste do país, que incluem as línguas duar, ewenk e oroqen. O projeto está programado para ser completado em 20 anos.
Os compiladores identificaram 97 lugares através de oito regiões provinciais da China que têm populações mongóis, cinco províncias e cidades da Mongólia, assim como as repúblicas russas de Buryat e Kalmykia.
Eles coletaram 4.192 horas de dados orais por parte de 6.725 falantes mongóis e mais de 4.000 horas de registros escritos.
Os projetos têm como objetivo ajudar a proteger as línguas étnicas que estão desaparecendo e se tornarão valiosos recursos linguísticos, de acordo com a academia.
O programa conta com duas etapas. A primeira, a parte mongol, já foi completada, enquanto a segunda, o banco de dados de outras três línguas, está em andamento.