Um grande modelo linguístico de nova geração, capaz de aceitar e processar cerca de 300 mil caracteres chineses de uma só vez, foi lançado em Shanghai, nesta quarta-feira.
O comprimento limitado do contexto de grandes modelos é um problema significativo em inteligência artificial.
O novo modelo, o InternLM2, foi desenvolvido pelo Laboratório de Inteligência Artificial de Shanghai, pela SenseTime, pela Universidade Chinesa de Hong Kong e pela Universidade Fudan.
Em um experimento, os pesquisadores alimentaram o modelo com uma transcrição de uma reunião pública de três horas e pediram que ele extraísse informações importantes.
Os resultados do teste mostraram que, embora houvesse muitos erros de digitação no texto não revisado, o InternLM2 pode extrair com precisão as principais informações e resumir os principais pontos do falante.
Os desenvolvedores visam avançar a capacidade de modelagem de linguagem da base do modelo, melhorando a qualidade do corpus e a densidade da informação.
O Laboratório de Inteligência Artificial de Shanghai disse que continua a licenciar o InternLM2 para uso comercial gratuito.