【moeda】moeda.net, 29 de julho - A Zhipu AI lançou oficialmente a série de modelos insignia GLM-4.5, que inclui as versões GLM-4.5 e GLM-4.5-Air. Dentre elas, o GLM-4.5 possui um total de 355 bilhões de parâmetros, com 32 bilhões de parâmetros ativados; o GLM-4.5-Air possui um total de 106 bilhões de parâmetros, com 12 bilhões de parâmetros ativados, ambos utilizando uma arquitetura de especialistas mistos, suportando uma janela de contexto de 128K. O novo modelo obteve a segunda posição global e a primeira posição nacional na média geral de 12 avaliações de referência, e pela primeira vez alcançou uma fusão nativa de capacidades de raciocínio, codificação e agentes inteligentes. O preço da chamada API é de até 0,8 yuan/milhão de tokens de entrada e 2 yuan/milhão de tokens de saída, com a versão de alta velocidade gerando mais de 100 tokens/segundo.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
9 Curtidas
Recompensa
9
5
Compartilhar
Comentário
0/400
ForumLurker
· 16h atrás
Que tal experimentar?
Ver originalResponder0
token_therapist
· 07-29 22:40
Um preço tão baixo, impressionante
Ver originalResponder0
ContractFreelancer
· 07-29 01:03
A IA nacional continua a avançar!
Ver originalResponder0
ReverseTradingGuru
· 07-29 00:54
Realmente tem dinheiro, essa quantidade de parâmetros.
A Zhupu AI lançou a série de modelos GLM-4.5, com desempenho que saltou para o segundo lugar global e o primeiro lugar no mercado nacional.
【moeda】moeda.net, 29 de julho - A Zhipu AI lançou oficialmente a série de modelos insignia GLM-4.5, que inclui as versões GLM-4.5 e GLM-4.5-Air. Dentre elas, o GLM-4.5 possui um total de 355 bilhões de parâmetros, com 32 bilhões de parâmetros ativados; o GLM-4.5-Air possui um total de 106 bilhões de parâmetros, com 12 bilhões de parâmetros ativados, ambos utilizando uma arquitetura de especialistas mistos, suportando uma janela de contexto de 128K. O novo modelo obteve a segunda posição global e a primeira posição nacional na média geral de 12 avaliações de referência, e pela primeira vez alcançou uma fusão nativa de capacidades de raciocínio, codificação e agentes inteligentes. O preço da chamada API é de até 0,8 yuan/milhão de tokens de entrada e 2 yuan/milhão de tokens de saída, com a versão de alta velocidade gerando mais de 100 tokens/segundo.