A rede desempenha um papel crucial na era dos grandes modelos de IA. Com a contínua expansão da escala dos modelos, os clusters de servidores múltiplos tornaram-se a principal forma de resolver problemas de treinamento, o que também estabelece a base para a "superioridade" da rede na era da IA. Em comparação com o passado, quando era usada apenas para transmitir dados, hoje a rede é mais utilizada para sincronizar os parâmetros dos modelos entre as placas gráficas, o que impõe requisitos mais elevados em termos de densidade e capacidade da rede.
A demanda na rede provém principalmente de três aspectos:
Grande volume do modelo: o tempo de treinamento é proporcional à quantidade de parâmetros do modelo, e a taxa de cálculo em um único dispositivo é limitada; portanto, como utilizar a rede para aumentar o "número de dispositivos" e a "eficiência paralela" determina diretamente o poder computacional.
Comunicação complexa de sincronização de múltiplas placas: após a divisão do modelo para uma única placa, cada cálculo requer alinhamento, o que impõe exigências mais altas à transmissão e troca de rede.
Custo de falha elevado: o treinamento de grandes modelos leva meses, e uma interrupção pode causar enormes perdas. A rede tornou-se um sistema de engenharia complexa comparável a aviões e porta-aviões.
A inovação na rede concentra-se principalmente nas seguintes direções:
Mudança de meio de comunicação: a luz, o cobre e o silício têm suas vantagens, novas tecnologias como LPO e silício fotônico ajudam a reduzir custos.
Competição de protocolos de rede: protocolos de comunicação entre chips como NV-LINK, Infinity Fabric competem com protocolos de comunicação entre nós como IB e Ethernet.
Mudanças na arquitetura da rede: além da arquitetura Leaf Spine, novas arquiteturas como Dragonfly e rail-only têm potencial para se tornarem direções de evolução para grandes clusters.
As recomendações de investimento devem focar nas empresas relacionadas aos núcleos e inovações dos sistemas de comunicação. A inovação na rede no futuro buscará um equilíbrio entre "redução de custos", "abertura" e a escala de capacidade computacional.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
16 gostos
Recompensa
16
5
Partilhar
Comentar
0/400
PermabullPete
· 07-31 19:20
A infraestrutura está a ser construída, vamos começar.
Ver originalResponder0
MoonlightGamer
· 07-30 18:18
Vender o cartão de rede a descoberto e comer arroz.
Ver originalResponder0
OnchainSniper
· 07-29 04:20
O custo da rede está demasiado alto.
Ver originalResponder0
MevShadowranger
· 07-29 04:19
Poder de computação suporte upgrade mais importante
Ver originalResponder0
defi_detective
· 07-29 04:16
Poder de computação verdadeiramente se intensificou.
Aumenta a demanda por redes na era da IA, com foco na inovação voltada para a redução de custos e abertura.
A Rede na Era da IA: Demanda e Inovação
A rede desempenha um papel crucial na era dos grandes modelos de IA. Com a contínua expansão da escala dos modelos, os clusters de servidores múltiplos tornaram-se a principal forma de resolver problemas de treinamento, o que também estabelece a base para a "superioridade" da rede na era da IA. Em comparação com o passado, quando era usada apenas para transmitir dados, hoje a rede é mais utilizada para sincronizar os parâmetros dos modelos entre as placas gráficas, o que impõe requisitos mais elevados em termos de densidade e capacidade da rede.
A demanda na rede provém principalmente de três aspectos:
Grande volume do modelo: o tempo de treinamento é proporcional à quantidade de parâmetros do modelo, e a taxa de cálculo em um único dispositivo é limitada; portanto, como utilizar a rede para aumentar o "número de dispositivos" e a "eficiência paralela" determina diretamente o poder computacional.
Comunicação complexa de sincronização de múltiplas placas: após a divisão do modelo para uma única placa, cada cálculo requer alinhamento, o que impõe exigências mais altas à transmissão e troca de rede.
Custo de falha elevado: o treinamento de grandes modelos leva meses, e uma interrupção pode causar enormes perdas. A rede tornou-se um sistema de engenharia complexa comparável a aviões e porta-aviões.
A inovação na rede concentra-se principalmente nas seguintes direções:
Mudança de meio de comunicação: a luz, o cobre e o silício têm suas vantagens, novas tecnologias como LPO e silício fotônico ajudam a reduzir custos.
Competição de protocolos de rede: protocolos de comunicação entre chips como NV-LINK, Infinity Fabric competem com protocolos de comunicação entre nós como IB e Ethernet.
Mudanças na arquitetura da rede: além da arquitetura Leaf Spine, novas arquiteturas como Dragonfly e rail-only têm potencial para se tornarem direções de evolução para grandes clusters.
As recomendações de investimento devem focar nas empresas relacionadas aos núcleos e inovações dos sistemas de comunicação. A inovação na rede no futuro buscará um equilíbrio entre "redução de custos", "abertura" e a escala de capacidade computacional.