A batalha pelo poder de computação na onda dos grandes modelos: como os prestadores de serviços podem enfrentar o novo modelo de negócios

robot
Geração de resumo em curso

A nova modelo de negócio por trás da batalha pelo Poder de computação

A onda de "refinamento" de grandes modelos passará, mas o poder de computação está se tornando um novo modelo de negócios. Os provedores de serviços de poder de computação precisam se preparar para o futuro e mudar a tempo.

Recentemente, pesquisadores utilizaram dados meteorológicos de 40 anos em todo o mundo, empregando 200 placas GPU para pré-treinamento. Em cerca de 2 meses, conseguiram treinar um grande modelo meteorológico com uma quantidade de parâmetros na casa das centenas de milhões. Com base no custo de 7,8 yuan por hora por GPU, o custo de treinamento desse modelo pode superar 2 milhões de yuan. E se for um modelo grande geral, o custo pode aumentar cem vezes.

Atualmente, existem mais de 100 modelos grandes na China com uma escala de 1 bilhão de parâmetros. No entanto, a "fabricação" de grandes modelos que atrai a indústria enfrenta o desafio de uma escassez aguda de GPUs de alta gama. O custo do poder de computação é elevado, e a falta de poder de computação e de financiamento tornou-se o problema mais evidente que a indústria enfrenta.

A escassez de GPUs de alta gama é um problema sem solução em toda a indústria. No auge, o preço de uma A100 foi inflacionado para duas a três dezenas de milhares de yuans, e o preço do aluguel mensal de um servidor A100 também disparou para 5-7 mil yuans/mês. Mesmo assim, o preço elevado ainda pode não garantir a obtenção do chip.

A concorrência no mercado de grandes modelos é intensa; sem um investimento de bilhões de dólares, é difícil continuar a desenvolver grandes modelos. Alguns empreendedores afirmam que, sem apoio de dezenas ou centenas de bilhões, é difícil seguir esse caminho. À medida que o mercado passa do entusiasmo para a racionalidade, as empresas também ajustarão seus custos e estratégias de acordo com as mudanças nas expectativas.

Perante a escassez de poder de computação, as empresas adotaram várias medidas de resposta:

  1. Utilizar dados de maior qualidade para aumentar a eficiência do treinamento
  2. Melhorar a capacidade da infraestrutura, garantindo operação estável acima de mil calorias.
  3. Otimização da alocação de recursos de Poder de computação
  4. A transição da arquitetura de computação em nuvem para a arquitetura de supercomputação
  5. Utilizar plataformas nacionais em vez de GPUs da Nvidia

Esses métodos, cada um deles, é um projeto relativamente grande, e geralmente é difícil para as empresas atenderem à demanda por meio da construção de seus próprios data centers. Muitas equipes de algoritmos optam por fornecedores especializados em Poder de computação para fornecer suporte.

O Poder de computação tornou-se um novo modelo de serviço. O serviço de Poder de computação é baseado em uma diversidade de Poder de computação, ligado por uma rede de Poder de computação, com o objetivo de fornecer Poder de computação eficaz. Ele não inclui apenas o Poder de computação, mas também a embalagem unificada de recursos como armazenamento e rede, completando a entrega de Poder de computação na forma de serviço ( como API ).

Do ponto de vista da estrutura da cadeia industrial, as empresas upstream fornecem principalmente recursos básicos de poder de computação, as empresas midstream são responsáveis pela produção e fornecimento de poder de computação, enquanto as empresas downstream são as usuárias do poder de computação. Atualmente, a cobrança por quantidade e os pacotes anuais e mensais são os modelos de cobrança predominantes.

Com a normalização da demanda por computação de alto desempenho para grandes modelos, os serviços de poder de computação, originados dos serviços em nuvem, rapidamente entraram na visão do público, formando uma cadeia de indústria e um modelo de negócio únicos. No início da explosão desta indústria de poder de computação, a escassez de GPUs de alta gama, os altos custos de poder de computação e a disputa por "chips" tornaram-se as paisagens únicas desta era.

A longo prazo, o poder de computação torna-se uma tendência certa como um serviço. Os fornecedores de serviços de poder de computação precisam estar preparados para ajustar suas estratégias prontamente quando os grandes modelos retornarem à racionalidade e a direção do mercado mudar rapidamente.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • Partilhar
Comentar
0/400
StakeOrRegretvip
· 07-14 02:28
Dinheiro não chegou, não diga nada.
Ver originalResponder0
ParanoiaKingvip
· 07-14 02:27
Faltam cartões, estou ficando louco. Quando é que o desastre na mina será recriado?
Ver originalResponder0
MEVHunterLuckyvip
· 07-14 02:24
Novo desastre na mina começou!
Ver originalResponder0
DeFiCaffeinatorvip
· 07-14 02:23
Fazendo um pouco de pesquisa sobre a acumulação de placas gráficas~
Ver originalResponder0
metaverse_hermitvip
· 07-14 02:02
Agora é difícil até conseguir um cartão.
Ver originalResponder0
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)