Poder de computação serviços emergem: novas oportunidades e desafios na era dos grandes modelos

robot
Geração do resumo em andamento

Poder de computação: um novo modelo de negócios na era dos grandes modelos

Com o surgimento dos grandes modelos de inteligência artificial, o poder de computação tornou-se um novo modelo de negócios emergente. Embora a atual onda de "refinamento" dos grandes modelos possa gradualmente diminuir, os provedores de serviços de poder de computação precisam se preparar e ajustar suas direções estratégicas a tempo.

Bi Kaifeng, que se formou na Universidade de Tsinghua há 3 anos, treinou um grande modelo meteorológico utilizando 40 anos de dados climáticos globais e cerca de 200 placas GPU durante aproximadamente 2 meses de pré-treinamento. Calculando a um custo de 7,8 yuan/hora por GPU, o custo de treinamento deste grande modelo em um domínio vertical pode ultrapassar 2 milhões de yuan. Se fosse um modelo grande geral, o custo poderia aumentar cem vezes.

Atualmente, a China já possui mais de 100 grandes modelos com uma escala de 10 bilhões de parâmetros. No entanto, a indústria enfrenta amplamente o problema da escassez de GPUs de alto nível. O custo do poder de computação é elevado, e a falta de poder de computação e financiamento tornou-se um dilema para muitas empresas.

A escassez de GPUs de alta gama é um problema difícil de resolver em toda a indústria. A explosão de grandes modelos levou a um rápido crescimento da demanda por Poder de computação no mercado, mas a taxa de crescimento da oferta está muito aquém. Embora, a longo prazo, a oferta de Poder de computação certamente passe de um mercado de vendedores para um mercado de compradores, quanto tempo esse processo levará ainda é uma incógnita.

As empresas estão a ponderar quantas GPUs da Nvidia possuem, e com isso avaliar a sua quota de mercado. Fontes informadas indicam que, se tiverem perto de 10 mil placas, e o total do mercado for de 100 mil placas, a quota será de 10%. Espera-se que até ao final do ano possa chegar a 40 mil placas, e se nesse momento o total do mercado for de 200 mil, isso poderá representar uma quota de 20%.

Por um lado, não é possível comprar placas GPU, por outro lado, a barreira para o treinamento de grandes modelos não é tão fácil de superar como a indústria promove. Treinar um grande modelo genérico com um tamanho de um bilhão de parâmetros ou mais pode custar dezenas de bilhões ou até centenas de bilhões de yuans. Especialistas da indústria afirmam que, sem um suporte financeiro de centenas de bilhões ou trilhões, é difícil desenvolver-se a longo prazo neste campo.

Perante esta situação, é amplamente acreditado na indústria que, à medida que a competição no mercado de grandes modelos se intensifica, o mercado também passará de uma fase de entusiasmo para uma fase de racionalidade, e as empresas irão controlar custos e ajustar estratégias com base nas mudanças esperadas.

Para enfrentar o problema da escassez de GPUs de alta gama, as empresas adotaram várias medidas de resposta:

  1. Usar dados de maior qualidade para treinar, melhorando a eficiência do treinamento.

  2. Melhorar a capacidade da infraestrutura, garantindo uma operação estável acima de mil calorias durante duas semanas sem falhas.

  3. Optimizar o agendamento de recursos de Poder de computação, aumentando a eficiência de uso.

  4. Melhorar o desempenho da rede, evitando que a velocidade e a eficiência do treinamento sejam afetadas.

  5. Transição da arquitetura de computação em nuvem para a arquitetura de supercomputação, a fim de reduzir custos.

  6. Utilizar plataformas nacionais para o treino e inferência de grandes modelos, substituindo as GPUs da Nvidia.

Para a maioria das empresas, é muito difícil satisfazer as suas necessidades com centros de dados próprios, por isso muitas equipas de algoritmos optam por prestadores de serviços de poder de computação profissionais para apoio. Apenas um cluster de GPU de nível kilocaloria pode gerar economias de escala, e escolher um prestador de serviços de poder de computação pode reduzir os custos marginais.

O poder de computação já se desenvolveu, no processo de demanda do mercado e iteração tecnológica, para um novo modelo de serviço. A essência do serviço de poder de computação é a realização da saída unificada de poder de computação heterogêneo através de novas tecnologias de computação, e a fusão com computação em nuvem, big data, IA e outras tecnologias. Ele inclui não apenas poder de computação, mas também o encapsulamento unificado de recursos como armazenamento e rede, para a entrega de poder de computação na forma de serviço, como API(.

Na cadeia da indústria de poder de computação, as empresas upstream fornecem principalmente recursos básicos como poder de computação genérico, poder de computação inteligente, poder de computação super e armazenamento e rede. As empresas midstream são principalmente provedores de serviços em nuvem e novos provedores de serviços de poder de computação, que realizam a produção de poder de computação através de tecnologias de orquestração, agendamento e negociação de poder de computação, e oferecem poder de computação através de APIs e outros meios. As empresas downstream são aquelas que dependem da capacidade de computação fornecida pelos serviços de poder de computação para realizar serviços de valor agregado na cadeia industrial.

A cobrança por uso e a cobrança anual ou mensal são os modos principais de serviço de poder de computação atuais. Os usuários podem escolher a instância de serviço de poder de computação correspondente ou a plataforma de serviço MaaS. O setor também está promovendo a "integração e fusão do poder de computação com a rede", apoiando a coordenação entre arquiteturas, regiões e provedores de serviços.

Com a normalização da demanda por computação de alto desempenho dos grandes modelos, o serviço de poder de computação, que surgiu dos serviços em nuvem, rapidamente entrou na visão do público, formando uma cadeia industrial e um modelo de negócios únicos. Embora a atual escassez de GPUs de alto desempenho tenha levado ao fenômeno de "escassez de chips", isso é apenas temporário. A longo prazo, o poder de computação se tornará um serviço, uma tendência certa, e os prestadores de serviços de poder de computação precisam estar preparados para ajustar suas estratégias rapidamente quando a direção do mercado mudar.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 7
  • Repostar
  • Compartilhar
Comentário
0/400
BoredRiceBallvip
· 07-22 22:40
Poder de computação Poder de computação como se compra?
Ver originalResponder0
ChainDetectivevip
· 07-22 10:50
A placa gráfica subir loucamente
Ver originalResponder0
MemecoinResearchervip
· 07-19 23:43
ngmi sem gpu meus camaradas
Ver originalResponder0
LiquidityWizardvip
· 07-19 23:43
na verdade, a dinâmica de oferta vs demanda já está precificada... 98,7% confiante
Ver originalResponder0
LiquidationWatchervip
· 07-19 23:36
Aproveitando o poder de computação...
Ver originalResponder0
WealthCoffeevip
· 07-19 23:33
Ou ganha muito, ou morre.
Ver originalResponder0
ForkItAllDayvip
· 07-19 23:30
Uma nova maneira de ganhar dinheiro chegou!
Ver originalResponder0
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)