Potencia computacional servicio se eleva: nuevas oportunidades y desafíos en la era de los grandes modelos

robot
Generación de resúmenes en curso

Potencia computacional servicio: un nuevo modelo de negocio en la era de los grandes modelos

Con el auge de los grandes modelos de inteligencia artificial, la potencia computacional se ha convertido en un nuevo modelo de negocio. Aunque la actual tendencia de "refinar el elixir" de los grandes modelos puede ir disminuyendo gradualmente, los proveedores de potencia computacional deben prepararse y ajustar oportunamente su dirección estratégica.

Bi Kaifeng, graduado de la Universidad de Tsinghua hace 3 años, entrenó un gran modelo meteorológico utilizando 40 años de datos meteorológicos globales y realizó aproximadamente 2 meses de preentrenamiento con 200 tarjetas GPU. Calculando a un precio de 7,8 yuanes/hora por GPU, el costo de entrenamiento de este gran modelo en el campo vertical podría superar los 2 millones de yuanes. Si se tratara de entrenar un gran modelo general, el costo podría incrementarse por cien.

Actualmente, en China ya hay más de 100 modelos grandes con una escala de 10 mil millones de parámetros. Sin embargo, la industria enfrenta en general el problema de la escasez de GPUs de alta gama. El alto costo de la potencia computacional y la falta de potencia computacional y fondos se han convertido en un dilema para muchas empresas.

La escasez de GPU de alto rendimiento es un problema difícil de resolver en toda la industria. La explosión de los modelos grandes ha llevado a un rápido aumento de la demanda de potencia computacional en el mercado, pero la velocidad de suministro no puede seguir el ritmo. Aunque a largo plazo la oferta de potencia computacional seguramente pasará de un mercado de vendedores a un mercado de compradores, todavía se desconoce cuánto tiempo tomará este proceso.

Las empresas están calculando cuántas GPU de NVIDIA tienen en sus manos para determinar su cuota de mercado. Personas informadas indican que, si se tiene cerca de 10,000 tarjetas y el total de tarjetas en el mercado es de 100,000, entonces la cuota sería del 10%. Se espera que para fin de año se alcancen las 40,000 tarjetas, y si en ese momento el total del mercado es de 200,000, podría representar el 20% de la cuota de mercado.

Por un lado, es difícil conseguir tarjetas GPU, y por otro lado, el umbral para el entrenamiento de grandes modelos no es tan fácil de superar como se promociona en la industria. Entrenar un gran modelo general de un tamaño de mil millones de parámetros o más puede costar decenas de miles de millones e incluso cientos de miles de millones. Algunos profesionales de la industria han expresado que, sin el apoyo de miles de millones o cientos de miles de millones de fondos, es difícil desarrollarse a largo plazo en este campo.

Ante esta situación, se considera ampliamente en la industria que, a medida que la competencia en el mercado de modelos grandes se intensifica, el mercado también pasará de la euforia a la racionalidad, y las empresas controlarán costos y ajustarán estrategias según los cambios esperados.

Para hacer frente a la escasez de GPU de alta gama, las empresas han tomado diversas medidas.

  1. Utilizar datos de mayor calidad para el entrenamiento, mejorando la eficiencia del entrenamiento.

  2. Mejorar la capacidad de infraestructura, logrando un funcionamiento estable de más de mil calorías durante dos semanas sin caídas.

  3. Optimizar la programación de recursos de potencia computacional, aumentar la eficiencia de uso.

  4. Mejorar el rendimiento de la red, evitando que la velocidad de entrenamiento y la eficiencia se vean afectadas.

  5. Transición de la arquitectura de computación en la nube a la arquitectura de supercomputación para reducir costos.

  6. Utilizar plataformas nacionales para el entrenamiento e inferencia de grandes modelos, en lugar de GPUs de Nvidia.

Para la mayoría de las empresas, construir un centro de datos propio para satisfacer la demanda es muy difícil, por lo que muchos equipos de algoritmos eligen proveedores de servicios de potencia computacional profesionales para obtener apoyo. Solo los clústeres de GPU de nivel kilocaloría pueden generar economías de escala, y elegir un proveedor de servicios de potencia computacional puede reducir los costos marginales.

La potencia computacional ha evolucionado en un nuevo modelo de servicio a lo largo del proceso de demanda del mercado y la iteración tecnológica. La esencia del servicio de potencia computacional es lograr una salida unificada de potencia computacional heterogénea a través de nuevas tecnologías de computación, fusionándose con tecnologías como la computación en la nube, grandes datos e IA. No solo incluye potencia computacional, sino también el empaquetado unificado de recursos como almacenamiento y red, para llevar a cabo la entrega de potencia computacional en forma de servicio ( como API ).

En la cadena de la industria de la potencia computacional, las empresas de upstream se centran principalmente en suministrar recursos básicos como potencia computacional general, potencia computacional inteligente, potencia computacional de supercomputación, almacenamiento y redes. Las empresas de midstream se componen principalmente de proveedores de servicios en la nube y nuevos proveedores de servicios de potencia computacional, que implementan la producción de potencia computacional a través de tecnologías de orquestación, programación y comercio de potencia computacional, y proporcionan potencia computacional a través de API y otros medios. Las empresas de downstream son aquellas que dependen de la capacidad de cálculo proporcionada por los servicios de potencia computacional para ofrecer servicios de valor añadido en la cadena industrial.

La facturación por uso y la facturación anual o mensual son los modelos predominantes de servicio de potencia computacional en la actualidad. Los usuarios pueden elegir las instancias de servicio de potencia computacional correspondientes o la plataforma de servicios MaaS. La industria también está promoviendo la "integración y fusión de la red de potencia computacional", apoyando la programación entre arquitecturas, regiones y proveedores de servicios.

Con la normalización de la demanda de computación de alto rendimiento para grandes modelos, los servicios de potencia computacional, derivados de los servicios en la nube, han entrado rápidamente en la vista del público, formando una cadena industrial y un modelo comercial únicos. Aunque la actual escasez de GPU de alta gama ha llevado a un fenómeno de "captura de chips", esto es solo temporal. A largo plazo, la potencia computacional como servicio es una tendencia segura, y los proveedores de servicios de potencia computacional deben estar preparados para ajustar sus estrategias de manera oportuna cuando cambie la dirección del mercado.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • Republicar
  • Compartir
Comentar
0/400
BoredRiceBallvip
· 07-22 22:40
Potencia computacional Potencia computacional, ¿cómo se puede comprar?
Ver originalesResponder0
ChainDetectivevip
· 07-22 10:50
¡Las tarjetas gráficas han subido locamente!
Ver originalesResponder0
MemecoinResearchervip
· 07-19 23:43
ngmi sin gpu, mis amigos
Ver originalesResponder0
LiquidityWizardvip
· 07-19 23:43
de hecho, la dinámica de oferta y demanda ya está valorada... 98.7% seguro
Ver originalesResponder0
LiquidationWatchervip
· 07-19 23:36
Aprovechando la potencia computacional...
Ver originalesResponder0
WealthCoffeevip
· 07-19 23:33
O ganas mucho o mueres.
Ver originalesResponder0
ForkItAllDayvip
· 07-19 23:30
¡Ha llegado una nueva forma de ganar dinero!
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)