Puissance de calcul Service : Un nouveau modèle commercial à l'ère des grands modèles
Avec l'émergence des grands modèles d'intelligence artificielle, la puissance de calcul est devenue un nouveau modèle commercial. Bien que la tendance actuelle de "l'alchimie" des grands modèles puisse progressivement s'estomper, les fournisseurs de services de puissance de calcul doivent anticiper et ajuster leur direction stratégique en temps utile.
Après avoir obtenu son diplôme de l'Université Tsinghua, Bi Kaifeng a passé 3 ans à entraîner un grand modèle météorologique, utilisant 40 ans de données météorologiques mondiales et environ 200 cartes GPU pendant environ 2 mois de pré-formation. En tenant compte d'un coût de 7,8 CNY par heure par GPU, le coût de formation de ce grand modèle dans un domaine vertical pourrait dépasser 2 millions de CNY. Si c'était pour entraîner un modèle général, le coût pourrait être multiplié par 100.
Actuellement, la Chine dispose de plus de 100 grands modèles avec une échelle de 10 milliards de paramètres. Cependant, l'industrie fait face à un problème généralisé de pénurie de GPU haut de gamme. Les coûts de puissance de calcul sont élevés, et le manque de puissance de calcul et de financement est devenu un défi pour de nombreuses entreprises.
La pénurie de GPU haut de gamme est un problème difficile à résoudre dans toute l'industrie. L'explosion des grands modèles a entraîné une demande croissante de puissance de calcul sur le marché, mais l'augmentation de l'offre ne suit pas du tout. Bien qu'à long terme, l'offre de puissance de calcul passera d'un marché de vendeurs à un marché d'acheteurs, la durée de ce processus reste inconnue.
Chaque entreprise calcule combien de GPU Nvidia elle possède pour évaluer sa part de marché. Selon des sources bien informées, si une entreprise dispose de près de 10 000 cartes et que le marché total est de 100 000 cartes, alors sa part est de 10 %. On s'attend à ce qu'elle atteigne 40 000 cartes d'ici la fin de l'année, et si le marché total est alors de 200 000 cartes, cela pourrait représenter 20 % de part de marché.
D'une part, il est difficile d'acheter des cartes GPU, d'autre part, le seuil d'entrée pour l'entraînement de grands modèles n'est pas aussi facile à franchir que ce que l'industrie prétend. Entraîner un grand modèle général de taille supérieure à un milliard de paramètres pourrait coûter des dizaines de milliards, voire des centaines de milliards de yuans. Des professionnels de l'industrie affirment que sans un soutien financier de plusieurs milliards ou centaines de milliards, il est difficile de se développer à long terme dans ce domaine.
Face à cette situation, l'industrie pense généralement qu'avec l'intensification de la concurrence sur le marché des grands modèles, le marché passera d'une phase d'engouement à une phase de rationalité, et les entreprises ajusteront leurs coûts et leurs stratégies en fonction des évolutions attendues.
Pour faire face à la pénurie de GPU haut de gamme, les entreprises ont adopté diverses mesures.
Utiliser des données de meilleure qualité pour l'entraînement, améliorer l'efficacité de l'entraînement.
Améliorer la capacité de l'infrastructure pour garantir un fonctionnement stable de plus de mille calories pendant deux semaines sans perte de cartes.
Optimiser la planification des ressources de puissance de calcul, améliorer l'efficacité d'utilisation.
Améliorer les performances du réseau, éviter que la vitesse et l'efficacité de l'entraînement ne soient affectées.
Passer de l'architecture de cloud computing à l'architecture de supercalcul, afin de réduire les coûts.
Utiliser des plateformes nationales pour l'entraînement et l'inférence de grands modèles, remplaçant les GPU Nvidia.
Pour la plupart des entreprises, il est très difficile de répondre à leurs besoins en construisant des centres de données eux-mêmes, c'est pourquoi de nombreuses équipes d'algorithmes choisissent des fournisseurs de services de puissance de calcul professionnels pour les soutenir. Des clusters GPU de niveau kilocalorie sont nécessaires pour générer des économies d'échelle, choisir un fournisseur de puissance de calcul peut réduire les coûts marginaux.
La puissance de calcul a évolué en un nouveau modèle de service dans le cadre de la demande du marché et de l'itération technologique. L'essence du service de puissance de calcul est de réaliser une sortie unifiée de la puissance de calcul hétérogène grâce à de nouvelles technologies de calcul, et de s'intégrer avec des technologies telles que le cloud computing, les grandes données et l'IA. Cela inclut non seulement la puissance de calcul, mais aussi l'emballage unifié des ressources telles que le stockage et le réseau, afin d'effectuer la livraison de la puissance de calcul sous forme de service ( comme API ).
Dans la chaîne industrielle de la puissance de calcul, les entreprises en amont fournissent principalement des ressources de base telles que la puissance de calcul générale, la puissance de calcul intelligente, la puissance de calcul de supercalculateurs, le stockage et le réseau. Les entreprises intermédiaires, principalement des fournisseurs de services cloud et des fournisseurs de services de puissance de calcul innovants, réalisent la production de puissance de calcul grâce à des techniques d'orchestration, de planification et de négociation de puissance de calcul, et fournissent de la puissance de calcul par le biais d'API et d'autres moyens. Les entreprises en aval sont des acteurs de la chaîne industrielle qui s'appuient sur la capacité de calcul fournie par les services de puissance de calcul pour offrir des services à valeur ajoutée.
La facturation à la demande et la facturation par abonnement annuel ou mensuel sont les modèles principaux des services de puissance de calcul actuels. Les utilisateurs peuvent choisir les instances de service de puissance de calcul ou les plateformes de service MaaS correspondantes. L'industrie progresse également vers l'"intégration de la puissance de calcul et du réseau", soutenant la planification inter-architecture, inter-régionale et inter-fournisseur.
Avec la normalisation de la demande de calcul haute performance des grands modèles, les services de puissance de calcul, dérivés des services cloud, entrent rapidement dans le champ de vision du grand public, formant une chaîne industrielle et un modèle commercial uniques. Bien que la pénurie actuelle de GPU haut de gamme ait entraîné un phénomène de "chasse aux puces", cela n'est que temporaire. À long terme, la puissance de calcul devenant un service est une tendance certaine, et les fournisseurs de services de puissance de calcul doivent se préparer à ajuster rapidement leur stratégie lorsque la direction du marché changera.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
10 J'aime
Récompense
10
7
Partager
Commentaire
0/400
BoredRiceBall
· 07-22 22:40
Puissance de calcul Puissance de calcul, comment peut-on se le permettre ?
Voir l'originalRépondre0
ChainDetective
· 07-22 10:50
Les cartes graphiques sont en pleine hausse !
Voir l'originalRépondre0
MemecoinResearcher
· 07-19 23:43
ngmi sans gpu mes gars
Voir l'originalRépondre0
LiquidityWizard
· 07-19 23:43
en réalité, les dynamiques de l'offre et de la demande sont déjà intégrées dans les prix... 98,7 % de confiance
Voir l'originalRépondre0
LiquidationWatcher
· 07-19 23:36
Positionnement pour gagner en puissance de calcul...
Voir l'originalRépondre0
WealthCoffee
· 07-19 23:33
Soit vous gagnez gros, soit vous mourez.
Voir l'originalRépondre0
ForkItAllDay
· 07-19 23:30
Une nouvelle méthode pour gagner de l'argent est arrivée!
Puissance de calcul services émergente : nouvelles opportunités et défis à l'ère des grands modèles
Puissance de calcul Service : Un nouveau modèle commercial à l'ère des grands modèles
Avec l'émergence des grands modèles d'intelligence artificielle, la puissance de calcul est devenue un nouveau modèle commercial. Bien que la tendance actuelle de "l'alchimie" des grands modèles puisse progressivement s'estomper, les fournisseurs de services de puissance de calcul doivent anticiper et ajuster leur direction stratégique en temps utile.
Après avoir obtenu son diplôme de l'Université Tsinghua, Bi Kaifeng a passé 3 ans à entraîner un grand modèle météorologique, utilisant 40 ans de données météorologiques mondiales et environ 200 cartes GPU pendant environ 2 mois de pré-formation. En tenant compte d'un coût de 7,8 CNY par heure par GPU, le coût de formation de ce grand modèle dans un domaine vertical pourrait dépasser 2 millions de CNY. Si c'était pour entraîner un modèle général, le coût pourrait être multiplié par 100.
Actuellement, la Chine dispose de plus de 100 grands modèles avec une échelle de 10 milliards de paramètres. Cependant, l'industrie fait face à un problème généralisé de pénurie de GPU haut de gamme. Les coûts de puissance de calcul sont élevés, et le manque de puissance de calcul et de financement est devenu un défi pour de nombreuses entreprises.
La pénurie de GPU haut de gamme est un problème difficile à résoudre dans toute l'industrie. L'explosion des grands modèles a entraîné une demande croissante de puissance de calcul sur le marché, mais l'augmentation de l'offre ne suit pas du tout. Bien qu'à long terme, l'offre de puissance de calcul passera d'un marché de vendeurs à un marché d'acheteurs, la durée de ce processus reste inconnue.
Chaque entreprise calcule combien de GPU Nvidia elle possède pour évaluer sa part de marché. Selon des sources bien informées, si une entreprise dispose de près de 10 000 cartes et que le marché total est de 100 000 cartes, alors sa part est de 10 %. On s'attend à ce qu'elle atteigne 40 000 cartes d'ici la fin de l'année, et si le marché total est alors de 200 000 cartes, cela pourrait représenter 20 % de part de marché.
D'une part, il est difficile d'acheter des cartes GPU, d'autre part, le seuil d'entrée pour l'entraînement de grands modèles n'est pas aussi facile à franchir que ce que l'industrie prétend. Entraîner un grand modèle général de taille supérieure à un milliard de paramètres pourrait coûter des dizaines de milliards, voire des centaines de milliards de yuans. Des professionnels de l'industrie affirment que sans un soutien financier de plusieurs milliards ou centaines de milliards, il est difficile de se développer à long terme dans ce domaine.
Face à cette situation, l'industrie pense généralement qu'avec l'intensification de la concurrence sur le marché des grands modèles, le marché passera d'une phase d'engouement à une phase de rationalité, et les entreprises ajusteront leurs coûts et leurs stratégies en fonction des évolutions attendues.
Pour faire face à la pénurie de GPU haut de gamme, les entreprises ont adopté diverses mesures.
Utiliser des données de meilleure qualité pour l'entraînement, améliorer l'efficacité de l'entraînement.
Améliorer la capacité de l'infrastructure pour garantir un fonctionnement stable de plus de mille calories pendant deux semaines sans perte de cartes.
Optimiser la planification des ressources de puissance de calcul, améliorer l'efficacité d'utilisation.
Améliorer les performances du réseau, éviter que la vitesse et l'efficacité de l'entraînement ne soient affectées.
Passer de l'architecture de cloud computing à l'architecture de supercalcul, afin de réduire les coûts.
Utiliser des plateformes nationales pour l'entraînement et l'inférence de grands modèles, remplaçant les GPU Nvidia.
Pour la plupart des entreprises, il est très difficile de répondre à leurs besoins en construisant des centres de données eux-mêmes, c'est pourquoi de nombreuses équipes d'algorithmes choisissent des fournisseurs de services de puissance de calcul professionnels pour les soutenir. Des clusters GPU de niveau kilocalorie sont nécessaires pour générer des économies d'échelle, choisir un fournisseur de puissance de calcul peut réduire les coûts marginaux.
La puissance de calcul a évolué en un nouveau modèle de service dans le cadre de la demande du marché et de l'itération technologique. L'essence du service de puissance de calcul est de réaliser une sortie unifiée de la puissance de calcul hétérogène grâce à de nouvelles technologies de calcul, et de s'intégrer avec des technologies telles que le cloud computing, les grandes données et l'IA. Cela inclut non seulement la puissance de calcul, mais aussi l'emballage unifié des ressources telles que le stockage et le réseau, afin d'effectuer la livraison de la puissance de calcul sous forme de service ( comme API ).
Dans la chaîne industrielle de la puissance de calcul, les entreprises en amont fournissent principalement des ressources de base telles que la puissance de calcul générale, la puissance de calcul intelligente, la puissance de calcul de supercalculateurs, le stockage et le réseau. Les entreprises intermédiaires, principalement des fournisseurs de services cloud et des fournisseurs de services de puissance de calcul innovants, réalisent la production de puissance de calcul grâce à des techniques d'orchestration, de planification et de négociation de puissance de calcul, et fournissent de la puissance de calcul par le biais d'API et d'autres moyens. Les entreprises en aval sont des acteurs de la chaîne industrielle qui s'appuient sur la capacité de calcul fournie par les services de puissance de calcul pour offrir des services à valeur ajoutée.
La facturation à la demande et la facturation par abonnement annuel ou mensuel sont les modèles principaux des services de puissance de calcul actuels. Les utilisateurs peuvent choisir les instances de service de puissance de calcul ou les plateformes de service MaaS correspondantes. L'industrie progresse également vers l'"intégration de la puissance de calcul et du réseau", soutenant la planification inter-architecture, inter-régionale et inter-fournisseur.
Avec la normalisation de la demande de calcul haute performance des grands modèles, les services de puissance de calcul, dérivés des services cloud, entrent rapidement dans le champ de vision du grand public, formant une chaîne industrielle et un modèle commercial uniques. Bien que la pénurie actuelle de GPU haut de gamme ait entraîné un phénomène de "chasse aux puces", cela n'est que temporaire. À long terme, la puissance de calcul devenant un service est une tendance certaine, et les fournisseurs de services de puissance de calcul doivent se préparer à ajuster rapidement leur stratégie lorsque la direction du marché changera.