Kepopuleran "melakukan alkimia" model besar akan berlalu, tetapi Daya Komputasi sedang menjadi model bisnis baru. Penyedia layanan Daya Komputasi perlu mempersiapkan diri dan beralih tepat waktu.
Baru-baru ini, sekelompok peneliti menggunakan data cuaca global selama 40 tahun, dengan 200 kartu GPU untuk pre-training, dan dalam waktu sekitar 2 bulan, mereka berhasil melatih model cuaca besar dengan jumlah parameter mencapai miliaran. Berdasarkan perhitungan biaya 7,8 yuan/jam per kartu GPU, biaya pelatihan model ini mungkin melebihi 2 juta yuan. Sedangkan jika itu adalah pelatihan model besar umum, biayanya mungkin meningkat seratus kali lipat.
Saat ini, ada lebih dari 100 model besar dengan skala 1 miliar parameter di Tiongkok. Namun, "pembuatan obat" model besar yang dibanjiri oleh industri menghadapi masalah sulitnya mendapatkan GPU kelas atas. Biaya daya komputasi yang tinggi, kekurangan daya komputasi, dan kekurangan dana menjadi masalah yang paling nyata di depan industri.
Kekurangan GPU kelas atas tidak dapat diatasi di seluruh industri. Pada puncaknya, harga satu A100 telah diborong hingga dua hingga tiga puluh ribu yuan, dan harga sewa bulanan untuk satu server A100 juga melonjak hingga 5-7 ribu yuan/bulan. Meskipun demikian, harga yang tinggi masih mungkin tidak mendapatkan chip.
Persaingan di pasar model besar sangat ketat, tanpa investasi miliaran dana, sangat sulit untuk terus mengembangkan model besar. Beberapa pengusaha menyatakan bahwa tanpa dukungan dana ratusan miliar hingga triliunan, sulit untuk menjalani jalur ini. Seiring pasar beralih dari euforia ke rasionalitas, perusahaan juga akan mengontrol biaya dan menyesuaikan strategi sesuai dengan perubahan ekspektasi.
Menghadapi Daya Komputasi yang kurang, perusahaan mengambil berbagai langkah untuk menghadapinya:
Menggunakan data berkualitas lebih tinggi untuk meningkatkan efisiensi pelatihan
Meningkatkan kemampuan infrastruktur untuk mencapai operasi stabil di atas seribu kalori
Optimalisasi Penjadwalan Sumber Daya Daya Komputasi
Dari arsitektur komputasi awan ke arsitektur superkomputer
Menggunakan platform dalam negeri sebagai pengganti GPU Nvidia
Metode-metode ini masing-masing merupakan proyek yang relatif besar, biasanya sulit bagi perusahaan untuk memenuhi kebutuhan melalui pembangunan pusat data sendiri. Banyak tim algoritma memilih penyedia Daya Komputasi profesional untuk memberikan dukungan.
Daya Komputasi sudah menjadi suatu mode layanan baru. Layanan daya komputasi berbasis pada keberagaman daya komputasi, terhubung melalui jaringan daya komputasi, dengan tujuan menyediakan daya komputasi yang efektif. Ini tidak hanya mencakup daya komputasi, tetapi juga pengemasan sumber daya seperti penyimpanan, jaringan, dan lain-lain dalam bentuk layanan ( seperti API ) untuk menyelesaikan pengiriman daya komputasi.
Dari sudut pandang struktur rantai industri, perusahaan hulu terutama menyediakan Daya Komputasi sebagai sumber dasar, perusahaan tengah bertanggung jawab atas produksi dan penyediaan Daya Komputasi, sementara perusahaan hilir adalah pihak yang menggunakan Daya Komputasi. Saat ini, pembayaran berdasarkan kuantitas dan paket tahunan/bulanan adalah model penagihan yang utama.
Dengan normalisasi kebutuhan komputasi berkinerja tinggi untuk model besar, layanan daya komputasi yang berasal dari layanan cloud dengan cepat memasuki pandangan publik, membentuk rantai industri dan model bisnis yang unik. Pada awal ledakan industri daya komputasi ini, kekurangan GPU kelas atas, biaya daya komputasi yang tinggi, dan perebutan "chip" menjadi pemandangan unik di era ini.
Dalam jangka panjang, daya komputasi menjadi tren yang pasti sebagai sebuah layanan. Penyedia layanan daya komputasi perlu mempersiapkan diri untuk menyesuaikan strategi mereka dengan cepat saat model besar kembali rasional dan arah pasar berubah dengan cepat.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
18 Suka
Hadiah
18
5
Bagikan
Komentar
0/400
StakeOrRegret
· 07-14 02:28
Jangan bicara apa pun jika uangnya belum sampai.
Lihat AsliBalas0
ParanoiaKing
· 07-14 02:27
Kartu hilang sudah gila, kapan Bencana Tambang akan direplikasi?
Lihat AsliBalas0
MEVHunterLucky
· 07-14 02:24
Bencana Tambang baru dimulai
Lihat AsliBalas0
DeFiCaffeinator
· 07-14 02:23
Ketahui lebih lanjut tentang mengumpulkan kartu grafis~
Perang perebutan Daya Komputasi di bawah gelombang model besar: bagaimana penyedia layanan menghadapi model bisnis baru
Model Bisnis Baru di Balik Perang Daya Komputasi
Kepopuleran "melakukan alkimia" model besar akan berlalu, tetapi Daya Komputasi sedang menjadi model bisnis baru. Penyedia layanan Daya Komputasi perlu mempersiapkan diri dan beralih tepat waktu.
Baru-baru ini, sekelompok peneliti menggunakan data cuaca global selama 40 tahun, dengan 200 kartu GPU untuk pre-training, dan dalam waktu sekitar 2 bulan, mereka berhasil melatih model cuaca besar dengan jumlah parameter mencapai miliaran. Berdasarkan perhitungan biaya 7,8 yuan/jam per kartu GPU, biaya pelatihan model ini mungkin melebihi 2 juta yuan. Sedangkan jika itu adalah pelatihan model besar umum, biayanya mungkin meningkat seratus kali lipat.
Saat ini, ada lebih dari 100 model besar dengan skala 1 miliar parameter di Tiongkok. Namun, "pembuatan obat" model besar yang dibanjiri oleh industri menghadapi masalah sulitnya mendapatkan GPU kelas atas. Biaya daya komputasi yang tinggi, kekurangan daya komputasi, dan kekurangan dana menjadi masalah yang paling nyata di depan industri.
Kekurangan GPU kelas atas tidak dapat diatasi di seluruh industri. Pada puncaknya, harga satu A100 telah diborong hingga dua hingga tiga puluh ribu yuan, dan harga sewa bulanan untuk satu server A100 juga melonjak hingga 5-7 ribu yuan/bulan. Meskipun demikian, harga yang tinggi masih mungkin tidak mendapatkan chip.
Persaingan di pasar model besar sangat ketat, tanpa investasi miliaran dana, sangat sulit untuk terus mengembangkan model besar. Beberapa pengusaha menyatakan bahwa tanpa dukungan dana ratusan miliar hingga triliunan, sulit untuk menjalani jalur ini. Seiring pasar beralih dari euforia ke rasionalitas, perusahaan juga akan mengontrol biaya dan menyesuaikan strategi sesuai dengan perubahan ekspektasi.
Menghadapi Daya Komputasi yang kurang, perusahaan mengambil berbagai langkah untuk menghadapinya:
Metode-metode ini masing-masing merupakan proyek yang relatif besar, biasanya sulit bagi perusahaan untuk memenuhi kebutuhan melalui pembangunan pusat data sendiri. Banyak tim algoritma memilih penyedia Daya Komputasi profesional untuk memberikan dukungan.
Daya Komputasi sudah menjadi suatu mode layanan baru. Layanan daya komputasi berbasis pada keberagaman daya komputasi, terhubung melalui jaringan daya komputasi, dengan tujuan menyediakan daya komputasi yang efektif. Ini tidak hanya mencakup daya komputasi, tetapi juga pengemasan sumber daya seperti penyimpanan, jaringan, dan lain-lain dalam bentuk layanan ( seperti API ) untuk menyelesaikan pengiriman daya komputasi.
Dari sudut pandang struktur rantai industri, perusahaan hulu terutama menyediakan Daya Komputasi sebagai sumber dasar, perusahaan tengah bertanggung jawab atas produksi dan penyediaan Daya Komputasi, sementara perusahaan hilir adalah pihak yang menggunakan Daya Komputasi. Saat ini, pembayaran berdasarkan kuantitas dan paket tahunan/bulanan adalah model penagihan yang utama.
Dengan normalisasi kebutuhan komputasi berkinerja tinggi untuk model besar, layanan daya komputasi yang berasal dari layanan cloud dengan cepat memasuki pandangan publik, membentuk rantai industri dan model bisnis yang unik. Pada awal ledakan industri daya komputasi ini, kekurangan GPU kelas atas, biaya daya komputasi yang tinggi, dan perebutan "chip" menjadi pemandangan unik di era ini.
Dalam jangka panjang, daya komputasi menjadi tren yang pasti sebagai sebuah layanan. Penyedia layanan daya komputasi perlu mempersiapkan diri untuk menyesuaikan strategi mereka dengan cepat saat model besar kembali rasional dan arah pasar berubah dengan cepat.