Rumah Berita Kos Pembangunan AI DeepSeek Terungkap: $ 1.6 bilion, Membebaskan Mitos Kemampuan

Kos Pembangunan AI DeepSeek Terungkap: $ 1.6 bilion, Membebaskan Mitos Kemampuan

Pengarang : Lily Apr 18,2025

Chatbot baru Deepseek telah membuat gelombang dalam industri AI, meletakkan dirinya sebagai pesaing yang hebat. Syarikat itu memperkenalkan AI dengan tagline yang menarik: "Hai, saya telah dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." Kenyataan berani ini telah bergema dengan pengguna, dan hari ini, kemajuan DeepSeek telah menyumbang kepada salah satu penurunan harga saham terbesar untuk Nvidia, yang menonjolkan kesan teknologinya.

Ujian DeepSeek Imej: ensigame.com

Apa yang membezakan model DeepSeek adalah kaedah seni bina dan latihan yang inovatif. Berikut adalah teknologi utama yang menguasai ai:

Ramalan Multi-Token (MTP): Tidak seperti model tradisional yang meramalkan satu perkataan pada satu masa, pendekatan MTP DeepSeek meramalkan pelbagai perkataan secara serentak dengan menganalisis bahagian-bahagian yang berlainan dari satu ayat. Kaedah ini meningkatkan ketepatan dan kecekapan model.

Campuran Pakar (MOE): Senibina ini menggunakan pelbagai rangkaian saraf untuk memproses data input. Ia mempercepatkan latihan AI dan meningkatkan prestasi. Di Deepseek V3, 256 rangkaian saraf digunakan, dengan lapan diaktifkan untuk setiap tugas pemprosesan token.

Perhatian Laten Multi-Head (MLA): Mekanisme ini memberi tumpuan kepada bahagian-bahagian yang paling penting dalam satu kalimat. MLA mengekstrak butiran utama dari serpihan teks berulang kali, mengurangkan kemungkinan maklumat penting yang hilang. Ini memastikan AI menangkap nuansa penting dalam data input.

DeepSeek V3 Imej: ensigame.com

DeepSeek, permulaan Cina yang terkenal, mendakwa telah membangunkan model AI yang kompetitif dengan kos yang minimum, menyatakan bahawa mereka hanya menghabiskan $ 6 juta untuk melatih rangkaian saraf yang kuat DeepSeek V3 dan hanya menggunakan pemproses grafik 2048. Walau bagaimanapun, penganalisis dari semianalisis telah mendedahkan bahawa DeepSeek mengendalikan infrastruktur pengkomputeran yang luas yang terdiri daripada kira -kira 50,000 GPU NVIDIA Hopper, termasuk 10,000 H800 unit, 10,000 lebih maju H100S, dan GPU tambahan H20. Sumber -sumber ini diedarkan di beberapa pusat data dan digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.

Jumlah pelaburan syarikat dalam pelayan berjumlah sekitar $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta. DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang memancarkan permulaan sebagai bahagian yang berasingan yang memberi tumpuan kepada teknologi AI pada tahun 2023. Syarikat itu tetap dibiayai sendiri, yang memberi kesan positif kepada kelonggaran dan kelajuan membuat keputusan.

DeepseekImej: ensigame.com

Lebih -lebih lagi, beberapa penyelidik di DeepSeek memperoleh lebih dari $ 1.3 juta setiap tahun, menarik bakat teratas dari universiti -universiti China yang terkemuka (syarikat itu tidak mengupah pakar asing). Walaupun memandangkan ini, tuntutan DeepSeek baru -baru ini melatih model terkini untuk hanya $ 6 juta nampaknya tidak realistik. Angka ini hanya merujuk kepada kos penggunaan GPU semasa latihan pra-latihan dan tidak mengambil kira perbelanjaan penyelidikan, penghalusan model, pemprosesan data, atau kos infrastruktur keseluruhan.

Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Walau bagaimanapun, tidak seperti syarikat yang lebih besar yang dibebani oleh birokrasi, struktur padat DeepSeek membolehkannya secara aktif dan berkesan melaksanakan inovasi AI.

DeepseekImej: ensigame.com

Contoh DeepSeek menunjukkan bahawa syarikat AI bebas yang dibiayai dengan baik dapat bersaing dengan pemimpin industri. Walau bagaimanapun, pakar menekankan bahawa kejayaan syarikat itu sebahagian besarnya disebabkan oleh berbilion -bilion dalam pelaburan, penemuan teknikal, dan pasukan yang kuat, sementara tuntutan tentang "anggaran revolusioner" untuk membangunkan model AI agak dibesar -besarkan. Namun, kos pesaing kekal lebih tinggi. Sebagai contoh, bandingkan kos latihan model: DeepSeek membelanjakan $ 5 juta pada R1, manakala CHATGPT4O berharga $ 100 juta.

Artikel terkini Lagi
  • Kanak-kanak Morta Menambah Koperasi Dalam Talian dalam Kemas Kini Baru

    Kanak-kanak Morta, hack atas-bawah yang dikasihi 'n slash RPG yang terkenal dengan naratif keluarga yang unik dan unsur-unsur Roguelike, baru saja menjadi lebih menarik dengan penambahan koperasi dalam talian. Kemas kini terbaru ini membawa dimensi baru ke permainan, membolehkan pemain bekerjasama dengan rakan dan

    Jun 26,2025
  • Komposer DK Rap mendedahkan kekurangan kredit dalam filem Super Mario Bros.

    Grant Kirkhope, komposer yang diiktiraf di belakang soundtracks permainan video ikonik seperti Donkey Kong 64, baru-baru ini berkongsi pandangan tentang mengapa dia tidak dikreditkan dalam filem Super Mario Bros untuk karyanya pada DK Rap.

    Jun 26,2025
  • DC Dark Legion ™: Watak teratas dilancarkan

    DC: Dark Legion menawarkan senarai luas pahlawan dan penjahat legenda dari DC Universe, menyampaikan pengalaman strategik yang mendalam di mana komposisi pasukan dan sinergi watak memainkan peranan penting dalam menentukan kemenangan. Sama ada anda memasang skuad superhero yang kuat atau mencipta seorang yang jahat

    Jun 26,2025
  • Pandoland dan Hatsune Miku bergabung dengan Pengembaraan Blok Masa Terbatas

    Dalam gabungan budaya pop maya dan permainan mudah alih, Pandoland, RPG dunia terbuka 3D yang dibangunkan oleh Wonder Planet dengan kerjasama Game Freak, bersedia untuk mengalu-alukan beberapa bintang digital yang paling ikonik-Hatsune Miku, Kagamine Rin, dan Kagamine Len. Artis vocaloid yang dikasihi ini adalah langkah

    Jun 26,2025
  • Danmachi Battle Chronicle Eos: Versi Luar Talian untuk kekal

    Tindakan 3D yang popular RPG *Danmachi Battle Chronicle *, secara rasmi dikenali sebagai *Adakah salah untuk cuba mengambil gadis -gadis di penjara bawah tanah? Battle Chronicle*, telah mengumumkan akhir perkhidmatannya (EOS). Bertujuan, pemaju dan penerbit permainan, telah mengesahkan bahawa tajuk itu akan ditutup secara kekal.When

    Jun 26,2025
  • Eevee kembali untuk Pokémon Go Julai Hari Komuniti Klasik

    Selepas Jangmo-O bersinar semasa Hari Komuniti Jun Pokémon Go pada 21, kegembiraan berterusan ke bulan Julai. Sorotan itu beralih kepada kegemaran peminat yang dikasihi untuk klasik Hari Komuniti yang akan datang. Eevee, The Evolution Pokémon, akan mengambil peringkat tengah pada hujung minggu 5 dan 6 Julai, dari 2:00

    Jun 25,2025