HOTNEWS.ID - Perusahaan kecerdasan buatan (AI) ternama asal Cina, DeepSeek, baru-baru ini mengumumkan inovasi signifikan dalam efisiensi pemrosesan model bahasa besar melalui peluncuran kerangka kerja open-source bernama DSpark. Inovasi ini diklaim mampu mendongkrak kecepatan generasi teks secara substansial, mencapai peningkatan antara 60% hingga 85% tanpa perlu memodifikasi arsitektur dasar model AI yang sudah ada.

Secara fundamental, DSpark berfungsi layaknya "asisten pengetik cepat" yang bekerja mendampingi model AI utama yang berukuran besar dan kompleks. Model DSpark yang lebih kecil dan ringan ini bertugas menebak dan menyusun draf kalimat secara instan sebelum model utama memprosesnya.

Setelah draf awal diselesaikan oleh DSpark, model AI utama yang lebih cerdas hanya perlu melakukan proses pemeriksaan dan validasi secara berkelompok (batch verification). Metode cerdas ini terbukti efektif memangkas waktu tunggu respons atau latensi tanpa menimbulkan penurunan sedikit pun pada kualitas kecerdasan model target.

DeepSeek kini mengarahkan fokus strategisnya menuju optimalisasi mendalam pada proses inferensi, bukan hanya bersaing dalam aspek kualitas kecerdasan buatan semata. Melalui terobosan ini, perusahaan berupaya meningkatkan efisiensi penyebaran infrastruktur komputasi AI dalam skenario dunia nyata.

Kerangka kerja inovatif ini dijelaskan secara rinci dalam makalah ilmiah berjudul "DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation." Makalah tersebut merupakan hasil kolaborasi antara pendiri DeepSeek, Liang Wenfeng, bersama para peneliti dari Peking University.

Seiring dengan publikasi makalah ilmiah tersebut, DeepSeek secara resmi membuka akses publik terhadap model DeepSeek-V4-Pro-DSpark dan DeepSeek-V4-Flash-DSpark. Selain itu, perusahaan juga merilis rantai alat pelatihan komprehensif bernama DeepSpec secara gratis melalui platform GitHub.

Metode speculative decoding sendiri merupakan teknik akselerasi inferensi tanpa kehilangan kualitas (lossless) yang bekerja dengan memisahkan proses pembuatan draf dari proses verifikasi oleh model target. Model draf yang ringan menghasilkan urutan teks dengan sangat cepat, kemudian model target memverifikasinya secara massal, menukar daya komputasi mentah demi mengurangi latensi respons.

Namun, sistem penyusun draf paralel yang ada sebelumnya sering menghadapi tantangan penurunan drastis pada tingkat penerimaan data (acceptance rate) di bagian akhir urutan teks karena hilangnya dependensi antar token.

DSpark dirancang untuk mengatasi hambatan sistemik ini melalui dua inovasi utama yang sangat krusial. Pertama, arsitektur semi-autoregressive menggabungkan jaringan tulang punggung paralel dengan modul serial ringan untuk membangun dependensi token di dalam blok pemrosesan.