Apa yang dimaksud dengan Index Bloat? 9 Cara untuk Memperbaikinya
Apakah Google telah mengindeks halaman bernilai rendah dalam jumlah yang berlebihan dari situs Anda? Berikut ini cara mengidentifikasi index bloat dan menghapus indeks halaman tersebut dari Google.
Google sangat baik dalam melakukan tugasnya. Terkadang, sedikit terlalu baik – mengindeks halaman yang tidak pernah dimaksudkan untuk ditemukan.
URL yang tidak diinginkan yang tidak terdapat dalam peta situs Anda.
URL yatim piatu yang tidak ditautkan di situs web Anda.
URL aneh yang mungkin tidak Anda ketahui keberadaannya.
Sebagian besar profesional SEO khawatir tentang memasukkan halaman ke dalam indeks Google. Tetapi Anda juga perlu memperhatikan untuk mengeluarkan halaman bernilai rendah dari indeks.
Mari kita pelajari lebih dalam mengapa memiliki lebih sedikit halaman yang diindeks sebenarnya dapat menghasilkan jumlah sesi organik yang lebih tinggi. Dan bagaimana metode deindexing yang berbeda berdampak pada SEO.
Apa yang dimaksud dengan Index Bloat?
Index bloat adalah ketika sebuah situs memiliki terlalu banyak halaman bernilai rendah yang diindeks oleh mesin pencari. Halaman-halaman ini sering kali dibuat secara otomatis dengan sedikit atau tanpa konten unik.
Keberadaan URL ini memiliki dampak yang bertingkat pada seluruh proses SEO teknis.
Jenis URL umum yang menyebabkan index bloat antara lain:
Kombinasi filter dari navigasi segi.
Halaman arsip yang tidak teratur.
Halaman tag yang tidak terkendali.
Halaman penomoran halaman.
Halaman parameter yang sulit diatur.
Halaman konten yang kedaluwarsa.
Halaman hasil pencarian di tempat yang tidak dioptimalkan.
Profil pengguna yang dibuat secara otomatis dengan sedikit konten.
URL pelacakan.
Kesalahan penanganan http ke https.
www yang tidak konsisten vs non-www.
Subdirektori yang seharusnya tidak diindeks.
Index bloat mengurangi efisiensi perayapan karena Googlebot menelusuri jalur bernilai rendah. Hal ini memperlambat kecepatan pengindeksan untuk konten baru dan perayapan ulang konten yang diperbarui yang memang memiliki nilai SEO.
Seringkali, index bloat berisi konten duplikat atau menyebabkan kanibalisasi kata kunci. Dengan beberapa halaman dari satu situs yang bersaing untuk tujuan pencarian yang sama, menjadi membingungkan bagi mesin pencari untuk menentukan halaman mana yang paling relevan karena sinyal peringkat terbagi di banyak URL. Hal ini merusak kemampuan situs untuk mendapatkan peringkat di posisi teratas.
Dan jika halaman berkualitas rendah berhasil mendapatkan peringkat, para pencari kemungkinan besar akan kecewa dengan halaman arahan dan pogostick. Mengirimkan sinyal pengalaman pengguna yang buruk ke Google dan merugikan merek Anda.
Memajukan Bisnis Anda dengan Pemasaran Konten
Tingkatkan visibilitas online Anda, jangkau pelanggan baru, dan dorong penjualan dengan perangkat pemasaran konten lengkap ini.
Coba Gratis
Semua hal ini akan menurunkan evaluasi kualitas domain di mata mesin pencari.
Ini merupakan masalah karena URL tidak diberi peringkat hanya berdasarkan kemampuannya sendiri, tetapi juga berdasarkan situs tempat domain tersebut berada.
Setiap halaman yang diindeks mempengaruhi bagaimana algoritme kualitas Google mengevaluasi reputasi situs.
Google Webmaster Central menyatakan hal itu:
“Konten berkualitas rendah di beberapa bagian situs web dapat memengaruhi peringkat situs secara keseluruhan, dan dengan demikian menghapus halaman berkualitas rendah … pada akhirnya dapat membantu peringkat konten Anda yang berkualitas lebih tinggi.”
John Mueller menguraikan hal ini pada tahun 2015.
“Algoritme kualitas kami melihat situs web secara keseluruhan, jadi mereka melihat semua yang diindeks. Dan jika kami melihat bahwa sebagian besar konten yang diindeks sebenarnya adalah konten berkualitas lebih rendah, maka kami dapat mengatakan ‘baiklah, mungkin situs ini secara keseluruhan memiliki kualitas yang lebih rendah. Dan jika Anda dapat memberi tahu kami bahwa konten berkualitas rendah ini tidak boleh diindeks dan tidak boleh diperhitungkan, maka kami dapat benar-benar fokus pada hal-hal berkualitas tinggi yang Anda izinkan untuk diindeks.”
Dan lagi pada bulan Maret 2017. Dan lagi pada bulan Agustus 2017. Dan lagi pada bulan Oktober 2017.
Inilah sebabnya mengapa tujuan SEO bukan untuk memasukkan sebanyak mungkin halaman ke dalam indeks. Melainkan untuk membuat kecocokan yang berharga antara pencari dan halaman arahan.
Untuk mencapai tujuan ini, Anda hanya boleh mengizinkan pengindeksan halaman yang Anda inginkan untuk dikunjungi oleh para pencari dan menghapus indeks semua halaman yang tidak menawarkan nilai unik bagi mesin pencari atau pengguna.
Cara Mendiagnosis Index Bloat
Laporan Cakupan Google Search Console (GSC) adalah salah satu cara tercepat dan paling andal untuk mengidentifikasi jenis halaman yang menyebabkan index bloat.
Anggaplah peta situs XML Anda sesuai dengan praktik terbaik SEO, jadi hanya berisi URL yang relevan dengan SEO, cukup lihat contoh URL yang diindeks tetapi tidak dikirimkan dalam peta situs.
Jika peta situs XML Anda tidak dioptimalkan, jalankan alat perayapan tanpa batas dan bandingkan jumlah URL yang dapat diindeks yang diambil oleh perayap dengan jumlah halaman yang valid.
Jika Anda memiliki lebih banyak halaman yang valid daripada URL yang dirayapi, kemungkinan besar ada masalah index bloat.
Jangan gunakan operator situs: cari lanjutan untuk menghitung jumlah halaman yang diindeks, ini sangat tidak dapat diandalkan.
Setelah Anda mengidentifikasi halaman bernilai rendah yang akan di-deindex, ada baiknya Anda melakukan referensi silang URL dengan data Google Analytics untuk mengukur kemungkinan pengaruhnya terhadap sesi organik.
Biasanya, karena sifatnya, tidak akan ada dampak negatif, tetapi yang terbaik adalah memastikannya sebelum Anda melakukan deindexing dalam skala besar.
Cara Menghilangkan Deindeks Halaman dari Google
Ada banyak mekanisme yang bisa digunakan untuk mengeluarkan halaman yang tidak diinginkan dari indeks mesin pencari. Masing-masing memiliki kelebihan dan kekurangannya sendiri.
Tetapi sebagian besar metodologi deindeks memperbaiki indeks yang membengkak berdasarkan aturan untuk jenis halaman.
Hal ini membuatnya lebih mudah untuk diimplementasikan daripada strategi peningkatan konten lainnya yang mengandalkan pendekatan halaman per halaman, seperti penerbitan ulang konten.
- 410 Hilang atau 2. 404 Halaman Tidak Ditemukan
Cara cepat untuk menghilangkan indeks halaman adalah dengan server mengembalikan kode status HTTP 410 (alias, “Hilang”).
Hal ini menandakan kepada Google bahwa halaman tersebut sengaja dihapus, sehingga lebih jelas daripada kode 404 (alias, “Halaman tidak ditemukan”), yang akan menghasilkan deindeks yang sedikit lebih lambat.
Bagi siapa pun yang khawatir tentang mengumpulkan 4xx “kesalahan”, izinkan saya menenangkan pikiran Anda. Tidak ada penalti Google untuk kode 4xx. Tetapi jika URL tersebut memiliki sinyal peringkat, ini akan hilang.
Skor pencegahan indeks bloat: 1/5
Skor kontrol kerusakan indeks bloat: 4/5
- 301 Pengalihan
Jika index bloat disebabkan oleh banyak halaman yang menargetkan topik yang sama, Anda dapat menggabungkannya menjadi satu halaman dengan pengalihan 301 dan mengkonsolidasikan sinyal peringkat mereka.
Agar Google dapat melakukan deindeks pada halaman yang dialihkan, Google harus merayapi URL asli, melihat kode status 301, menambahkan URL tujuan ke antrean perayapan, lalu memproses konten untuk mengonfirmasi bahwa konten tersebut memiliki konten yang sama. Jika demikian, sinyal peringkat, tanpa pengenceran, akan diteruskan.
Ini bisa menjadi proses yang lambat jika URL tujuan memiliki prioritas rendah dalam antrean perayapan. Dan proses yang sangat lambat jika Anda memiliki rantai pengalihan.
Selain itu, jika Anda mengalihkan ke halaman yang tidak relevan, seperti beranda, Google akan memperlakukannya sebagai soft 404 dan tidak akan meneruskan sinyal peringkat. Dalam hal ini, 410 yang hilang akan mencapai hasil yang sama tetapi dengan deindeks yang lebih cepat.
Skor pencegahan indeks bloat: 1/5
Skor pengendalian kerusakan index bloat: 3/5
- Rel = Tautan Kanonik
Untuk URL konten duplikat, tautan rel=canonical menyarankan kepada Google URL duplikat mana yang akan diindeks.
Jika tag ini diterima, halaman alternatif (duplikat dengan nilai yang lebih rendah) akan dirayapi namun lebih jarang dan akan dikeluarkan dari indeks, meneruskan sinyal peringkat mereka ke kanonik (halaman yang lebih disukai untuk diindeks).
Namun untuk dapat diterima, konten harus sangat mirip dan kedua URL harus dirayapi dan diproses oleh Google, yang bisa jadi agak lambat.
Skor pencegahan indeks bloat: 4/5
Skor pengendalian kerusakan indeks bloat: 2/5
- Alat Parameter URL
Di dalam Google Search Console, Anda dapat menentukan bagaimana Googlebot menangani parameter.
Tiga kelemahan yang jelas dari alat parameter URL adalah:
Hanya berfungsi jika URL berbasis parameter.
Tidak menangani mesin pencari apa pun selain Google.
Alat ini dirancang hanya untuk mengontrol perayapan.
Meskipun tidak mengontrol pengindeksan secara langsung, jika Anda menentukan “No Crawl” pada sebuah parameter, John Mueller berkomentar bahwa URL tersebut pada akhirnya akan dihapus dari indeks.
Namun hal ini ada harganya, jika Googlebot tidak dapat merayapi, sinyal tidak dapat diproses, yang dapat memengaruhi peringkat, atau mengekstrak tautan internal untuk ditambahkan ke antrean perayapan, yang dapat memperlambat pengindeksan situs.
Skor pencegahan indeks bloat: 3/5
Skor kontrol kerusakan indeks bloat: 1/5